合作不到一年,人形机器人独角兽Figure AI创始人兼首席执行官 Brett Adcock 就于日前在 X 上发文,宣布终止与OpenAl的合作协议,并表示:“Figure在完全自主研发的端到端机器人AI方面取得重大突破,我们很高兴在接下来的30天内向你展示一些从未在人形机器人上见过的东西。”
2024年2月底,估值达到26亿美元的Figure AI宣布与OpenAI合作开发面向人形机器人的下一代AI模型,OpenAI将结合自身研究与Figure AI在机器人软硬件方面的深入理解,帮助Figure AI的人形机器人提升处理和推理语言的能力。
然而在1月31日,OpenAI向美国专利商标局(USPTO)提交了一份涉及人形机器人的商标申请。而在去年11月,OpenAI还被曝正在重建曾在2020年解散的机器人团队。因此二者合作的破裂并不难理解。
OpenAI的“拧巴”
作为一家AI研究和部署公司,OpenAI对具身智能也保持着高度关注,除了与Figure AI的合作,还投资了具身智能初创企业1X和Physical Intelligence。
据了解,1X是一家总部位于挪威的实体机器人公司,主要应用于家庭场景,1X最新一代NEO产品已在欧洲和美国进行落地验证,相比早期EVE版本的轮足机器人,NEO双足人形机器人产品完成度更高。通过结合OpenAI的多模态大模型,让其在复杂的家庭场景下,具备了一定的泛化操作能力。
而Physical Intelligence则专注于研发能够驱动多功能机器人的人工智能(AI)模型和算法,致力于在实体世界中实现类似于ChatGPT在数字世界中所做到的变革。通过结合先进的AI技术和机器人硬件,Physical Intelligence旨在创造出能够自主学习、适应各种环境并执行复杂任务的智能机器人。
此前,有分析人士对此表示了担忧,一方面,硬件制造与软件开发之间存在明显差异,如何有效整合软硬件资源,实现技术上的无缝对接,是OpenAI需要面对的重要挑战;另一方面,OpenAI即是投资者,又是参与者,未来如何定位自己是一个需要思考的问题。如果进军人形机器人本体研发,那么OpenAI与合作伙伴之间将处于既竞争又合作的矛盾关系。
具身智能究竟需要怎样的大模型
斯坦福大学计算机科学教授李飞飞曾指出,具身智能是 AI 领域的下一个“北极星问题”之一,它能够在虚拟世界中探测和改变自身环境,与周围环境交互,学习复杂的类人任务。
而具身智能的实现,核心就在于大模型。此前,惊艳亮相的Figure 02,其语音交互能力是基于OpenAI为其定制的大模型实现的。合作骤然破裂,必然有迹可循。
据TechCrunch报道,Figure AI创始人兼首席执行官 Brett Adcock表示,合作的关键问题在于整合。OpenAI是一家规模庞大的公司,拥有庞大的业务范围和相应的智能模型。将人工智能嵌入机器人等实体的具身智能并非这家ChatGPT制造商的关注重点。Adcock认为,正确的解决方案是建立一个端到端的人工智能模型,为特定硬件提供动力。“我们发现,要在现实世界中大规模解决具身智能,必须垂直整合机器人AI。”Adcock表示,“我们不能外包人工智能,就像我们不能外包硬件一样。”
据了解,实现具身智能有两种路径,一种是分层决策,另一种是端到端的神经网络系统。Figure AI在与OpenAI合作时采用的是前者,通过不同的神经网络协作,去提高系统的灵活性和实时响应能力。
而端到端架构则通过单一神经网络,将输入任务直接映射为控制信号,形成从输入到输出的无缝连接。但这种模式需要通过海量数据驱动。
2024年6月,智元机器人决定研发机器人具身智能大模型。为了提升机器人的泛化能力,并适应复杂的环境,智元机器人创始人彭志辉曾预计在2024年下半年智元会有百台以上自由部署机器人专门用来做端到端的数据采集,同时,AIDEA平台也计划在同年第四季度对外上线。
乐聚机器人董事长冷晓琨告诉动点科技记者:“分层决策和端到端模型在具身智能的实现中各有优势,未来可能会呈现融合发展的趋势。理想情况下,合理的分层决策模型应该更加节能高效。就跟人一样,大脑不应该将算力浪费在计算低层级的运动控制反馈或肌肉关节层面的运动跟踪上。算力消耗等同于能源,因此避免不必要的计算十分关键。大家担心的是,不恰当的分层解耦可能会在信息传输过程中造成限制,导致模型泛化能力不足。但这只是分层设计缺陷的问题,所以目前我们还不会去做直接的端到端。”
相关文章
猜你喜欢
成员 网址收录40386 企业收录2981 印章生成229907 电子证书1011 电子名片58 自媒体46660