> 自媒体 > (AI)人工智能 > 动嘴操控“终结者”!谷歌打造最强chatgpt机器人
动嘴操控“终结者”!谷歌打造最强chatgpt机器人
来源:AI研习所
2023-08-04 14:29:17
390
管理

我们知道,在掌握了网络中的语言和图像之后,大模型终究要走进现实世界,「具身智能」应该是下一步发展的方向。把大模型接入机器人,用简单的自然语言代替复杂指令形成具体行动规划,且无需额外数据和训练,这个愿景看起来很美好,但似乎也有些遥远。毕竟机器人领域,难是出了名的。然而 AI 的进化速度比我们想象得还要快。

  上周五,谷歌 DeepMind 宣布推出 RT-2:全球第一个控制机器人的视觉 - 语言 - 动作(VLA)模型。现在不再用复杂指令,机器人也能直接像 ChatGPT 一样操纵了。给机器人发命令,从没这么简单过。

  RT-2 到达了怎样的智能化程度?

加载了RT-2多任务模型的机械臂可以直接听从人类的语言指令做出反应。比如命令它“捡起已灭绝的动物”,机械臂就能从狮子、鲸鱼、恐龙这三个塑料玩具中准确选择恐龙; 跟机器人说,把可乐罐给泰勒・斯威夫特:  

实验

  研究人员对 RT-2 模型进行了一系列定性和定量实验。

  下图展示了 RT-2 在语义理解和基本推理方面的性能。例如,对于「把草莓放进正确的碗里」这一项任务,RT-2 不仅需要对草莓和碗进行表征理解,还需要在场景上下文中进行推理,以知道草莓应该与相似的水果放在一起。而对于「拾起即将从桌子上掉下来的袋子」这一任务,RT-2 需要理解袋子的物理属性,以消除两个袋子之间的歧义并识别处于不稳定位置的物体。需要说明的是,所有这些场景中测试的交互过程在机器人数据中从未见过。

  一系列结果表明,视觉 - 语言模型(VLM)是可以转化为强大的视觉 - 语言 - 动作(VLA)模型的,通过将 VLM 预训练与机器人数据相结合,可以直接控制机器人。

  和 ChatGPT 类似,这样的能力如果大规模应用起来,世界会发生重大改变。它可能真正开启了在有人环境下使用机器人的大门,所有需要体力劳动的岗位都会被替代。或许,机器人总动员中,那个聪明的瓦力离我们不远了。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
前沿追踪|由ChatGPT引发的十个知识点(上)
4月中旬,与香港国际创科展和数字经济论坛同期举办的,还有一场名为“Web..
项立刚:ChatGPT就是聊天机器人,没鸟用!周鸿祎:美国都在赌AI~..
最近,著名科技媒体人项立刚与BATJ四大互联网巨头之一的360董事长兼CEO周..
OpenAI Ilya,师从Hinton,为了他,马斯克与谷歌创始人彻底决裂..
编辑:润 alan【新智元导读】OpenAI宫斗大戏迎来终局,Altman和Brockman..
ChatGPT问世不到半年,这个行业就已被AI化了
机器之心报道机器之心编辑部用 AI 大模型「重做所有产品」。意义重大,这..
这一届聊天机器人能“以假乱真”?AI圈现象级产品ChatGPT揭秘..
即使多年过去,很多股民都还记得那只叫“阿尔法狗”AI选手,当它以绝对的..
阿里版ChatGPT“通义千问”邀请测试,我们第一时间试了试..
机器之心报道机器之心编辑部ChatGPT 赛道,真正的竞逐开始了。没有一点点..
ChatGPT之父:目前OpenAI不会上市
澎湃新闻记者 李潇潇 综合报道OpenAI联合创始人公开谈论公司上市、AI发展..
揭秘二手平台上的交易骗局:已拍下≠已付款
一手交钱,一手交货,是从古至今通行的公平交易原则。在平台经济时代,平..
ChatAI+小红薯实现爆文量产@速学
GPT热度不减,证明它并非昙花一现的泡沫,如今各个行业都在如火如荼想办..
关于作者
卿嫣(普通会员)
文章
581
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索