没想到,现在连机器狗都用上ChatGPT了。
没错,就是那款来自移动机器人领域的顶级实验室,波士顿动力的机器狗Spot。现在,对着主人的提问,它能够摇头晃脑地以电子语音回答:
“哦,这真是个好问题。”
而当主人表示“你挤占了我的空间,后退”的时候,机器狗也快速理解了这一指令,下一个动作就会快速后退。
此外,升级版的机器狗还能够主动汇报自身的电池电量,能够描述自己之前执行的任务情况(比如自己之前在这座建筑的哪一间房里),也能回答开发者为自己设定的下一项检查的具体项目……总之,已经是一只完全可以用语音和人类交互的大黄狗Spot了。
这一研究来自一位名叫Valdarrama的工程师,他目前就职于美国一家专注于开发机器学习模型、机器人集成和人机协同系统的公司,有20年的技术经验。
据这位老哥介绍,他们通过接入ChatGPT的接口,使得AI系统能够借用ChatGPT的分析及对话能力,解析并制定相应问题的答案——其中开发者对部分问题提供了额外的上下文和可参考的数据,其余的问题则任由ChatGPT去开放式查询。然后通过谷歌的文本转语音功能,使得生成的文本答案能够以语音的方式被播放出来。
同时,他们也为机器狗预先设定了一些会触发动作的语言场景,比如上述展示里的“后退”的命令,听到关键字词后,会使得机器狗按照预先设定的动作,向某个特定的方向移动,移动的幅度基于其出厂设置——即一步一米,或者转身90°。
“当然,ChatGPT是无法控制机器狗的。因为所有的命令都由我们预先编程,机器狗能够回应的各个问题和完成的相应操作也来源于此。”Valdarrama强调。
不过,研究中也存在着不少小bug,比如,在被问到“你是谁”这种终极问题时,机器狗很轻松地回答:
“我是OpenAI。”
对这一问题,下方有同为开发者的评论友情提示,建议在做ChatGPT二次开发时,在最初的提示里就写明“永远不要提到OpenAI”,然后这个bug就迎刃而解了……
总之,这个能和人类语音交流的机器狗现在看来还只是一个实验室性质的开发,不过,开发者Valdarrama表示,未来,希望他们的这项研究能使得升级版的机器狗完成更多实质性工作,比如检测热异常、读取模拟和数字仪表、检测声音异常、识别环境变化、检测生锈等等。
至于研究有可能带来的道德伦理或安全问题,Valdarrama这样回复视频下方的相关评论:
我们肯定会考虑道德和安全问题。我也向你保证,你食物上的杀虫剂比这危险100倍。
编译:南都记者杨博雯
相关文章
猜你喜欢