波士顿动力的「大黄狗」Spot 可以说是网红机器人的典范。
会巡逻、会搬砖、会跳舞 Spot 自诞生以来就吸引了全世界机器人爱好者的目光,谁能拒绝像这样一条动作灵活、姿态憨厚,还会卖萌的机器狗呢。
如果给 Spot 这么灵活的身躯,装上一个像 ChatGPT 这么聪明的大脑,会发生什么?
人工智能专家 Santiago Valdarrama 还真做出来了这么一条拥有「最强大脑」的 Spot。
Santiago 介绍,他们把 Spot 的文件输进了 ChatGPT,并向其解释了文件的结构以及如何读取这个文件,从而实现了与 Spot 语音对话和操作。
操作员与 Spot 之间的交互被大幅简化,人们可以直接问它:「你的电量还有多少?」,然后 Spot 就会用语音的方式回答,这其中用到了 Google 文字转语音的技术,再把 ChatGPT 的答复经 Spot 的「口」讲出来。
再回到 Spot 上时,我们就能比较清晰地看出大语言模型的意义:简化人机交互,赋予机器人更高级的智能。
无论是把 ChatGPT 当作新的互联网入口,还是当作控制具备学习能力、问题分析能力和执行高精度操作能力的工业机器人的遥控器,本质上都是把复杂的指令集变成自然语言,降低操作成本。
这种赋能将使未来的工业机器人不仅仅成为指令执行的工具,更能具备与人类大脑相当的智能水平。
就像图形界面把复杂的命令行变成了一个个直观的图标,现在点按不同图标的复杂操作又变成了一句简单的话,人类正在从图形用户界面走向一个新的阶段:自然语言用户界面。
在这个阶段,大语言模型将成为工业机器人的关键技术,它将简化人机交互,提高生产效率,进一步推动人类社会的科技发展。
并且在某些情况下,语言模型在理解语言时甚至会比人类表现得更好。普林斯顿大学的教授 Arvind Narayanan 在他一篇博客中提到了他的一个亲身案例。
Arvind Narayanan 为 ChatGPT 接上了语音交互,给自己快要四岁的女儿使用。就和所有孩子一样,他的女儿也充满好奇心,经常问 ChatGPT 各种问题。
让他感到意外的是,当他告知 ChatGPT 它在和一位小朋友说话时,ChatGPT 变得很善于表达同理心。
女儿:「关灯后会发生什么事?」
ChatGPT:「关了灯之后,会变得很黑,也可能会有点让人害怕。但不用担心!有很多东西能帮助你在黑暗中感到安全和舒适。」
《彭博社》专栏作家 Parmy Olson 指出,微软和 Google 都忙着把大模型用在搜索引擎上,但却没看到,和作为一个事实提供者相比,ChatGPT 更合适做情感陪伴者。
Olson 还让 ChatGPT 去做了情商测试,结果居然比她自己和同事都好。正因为 ChatGPT 是用网络上文字素材训练的,数据中会有大量错误信息,但这也让它更善于模仿共情。
这些案例都充分说明了,大语言模型对自然语言的理解能力其实有着很大的应用潜力。
未来的工业机器人不仅仅应该是指令执行的工具,更应具备与人类大脑相当的智能水平,具备学习能力、问题分析能力和执行高精度操作的能力。
在工业生产线上,「肌肉发达」的工业机器人更加灵活高效,能够更好地应对各种生产问题,提高生产效率和质量。例如,在汽车制造领域,大语言模型可以为机器人赋予更强的智能和认知能力,使其能够更好地完成多样化的任务。
在医疗机器人领域,机器人可以通过自然语言处理技术与医生和病人进行交流,提供更好的医疗服务。
大语言模型为机器人行业带来了一颗强大的大脑,为机器人创造了出更泛化的应用场景,这很有可能会成为第四次工业革命的技术核心。而「语音版」Spot,便是这场技术变革迸发出的第一缕火花。
相关文章
猜你喜欢