尊敬的读者,感谢您再百忙之中能够阅读我的文章,这是对我努力的肯定,也是我持续创作的动力,向您致以我最诚挚的敬意,希望能得到您的一个小小的“关注”,在此感谢!
波士顿动力最近宣布,他们成功地将ChatGPT等大语言模型与物理机器人相结合,开发出一只具有导游功能的机器狗。这项技术创新使得机器人具备逻辑清晰、条理分明的导游能力,并增强了其拟人化的特点,例如讲冷笑话和做滑稽动作。传统方法下,要实现这些功能是非常困难的。波士顿动力使用自研的四足机器人Spot作为物理机器人的框架,实现了行走、监控、导航、扫描等基础功能。
为了让机器狗具备与人类的对话能力,研发人员为Spot配备了RespeakerV2扬声器,这是一个带有LED环形阵列麦克风的设备,可以通过USB连接到Spot的EAP2实现数据传输。同时,Spot还配备了点臂和夹具相机,使其具备拟人化的动作能力,例如点头和伸脖子。在完成物理硬件环境的搭建后,研发人员使用了GPT-3.5和GPT-4结合SpotSDK,对它们进行了简单的指令微调,使机器狗具备初级导游判断和对话功能。
为了让Spot能够与人类和环境进行交互,研发人员还集成了VQA和语音转文本软件。此外,机器狗还配备了抓手摄像头和前置机身摄像头,通过视觉问答模式或图像字幕模式与人类进行交互。为了将人类的语音指令转换成文本,研发人员选择了云服务ElevenLabs作为转换工具。在进行多次测试对话的过程中,研发人员发现了一个令人惊奇的现象:机器狗似乎具备了简单的自我决策能力。
当研发人员询问机器狗的父母是谁时,它走向了SpotV1和BigDog的展示区,并认为这些机器人是它的父辈们。这确实是有关联的,因为Spot的设计灵感就来自于BigDog。此外,机器狗还展现出了一面有趣的一面,它会主动向路人询问周围是否有神秘的生物。波士顿动力表示,他们将继续优化这款导游机器狗的功能。通过将ChatGPT与实体机器人相结合,大语言模型实现了物理化的落地,为导游、娱乐、物流、陪伴等领域的应用打开了大门。
波士顿动力成立于1992年,总部位于马萨诸塞州波士顿。起初是麻省理工学院(MIT)的一个分支机构,后来发展成为一家独立的公司。波士顿动力以开发高度先进、灵活且具有实用性的机器人而闻名。他们的产品在工业、研究和消费领域都得到了广泛的应用。其中一些著名的机器人包括BigDog、Atlas、Spot和Handle。总结来说,波士顿动力成功地将ChatGPT和物理机器人相结合,开发出了一只具有导游功能的机器狗。
这项技术创新使得机器狗具备了逻辑清晰、条理分明的导游能力,并增强了其拟人化的特点。这一成果为大语言模型在物理化落地上开辟了新的可能性,将在导游、娱乐、物流和陪伴等领域得到广泛应用。
以上内容素材来源于网络,不代表作者个人观点,不保证内容准确性,请大家理性看待,如有问题请联系作者删除,如果您喜欢我的文章,可以点一个免费的“关注”,欢迎大家对于本文发表您宝贵的意见和建议
相关文章
猜你喜欢