> 自媒体 > (AI)人工智能 > 在「机器人领域」使用ChatGPT提高生产力
在「机器人领域」使用ChatGPT提高生产力
来源:将门创投
2023-04-06 12:56:58
634
管理
最近几个月,ChatGPT 大火,它是OpenAI于去年11月底推出的人工智能聊天机器人程序,已经成为了历史上增长最快的消费者应用程序 [1]。毫无疑问,ChatGPT受到了各个行业的广泛关注。

其中在机器人领域,微软于今年2月20日发布了"ChatGPT for Robotics

"的技术报告 [2],为如何将ChatGPT 融入机器人领域提供了一种可能的视角。与纯文本的应用不同,机器人系统需要对现实世界的物理、环境背景和物理动作的执行能力有深入的了解。而且所生成机器人模型需要具备相当的常识性知识和符合实际的物理模型,以及与用户交互以解释和执行实际现实中可行的命令。下面笔者将根据这份报告,

解读怎样在机器人领域使用ChatGPT 来提升生产力。

一、Pipeline 设计流程

1. 整体流程

ChatGPT 本质上是一个语言模型,采用对话的形式,根据用户的指令做出相应的回应。从最基本的语言回应,到代码生成与debug,再到情景角色扮演,这些应用的一个核心关键就是用户提示词的撰写(prompt),用户需要通过准确详细的提示词告诉ChatGPT应该做什么,然后让ChatGPT 去执行。为此,

1.首先需要手工设计一系列的机器人功能库函数来实现底层执行器的命令,如,移动,停止,获得目标的位置信息等等。

2.第二步是给ChatGPT 写一个提示词,用来描述需要让ChatGPT 执行的目标。

3.第三步是使用者评估ChatGPT 生成的代码,并且给ChatGPT 提供反馈,让ChatGPT 进行下一步改进。

4.通过提供反馈,将代码进行不断迭代改进,当用户测试通过之后,就可以部署到实际的系统中了。

流程图如下:

图 1 利用ChatGPT 进行机器人顶层算法设计 [2]

2. 关于Prompt 的注意事项

如果想要让ChatGPT 更容易理解用户的意思,产生更准确的回应,那么用户所给出的提示词就需要清晰明了:描述中除了要包含让ChatGPT调用的底层机器人功能库函数之外,还要考虑以下几点内容:

1. 具体的任务要求和约束条件:举个例子比如说想要让机器人移动物体,那么prompt 里面首先要介绍相关信息告诉ChatGPT,比如物体的位置、尺寸等等。

2. 对环境的描述:提示词中需要描述清楚这个任务是在什么环境下进行的。举个例子来说,比如目标任务是在迷宫中导航,那么就需要介绍迷宫的尺寸和形状,以及里面存在的障碍物等信息。

3. 目前的状态信息:需要告诉ChatGPT 机器人系统目前的它的状态信息,比如位置、朝向等等。

4. 目标:比如任务是组装一个拼图,那就需要告诉ChatGPT 需要拼接的零件数目以及期望的完成时间。

5. 解决方案的样例:当任务比较复杂的时候,比如需要ChatGPT 与使用者进行交互的时候,可以通过给一些例子来描述这个过程。见下图。作者向ChatGPT提供了一个机器人何时向人类询问以获取进一步指令的例子。

图 2 提供范例告诉ChatGPT如何以及何时与用户进行交互以寻求帮助 [2]

6. 提示词的设计原则:可参考:https://learningprompt.wiki,该网站指出了设计提示词的所有技巧和原则。也可以参考https://promptperfect.jina.ai/,该网站能够自动优化所使用的提示词,从而让ChatGPT提供期望的高质量结果。

二、潜在应用前景

在设计完成Pipeline 之后,就可以把目光转到ChatGPT的具体机器人应用上来:如仿真环境下无人机的任务规划和避障,现实世界的空中无人机感知和操纵部署等等。

值得注意的是,在微软的文章中 [2],除了展示ChatGPT 的强大能力之外,也强调了ChatGPT的局限性:不应忽视实际的部署安全性问题,尤其是在实际物理系统机器人部署的情况下。在 ChatGPT有可能产生意外行为的情况下,必须有人在循环中进行监控和干预。此外,在将模型部署到现实世界之前,使用模拟器进行仿真有助于更好地评估模型的性能。文中强调,将 ChatGPT 用于机器人技术并不是完全自动化的过程,而是充当增强人类能力的工具。

本文中主要把应用场景分成了三类:零样本任务规划、通过人在回路的反馈交互来完成复杂任务、包含感知层的任务执行。笔者将针对这三种情况进行一一介绍。

1. 零样本任务规划

(1)在AirSim 环境下的工业巡检

在该情境下,即使是让非专业的使用者通过ChatGPT 也能够控制无人机完成工业巡检任务目标。

ChatGPT 能够理解用户的意图并且能够精准控制无人机完成任务。视频见https://www.youtube.com/watch?v=38lA3U2J43w

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。

社区上线480 期talk视频,2400 篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

chenhongyuan@thejiangmen.com

或添加工作人员微信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

>>> 添加小编微信!

关于我“门”

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,

欢迎发送或者推荐项目给我“门”:

⤵一键送你进入TechBeat快乐星球

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
王牌竞速:OpenAI的GPT-4被超了
21世纪经济报道记者孔海丽、实习生张奕丹 北京报道这场世人瞩目的国际竞..
全球首个开源GPT-4出世!Llama 3震撼发布,Meta AI免登录可用..
编辑:编辑部【新智元导读】蛰伏许久,Meta刚刚扔出了重磅炸弹:大家期待..
讯飞星火大模型V4.0体验:全面进化,体验不输GPT-4o
在 6 月 27 日举办的讯飞星火 V4.0 发布会上,科大讯飞发布了讯飞星火大..
芝大论文证明GPT-4选股准确率高达60%,人类股票分析师要下岗?..
编辑:编辑部【新智元导读】GPT-4在为人类选股时,表现竟然超越了大部分..
大模型开车哪家强?普渡研究给指南:GPT-4真行啊
白交 发自 凹非寺量子位 | 公众号 QbitAI现在一句口令,就能指挥汽车了。..
谷歌:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了..
编辑:Aeneas 好困【新智元导读】刚刚,谷歌DeepMind、JHU、牛津等发布研..
潞晨尤洋:视频生成的GPT-4时刻,3年后可以见证 | MEET 2025..
编辑部 发自 凹非寺量子位 | 公众号 QbitAI奥特曼说,Sora代表了视频生成..
通义千问GPT-4级主力模型降价97%,1块钱200万tokens
5月21日,阿里云方面宣布,通义千问GPT-4级主力模型Qwen-Long,API输入价..
一夜封神!Llama 3.1大模型震撼发布,真正的全民GPT-4时代来了..
Meta更新了许可证,允许开发人员首次使用包括405B参数规模的Llama模型的..
关于作者
吴月(普通会员)
文章
873
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40386 企业收录2981 印章生成229730 电子证书1009 电子名片58 自媒体46281

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索