> 自媒体 > (AI)人工智能 > GPT-4玩《我的世界》15倍速攀科技,不看画面全靠代码操作
GPT-4玩《我的世界》15倍速攀科技,不看画面全靠代码操作
来源:量子位
2023-06-01 16:02:00
610
管理

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

把GPT-4放进一个虚拟世界会怎么样?比如《我的世界》。

英伟达开发最新方法Voyager,在游戏中点亮科技树的速度是此前方法的15.3倍,同时获得的独特物品是此前的3.3倍,探索范围是2.3倍。

更关键的是,Voyager目前完全借助游戏画面推理,一切操作与反馈通过文本和游戏的Javascript API进行。

被其他AI玩家视为噩梦的挖钻石也不在话下。

深度广度双双提升

团队将Voyager的表现与ReAct、Reflexion和AutoGPT进行了对比。

在地图探索距离上,Voyager达到了其他AI玩家的2.3倍。

如果有人工的帮助,给予评价或指导,Voyager还能构造建筑。

之所以需要人工,是因为在研发Voyager时GPT-4还不具备视觉能力。

如何实现

Voyager主要由三部分组成,即自动任务生成系统、技能库和迭代提示机制。

顾名思义,自动任务生成器负责根据宏观目标生成具体任务及操作游戏的代码并进行优化。Voyager使用的是一个流行的Javascript Minecraft 操作库 (Mineflayer)。

GPT-4根据Voyager发送的提示生成代码调用这个操作库,并根据JS运行情况和游戏反馈对代码中的错误进行修正。

Voyager发送给GPT的提示中主要包含四部分内容:

一是鼓励GPT尝试多种方式,同时又加以限制的总方针。二是目前的状态,包括生命和饥饿值、持有物、位置和周围环境等。三是之前成功和失败的操作,反映目前的工作进展。四是额外信息,让GPT-3.5根据前述状态提问并调用知识库自答,将过程传给GPT-4。

说完了任务生成器,再看看Voyager的技能库。

通过让GPT-3.5(成本考虑)对生成的代码进行注释,并纳入技能库同时建立索引。

操作时则先用GPT-3.5生成操作说明,调用数据库中最匹配的五个。

然后,GPT-4将决定是调用数据库中的已有技能还是重新生成代码。

这一过程给GPT的提示则由五部分组成:

一是代码生成的指导,如“你生成的代码将被反复使用”。二是控制API及相关技能。三是上一步中生成的代码,以及对应的运行状况和反馈。四是当前的状态,具体内容和代码生成器部分相同。五是利用思维链方式,让GPT生成代码前进行推理。

最后再来看看Voyager的迭代提示机制,这一机制用于Voyager的自我提升。

这一机制会收集环境反馈、运行错误等信息。

同时结合对任务成功与否的自我检测,对自身进行优化。

下图就展示了自我检测的几个实例。

消融测试结果显示,缺少这一环节会导致Voyager运行质量的显著下降。

论文地址:https://arxiv.org/abs/2305.16291项目主页:https://voyager.minedojo.orgGitHub页面:https://github.com/MineDojo/Voyager参考链接:[1]https://twitter.com/DrJimFan/status/1662115266933972993[2]https://m.weibo.cn/status/4905873598054632

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
帝王之星(普通会员)
文章
645
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216707 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索