GPT-4写代码能力提升21%！MIT新方法让LLM学会反思-脚本导航

> 自媒体 > （AI）人工智能 > GPT-4写代码能力提升21%！MIT新方法让LLM学会反思

GPT-4写代码能力提升21%！MIT新方法让LLM学会反思

来源：量子位

2023-05-01 18:36:03

490

管理

Pine 发自凹非寺

量子位 | 公众号 QbitAI

GPT-4再度进化！

加上一个简单方法，就能让GPT-4这类大语言模型学会自我反思，性能直接提升30%。

这是美国东北大学联合MIT发表的最新论文中的方法：Reflexion。

不仅适用于GPT-4，也适用于其他大语言模型，让它们学会人类特有的反思能力。

目前该论文已经发表在预印平台arxiv上。

在这个反馈过程中，又可以分为三大步：

1、评估：测试当前生成答案的准确性2、自我反省的产生：错误识别——实现修正3、执行一个迭代反馈循环

在第一步评估的过程中，首先要经历的是LLM（大语言模型）的自我评估。

也就是说LLM在还没有外部反馈时，首先要自己对答案进行反思。

那如何进行自我反思？

研究团队使用了一个二元奖励机制，为LLM在当前状态下执行的操作赋值：

1代表生成的结果OK，0则表示生成的结果不太行。

而之所以采用二元而非多值或连续输出这类更具描述性的奖励机制，原因和没有外部输入有关。

要在没有外部反馈的条件下进行自我反思，必须将答案限制在二元状态下，只有这样，才能迫使LLM做出有意义的推断。

在自我评估结束之后，如果二元奖励机制输出为1，则不启动自我反思装置，若为0，LLM则会开启反思模式。

在反思的过程中，模型会触发一个启发性函数h（如下），类比人类思考过程，h起到的作用就像是监督一样。

关于GPT-4已经会“思考”了，你怎（huang）么（le）看（ma）？

论文地址：https://arxiv.org/abs/2303.11366参考链接：[1] https://nanothoughts.substack.com/p/reflecting-on-reflexion[2] https://www.reddit.com/r/MachineLearning/comments/1215dbl/r_reflexion_an_autonomous_agent_with_dynamic/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

2

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

2023-05-01 18:37

考试中击败90%人类的GPT-4来了，人类距离 “AI奇点”还有多远？

2023-05-01 18:35

相关文章

试驾东风奕派eπ008增程：将新能源大6座“卷入”20万元..

毫无疑问，以理想L8、问界M7等为代表的中大型6座SUV，是当下新能源市场中..

五个维度分析阿维塔、星途、理想、智界影响力

在成长速度较快的自主品牌新能源阵营中，理想、智界、星途和阿维塔是比较..

刘艳钊：“三件套”传递出长城汽车对造车事业最纯粹的无限热爱..

封面新闻记者李继龙6月1日，2024粤港澳大湾区车展暨中国新能源汽车科技..

有重要变化！买小米汽车的注意！

每经编辑：黄胜6月2日，小米汽车发文称，小米SU7即将进入新一轮的交付提..

为什么奥迪Q8卖不动？不妨看看它都干了哪些蠢事吧

大家好！欢迎收看本期的汽车报告。说到Q8这款车，相信对奥迪这个汽车品牌..

雷克萨斯全新ES最新消息！全面“停售燃油版”车型

日前爱卡汽车获取了雷克萨斯全新一代ES车型最新消息，新车最快将于今年年..

理想汽车：L6产能持续爬坡交付周期将进一步缩短

【智车派新闻】6月3日，理想汽车官方发布全新理想L6答网友热门问题（第八..

9.98万的秦L，优点不只是省油！

哈喽大家好！上市前网上很多人呼吁秦L起步9.98万，但大多数人（包括我）..

今日热搜｜汽车以旧换新，超百亿补贴来了→

·＃外交部回应菲总统涉南海问题表态＃·＃国安机关破获一起英国MI6重大..

关于作者

司机(普通会员)

文章

843

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

05

介绍一个能够免费使用国内chatgpt的插件wetab

2023/04/27

标签云

成员 网址收录40384 企业收录2981 印章生成228231 电子证书1002 电子名片58 自媒体44075

@2022 All Rights Reserved

浙ICP备19035174号-7

2

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索