> 自媒体 > (AI)人工智能 > GPT-4写代码能力提升21%!MIT新方法让LLM学会反思
GPT-4写代码能力提升21%!MIT新方法让LLM学会反思
来源:量子位
2023-05-01 18:36:03
490
管理

Pine 发自 凹非寺

量子位 | 公众号 QbitAI

GPT-4再度进化!

加上一个简单方法,就能让GPT-4这类大语言模型学会自我反思,性能直接提升30%。

这是美国东北大学联合MIT发表的最新论文中的方法:Reflexion。

不仅适用于GPT-4,也适用于其他大语言模型,让它们学会人类特有的反思能力。

目前该论文已经发表在预印平台arxiv上。

在这个反馈过程中,又可以分为三大步:

1、评估:测试当前生成答案的准确性2、自我反省的产生:错误识别——实现修正3、执行一个迭代反馈循环

在第一步评估的过程中,首先要经历的是LLM(大语言模型)的自我评估。

也就是说LLM在还没有外部反馈时,首先要自己对答案进行反思。

那如何进行自我反思?

研究团队使用了一个二元奖励机制,为LLM在当前状态下执行的操作赋值:

1代表生成的结果OK,0则表示生成的结果不太行。

而之所以采用二元而非多值或连续输出这类更具描述性的奖励机制,原因和没有外部输入有关。

要在没有外部反馈的条件下进行自我反思,必须将答案限制在二元状态下,只有这样,才能迫使LLM做出有意义的推断。

在自我评估结束之后,如果二元奖励机制输出为1,则不启动自我反思装置,若为0,LLM则会开启反思模式。

在反思的过程中,模型会触发一个启发性函数h(如下),类比人类思考过程,h起到的作用就像是监督一样。

关于GPT-4已经会“思考”了,你怎(huang)么(le)看(ma)?

论文地址:https://arxiv.org/abs/2303.11366参考链接:[1] https://nanothoughts.substack.com/p/reflecting-on-reflexion[2] https://www.reddit.com/r/MachineLearning/comments/1215dbl/r_reflexion_an_autonomous_agent_with_dynamic/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

2
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
试驾东风奕派eπ008增程:将新能源大6座“卷入”20万元..
毫无疑问,以理想L8、问界M7等为代表的中大型6座SUV,是当下新能源市场中..
五个维度分析阿维塔、星途、理想、智界影响力
在成长速度较快的自主品牌新能源阵营中,理想、智界、星途和阿维塔是比较..
刘艳钊:“三件套”传递出长城汽车对造车事业最纯粹的无限热爱..
封面新闻记者 李继龙6月1日,2024粤港澳大湾区车展暨中国新能源汽车科技..
有重要变化!买小米汽车的注意!
每经编辑:黄胜6月2日,小米汽车发文称,小米SU7即将进入新一轮的交付提..
为什么奥迪Q8卖不动?不妨看看它都干了哪些蠢事吧
大家好!欢迎收看本期的汽车报告。说到Q8这款车,相信对奥迪这个汽车品牌..
雷克萨斯全新ES最新消息!全面“停售燃油版”车型
日前爱卡汽车获取了雷克萨斯全新一代ES车型最新消息,新车最快将于今年年..
理想汽车:L6产能持续爬坡 交付周期将进一步缩短
【智车派新闻】6月3日,理想汽车官方发布全新理想L6答网友热门问题(第八..
9.98万的秦L,优点不只是省油!
哈喽大家好!上市前网上很多人呼吁秦L起步9.98万,但大多数人(包括我)..
今日热搜|汽车以旧换新,超百亿补贴来了→
·#外交部回应菲总统涉南海问题表态#·#国安机关破获一起英国MI6重大..
关于作者
司机(普通会员)
文章
843
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40384 企业收录2981 印章生成228231 电子证书1002 电子名片58 自媒体44075

@2022 All Rights Reserved 浙ICP备19035174号-7
2
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索