西风 发自 凹非寺
量子位 | 公众号 QbitAI
微软最新研究再次证明提示工程的威力——
无需额外微调,无需专家策划,仅凭提示,GPT-4就能化身“专家”。
有网友表示早就有这种预感,现在能看到结果出来,真的是“so cool”:
还有网友表示这真的很“激进”:
GPT-4是一项能改变行业的技术,而我们还远没有触及提示的极限,也未达到微调极限。
下面我们来一一介绍。
其中自动生成思维链步骤对性能提升的贡献最大。
而且GPT-4自动生成的思维链比Med-PaLM 2中专家策划的得分更高:
最后,研究人员还探索了Medprompt的跨域泛化能力,取用了MMLU基准中的六个不同的数据集,涵盖了电气工程、机器学习、哲学、专业会计、专业法律和专业心理学的问题。
还添加了另外两个包含NCLEX(美国护士执照考试)问题的数据集。
结果显示,Medprompt在这些数据集上的效果与在MultiMedQA医学数据集上的提升幅度相近,平均准确率提高了7.3%。
论文链接:https://arxiv.org/pdf/2311.16452.pdf
参考链接:[1]https://twitter.com/erichorvitz/status/1729854235443884385[2]https://twitter.com/emollick/status/1729733749657473327
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
猜你喜欢