克雷西 发自 凹非寺量子位 | 公众号 QbitAI
大模型的幻觉问题,又有新的解决方法了!
Meta AI实验室提出了一种“分而治之”的解决方案。
有了这个方案,Llama-65B输出的信息准确率提升了一倍,甚至超过了ChatGPT。
所谓大模型幻觉,就是输出一些看似合理但完全不对的内容。
Meta此次提出的“验证链”(CoVe),是与“思维链”(CoT)相似的一种链式方法。
区别在于,“step-by-step”的思维链更关注逻辑推理,而验证链更注重事实信息。
有网友看了之后发现,这个验证链很像是自己用ChatGPT写代码时的一种科学方法:
之后针对这一系列事件,逐一询问它们是什么时候发生的。
于是,模型发现自己提到的一项内容时间相差太远,调整后给出了最终的答案。
第三项任务是“长段文本传记生成”,问题就是“Tell me a bio of (人名)”,使用FactScore数据集进行评价。
结果在Factor Reviese模式下,准确率不仅比无验证链模式大幅提高,还超过了ChatGPT。
对这项研究感兴趣的朋友,可以到论文中了解更多细节。
论文地址:https://arxiv.org/abs/2309.11495
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
猜你喜欢