微软和UIUC联合提出了一种名为 Solo Performance Prompting (SPP) 的方法,激发大语言模型认知协同的能力,召唤出多个人格并进行多轮自我协作。SPP 显著降低了知识密集型任务中事实性错误和幻觉(Hallucination)的出现频率同时保持了超越Chain-of-Thought的推理能力。
从在三个不同任务上LLM自主识别的人格云图可以发现LLM召唤出的人格与任务强相关。在知识密集型任务(Trivia Creative Writing)上,所识别的人格更多样且具体;而在推理密集型任务上(Logic Grid Puzzle),所识别的人格更为同质化。
作者还展示了LLM动态去识别细粒度的人格(SPP)比有用户事先设置固定的通用的人格 (SPP-Fixed-Persona)能更有效提高问题解决能力。
图中的例子里展现:细粒度的人设例如“Film Expert”和“Sports Enthusiast”可以给出正确的信息,而固定的通用人设“Expert”则会失败。
总结
在不借助任何额外外部资源的情况下,Solo Performance Prompting (SPP)通过释放GPT4中的认知协同能力,在大幅减少Hallucination的同时提升了推理能力,完成了原生GPT4所无法完成的任务。SPP有望成为新的大模型inference的范式,同时为基于LLM的多智能体社群研究提供了诸多启发。
相关文章
猜你喜欢