晓查 发自 凹非寺
量子位 | 公众号 QbitAI
如何用几句话向6岁儿童解释登月?
GPT-3给出的答案实在离谱:
向孩子解释引力理论、相对论、大爆炸、进化论……
而且人类实际感受中也给InstructGPT打分更高。
但OpenAI表示InstructGPT仍有许多要改进的地方,比如接受的都是英语的训练,因此偏向于英语文化价值观,给语句标注的人的偏好,也会影响GPT-3的“价值观”。
总之,纠正GPT-3的三观,还有很长的路要走。
参考链接:[1]https://openai.com/blog/instruction-following/[2]https://github.com/openai/following-instructions-human-feedback[3]https://cdn.openai.com/papers/Training_language_models_to_follow_instructions_with_human_feedback.pdf
相关文章
猜你喜欢