与此同时,Sam Altman 带着 GPT 进化,连续推动发布性能更强的 GPT 版本。
可以看到,两个工作团队即使不存在分歧,至少也存在张力,裂缝可能从这里开始产生。
Ilya Sutskever 指责 Sam Altman 在与董事会的沟通中始终不坦诚,阻碍了董事会履行职责的能力。而董事会的职责是确保 OpenAI 作为一家非营利组织能够开发造福全人类的「通用人工智能 AGI」。
在今年仅剩 6 人的董事会中,有 4 人更认可 AI 安全的重要性,Ilya Sutskever 因此能够使用投票权开除 Sam Altman。
Ilya Sutskever 曾提到,他参与创建 OpenAI 的动机之一,是为了探讨和解决 AGI 可能带来的问题,包括技术和道德方面的挑战。当他看到或者被告知这种挑战首先出现在公司内部而不是 AI 当中时,他有理由为了自己的信念行使权力,裂缝由此扩大。
可他始终没有给出具体的例证说明 Sam Altman 不坦诚在哪里,会带来哪些后果。Ilya Sutskever 挑起的风波就像 AI 对齐工作中被拿走的「对齐税」,他暂时限制了 OpenAI 的能力,又无法说明在他眼中这种限制的必要性。
房间里有一头大象,有少数人看到了,但只有更少数人行动。人们要做出符合自身角色和价值观的选择,因此分歧总是会不可避免地出现。
即便 Sam Altman 在很多时候是 OpenAI 安全政策的倡导者,但人们无法追问他的倡导是出于应对监管的需要,还是他真的看到了那头大象。即便 Ilya Sutskever 深知算力对 AI 的重要性,看到 AI 更远的未来的他只能把这种重要性放在价值排序的次席。
事件最后的焦点指向 OpenAI 的董事会,在复杂的矛盾中,董事会只支持做出 0 和 1 的选择,在功能上没有与这家公司的价值对齐。
闹剧以 Sam Altman 回归暂时结束,五天前罢免他的董事会解散,新的董事会雏形将由三人组成,Quora 首席执行官 Adam D'Angelo,Facebook 和 Salesforce 前高管 Bret Taylor,以及前美国财政部长 Lawrence H. Summers。
OpenAI 完成了它的对齐。
低垂的果实
AI 能力的「涌现」来自于训练量,扩大训练规模成了玩家们坚信的方向,结果是天文数字的训练成本投入。
GPT-3 把大模型训练参数提高到千亿规模,开启了大模型训练的规模竞赛。百度文心、阿里通义、华为盘古等头部公司的大模型训练量都同步来到千亿。而最新的 GPT-4 的参数规模又上一个台阶,到达了百万亿。
却有观点认为,训练规模给大模型带来的边际效益呈递减趋势,有人称为「数字泡沫」或者「AI 版摩尔定律」,在一定程度,AI 对齐工作成果支持了这种观点。
OpenAI 在博客中提到:安全与大模型能力息息相关。一方面强调在 AI 进化过程中安全问题的重要性。另一方面也指出,AI 对齐训练是提升 AI 能力的隐藏路径。
后一种情况在 InstructGPT 当中得到了验证。与 GPT-3 相比,经过对齐的 InstructGPT 在输出结果时更符合人类要求,InstructGPT 减少了生成有害内容的情况,也能给出更多真实可靠性的信息。
不仅如此,InstructGPT 比 GPT-3 使用更少的算力,它的训练参数减少了 100 多倍,仅 13 亿规模。
经历 OpenAI 的闹剧,赛道上的玩家或许会认识到,把所有的成本放在算力和规模之上过于奢侈,在追求超大规模、超高算力的路上存在未被发现的低垂的果实。
而面对将到来的淘汰赛,不同玩家将必须在 Ilya Sutskever 和 Sam Altman 之间选边站。
相关文章
猜你喜欢