衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
当我们围观ChatGPT炸开的多场激战时,还有什么是暗流下激战的?
今天要关注的,不是违背“非盈利”初心的OpenAI,也不是商业模式面临颠覆的谷歌搜索。把目光从公司层面挪开,看向另一场已经白热化的战争——
借着的ChatGPT燎原之势,2月中旬同一天的30分钟内,就有2位谷歌大脑大模型人才先后官宣入职OpenAI,其中之一Jason Wei是思维链(chain-of-thought,CoT)的最早一作。
大模型交锋背后,谷歌和OpenAI的人才战争打得正酣。和动辄上亿美元的投融资同样重要,AI人才也是兵家必争的财富。
51人组成的人才图鉴,学历一栏中名校印记俯拾皆是。据不完全统计,出现频次最多的是MIT和斯坦福大学,曾在耶鲁大学、UC伯克利、哈佛大学、牛津大学攻读学位的人也不在少数。也不乏在这些名校中辗转求学的人,譬如表格中提到的OpenAI前研究副总裁Dario Amodei,先后就读于普林斯顿大学和斯坦福大学;再比如InstructGPT背后论文共同作者之一Gretchen Krueger,MIT、哈佛大学、哥伦比亚大学都是他的母校。
出走团队打造ChatGPT竞品对话式AI毫无疑问,GPT系列背后的51人引领了大语言模型的创新风潮。从GPT系列结束战斗后,不少人从OpenAI脱离。除开GPT-3共同作者、哥大博士在读的Melanie Subbiah本就不属于OpenAI,50人里共有16位人才从OpenAI流失。
其中8位的最终流向是AI初创公司Anthropic。更准确地说,包括Dario Amodei、GPT-3论文一作Tom B. Brown在内的一批核心人才不满OpenAI成为微软附庸——因被注资,OpenAI要使用Azure超算来搞研究,要将技术授权给微软,甚至要给微软的投资活动筹集资金,这与OpenAI创立的初衷(关注高级AI安全)相悖。
最终,包括8位GPT系列作者在内,共11名OpenAI前员工怒而离职,于2021年创办Anthropic,要搞能控制、可解释的AI,重心放在生成式AI上。
关于Anthropic的最新消息让这家“复仇者联盟”愈发走到人们熟悉台前。月初,谷歌向它投资3亿多美元(约合人民币20.3亿元),拿下后者约10%的股份。交易条款要求,Anthropic需要从谷歌云计算部门购买计算资源。这恰好与3年前,OpenAI接受微软高达10亿美元的注资,将微软定位独家云提供商所呼应。
换句话说,Dario Amodei带着Anthropic走上了3年前所不齿的OpenAI的老路,接受金主爸爸提供的算力来进行技术开发。现如今,Anthropic最新估值50亿美元,除谷歌外,已有的投资人包括Facebook联创Dustin Moskovitz,谷歌前CEO、现技术顾问Eric Schmidt等人。
△Igor Krivokon
上文提到,有5%的GPT系作者跑到了对家谷歌干活,相比之下,LaMDA论文作者,没有一位跳槽到对家OpenAI,很稳。那么,究竟是什么样的公司,能够得到出走的LaMDA论文作者的法眼?
答案是两家AI初创公司,一家是Inflection AI,另一家是Character.AI。
出走后,成AI初创公司Inflection AI&Character.AI创始团队先来聊聊Inflection AI,这家机器学习初创公司是LaMDA作者中的Joe Fenton,和从OpenAI出来的Rewon Child(3位投奔谷歌的出走成员之一)共同创立,创始团队中还有LinkedIn联创Reid Hoffman和DeepMind创始成员、谷歌人工智能产品与政策副总裁Mustafa Suleyman,阵容十分豪华。LaMDA论文作者,曾担任谷歌研究工程师的Maarten Bosma在公司成立后也被挖走,现为Inflection AI技术人员。
据了解,这家公司的总体目标是利用人工智能帮助人类与计算机“对话”。去年5月,Inflection AI获得了2.25亿美元的A轮融资,资金来源尚不清楚,公司估值超过12亿美金。
以及,现有5名LaMDA论文作者进入Character.AI就职。
Character.AI的创始人Noam Shazeer是谷歌前首席软件工程师,不仅参与了LaMDA的研究,还是Transformer论文作者之一。杜克大学本科毕业后,2000年年底,Noam Shazeer加入谷歌,是谷歌最重要的早期员工之一。虽然中途一度离职,但截至他2021年10月离职创办新公司,共在谷歌工作了17年又5个月。Character.AI的现任总裁也是LaMDA论文作者,Daniel De Freitas,加入谷歌前,他曾在微软Bing做软件工程师。
实际上,LamDA论文发表时,Noam Shazeer和Daniel De Freitas都已经从谷歌离职,开始筹备Character.AI了。据报道,Character AI已经创建了一个基于LaMDA的神经语言模型聊天机器人Web应用程序,能够生成类似人类的文本响应并参与上下文对话。
人才大战里的华人面孔今年年初,大模型人才的跳槽愈发频繁。从谷歌加入OpenAI的谷歌大脑4人之一中,包括华人顾世翔(Shane Gu),谷歌大脑日本团队前成员,剑桥大学博士,本科在多伦多大学师从三巨头之一Hinton。去年5月,只要加上一句“让我们一步一步地思考”就能让GPT-3做数学题的准确率暴涨61%这事,就是顾世翔参与的研究发现。
另一位要提到的是欧阳龙(Long Ouyang),他参与了与ChatGPT相关的7大技术项目中的4项研究,包括InstructGPT、webGPT、RLHF和ChatGPT,是InstructGPT论文的一作,RLHF论文的第二作者。
革命性科技浪潮背后,人才频繁流动梳理后不难看到,谷歌和OpenAI虽为大模型重镇,但人才流动其实是很寻常的事。仅仅在本文涉及的人员里,GPT-2论文四作和Transformer论文一作和共同创办的Adept,不到半年就亮出了新公司的首个大模型ACT-1;Anthropic更是凭借对话机器人Cluade成为谷歌和OpenAI大战中的一把利刃。
△大模型人才从OpenAI和谷歌出走后,创立的AI初创公司
总体而言,爆炸性的ChatGPT让大模型背后的人才更加收到世人关注,对这些人来说,ChatGPT带来的风口也是他们必须迎头面对的挑战。
由此提出一个思考:做类ChatGPT产品,中国的优势在哪里?
很大程度上,构筑大模型堆参数、堆数据的大力出奇迹之道,其实是中国团队向来擅长的事情。但不可否认,小公司负担不起高昂的天价成本,大公司需要综合考虑整体战略,种种因素,从不同角度成为一个中国版ChatGPT诞生的外在桎梏。
如此一来,破除外在束缚需用巧力。在算法、数据等都存在差距的现实条件下,人才,或许能成为这场轰轰烈烈全球擂台赛里的破局点。大模型背后的每一个参与者和理念、数据、技术拥有同等的重要价值。中国不缺人,更不缺人才,从GPT系论文和LaMDA论文背后的华人作者数量更可以看到AI人才的实力,人才的聚集能形成人才规模核心竞争力。
The battle of AGI never ends!埋头研究,伸手抢人的现象,已经在国内出现。想招人的,想找工作的,都可以开始准备了。
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
猜你喜欢