> 自媒体 > (AI)人工智能 > 独家丨李志飞将在大模型领域创业,做中国的 OpenAI
独家丨李志飞将在大模型领域创业,做中国的 OpenAI
来源:极客公园
2023-06-16 22:38:00
561
管理

ChatGPT 的爆火点燃了 AI 大模型时代,李志飞告诉极客公园,自己将全力投入其中。

ChatGPT 爆火后,新的共识正在逐渐形成:语言大模型将成为下一个科技时代的超级加速器。中国也需要自己的 AI 大模型。而有能力做这件事的人选并不多,李志飞是其中之一。

作为科技创业圈最资深的自然语言科学家之一,李志飞出身美国约翰霍普金斯大学语言与语音处理实验室,博士期间一直研究机器翻译和自然语言处理。离开大学后,李志飞加入谷歌 AI 团队,主导开发了包括谷歌手机版离线翻译等一系列产品。2012 年,他选择回国,在语音交互领域创业,创立出门问问。

ChatGPT 火起来之后,他一个月两次前往硅谷,和来自 Open AI、谷歌、DeepMind 等各家的工程师和科学家交流取经。「AI 大模型的元年」来了,这是他最直观的感受。一番调研之后,他明白这场大模型之战,参赛选手不止巨头,也不会是只有一两个幸存者的「生存游戏」。

语言模型、人机交互,变革发生在李志飞学习、研究、工作了十几年的领域。他告诉极客公园,已经下定决心投身其中,做一个中国的语言大模型。

「我一直想做一个我能做,我喜欢做,同时也有深远价值的事情。」他表示,早在 2020 年 GPT-3 刚发布时,他就提出 GPT-3 是「暴力美学」的胜利,看到了通往 AGI 的可能性,并最早着手开发 GPT-3 中文版 UCLAI。

近日,李志飞和极客公园进行了一场近两个小时的交流,分享了自己对大模型、ChatGPT 的看法,以及自己接下来在这个领域创业的思路。

以下是对话实录,由极客公园整理。

01

「这就是 AI

大模型时代的开启」

极客公园:怎么理解这场 ChatGPT 带来的狂热浪潮?新在什么地方?为什么大家现在这么兴奋?

李志飞 :ChatGPT 始于一个基于统计的语言模型,通过千亿级参数的训练,让它拥有了各种能力,可以快速学会各种任务。这次普通老百姓都体验到,ChatGPT 在语言表达、回答知识性的问题、多轮对话的上下文逻辑等方面的表现,带来的体验超出所有人的期望。它可以编程、做算术题、写诗,甚至某种程度上比真人做得都要好。

极客公园:除了震惊的体验本身,在创业者或者资本看来,是怎么把它看成一个变革性的商业机会的?

李志飞 :我过年第二天就再次跑到美国去,初衷就是想了解有没有人清楚这是怎么搞出来的,为什么大模型这么厉害。

我跟 Google、OpenAI、DeepMind、Meta、Amazon 的人聊,即使技术大牛都还不清楚 ChatGPT 如何拥有这种能力。但是大家能够看到很多现象。第一,用户太疯狂了;第二,美国太疯狂了,在美国知名孵化器 Y Combinator,可能有三分之一以上的项目都是基于大模型做的应用。

所有人都认为,这是 AI 大模型时代的开启,就像 2010 年移动互联网时代一样。不到硅谷,切身感受到 AIGC 的火热,我不会下定此刻是「AI 大模型时代」这一结论。我每天七八个会从早说到晚,喉咙都是哑的,都是讨论这个东西。让你觉得这就是一个时代的开端。

李志飞在IF创新大会 2021上分享GPT-3|来源:极客公园

极客公园:现在做大模型,你会有什么新思考?

李志飞:如果现在我再做通用大模型,得把骨架造得足够稳定,具有很强可塑性,然后再去精雕。就像造乐山大佛,有了骨架之后,再把鼻子、眼睛、手修得很漂亮。当你真的具备 60 分大学生的能力之后,我们可以通过勤奋把这个大学生培养得非常好。

在此基础上我还要创新。一切跟着 OpenAI 搞没有意义,也不一定能跟上,我们要创新。

极客公园:你创业也挺长时间了,过去的经历,对做今天这个事有什么意义吗?

李志飞:过去所有的经历,都是有益的财富。首先,让我有更精准的判断力。第二,更丰富的工程实践与综合能力。

现在做这个,我只招最厉害的人做最核心的技术。而且更有长期主义的定力,而不是做短期有进展、长期有消耗的事情。

极客公园:你曾经是科学家,创业这些年之后,有什么变化吗?你怎么定位自己?

李志飞:我是有科学家思维的 CEO。我能跟科学家、工程师深度沟通,与科学家一起制定路线,建立信念,让整个团队力朝一个方向使,这也是 OpenAI 能成功的很重要因素。

极客公园:王慧文的声势也很强,有了资金后,总能招到优秀的人。你会 care 这件事吗?

李志飞:人是最重要的因素,每一家创业团队都会有自己的核心竞争力。但第一阶段最重要的是:找到真正懂核心技术的人才,并且能用正确的方式和节奏跟他们合作。

极客公园:你是如何计划的?

李志飞:短期目标是把一个 60 分的通用大模型给做出来。中长期而言,有了 60 分的基础模型后,我会花大力去把它打磨成 80 分,从而可以在真正的商业场景里稳定使用。我的优势是对通用 AI 技术有非常浓烈的兴趣,也对未来技术会怎么演化有自己的判断和把握,这使得我能够在这个赛道里长跑。

我心中已经有清晰路线图,并看到了那个终局。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
细雨入梦(普通会员)
文章
576
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216707 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索