OpenAI 的 CEO 山姆·奥尔特曼(Sam Altman)自 2015 年与埃隆·马斯克(Elon Musk)等人共同创立该公司以来,一直是这家总部位于旧金山的公司的核心成员。
OpenAI 在 2020 年推出了 GPT-3 模型,开创了大型语言模型的时代。2022 年,随着其生成式图像制作模型 DALL-E 2 的发布,它再次定义了人工智能领域的热门议程。
图 | OpenAI CEO 山姆·奥尔特曼(Sam Altman)
当 DALL-E 2 模型在 4 月份发布时,它引发了创造力和创新的爆炸,至今仍在继续。其他的更好的或免费的模型很快就纷纷效仿。
但 DALL-E 2 是开路先锋,它是今年人工智能的第一个高光时刻,不仅会在人工智能历史上留下浓墨重彩的一笔,还将在未来几年的主流社会和文化上留下印记。但正如奥尔特曼所承认的那样,这种影响并不都是积极的。
我和奥尔特曼谈到了他从 DALL-E 2 中学到的东西。他说:“我认为,关于人工智能未来十年的前景,我们有一系列很重要的经验要汲取和吸收。”
接下来是奥尔特曼对采访问题的回应,出于清晰和长度的考量,我们的谈话内容经过了编辑:
为什么 DALL-E 2 会产生这样的影响
DALL-E 2 跨越了一个可以产生逼真图像的阈值。但即使是不逼真的图像,它似乎也能真正很好地理解概念,以新的方式将事物结合起来,这感觉就像真正的智能(intelligence)。DALL-E 1 模型没有这种感觉。
但我想说的是,早在 2020 年,令科技圈更惊喜的是 GPT-3 而非 DALL-E。GPT-3 是人们第一次真正感受到一个系统的智能。
GPT-3 可以做人类所做的事。我认为,这让那些以前根本不相信通用人工智能的人开始认真对待它,之后发生了一些我们都没有预料到的事情。
但图像具有一种情感上的力量。科技圈以外的人,他们普遍对 DALL-E 的表现更感到惊喜而不是 GPT-3。
从 DALL-E 2 的成功中学到了什么
我认为,关于接下来十年的人工智能未来,我们有一系列重要的东西要学习。第一个是它的来源,以 DALL-E 2 为例,它诞生之初只是三个人在 OpenAI 办公室的角落里探讨一个想法。
一个看似不起眼的关于扩散模型的想法,只是算法上的一个小突破,就让我们完成了从创造一般的东西到创造可以对世界产生巨大影响的东西的跨越。
另一件有趣的事情是,这是第一个每个人都可以使用的人工智能,很多原因导致了这个现象。
但最重要的一点是,它会创造完整的成品。如果你使用 Copilot,我们的代码生成人工智能,它必须在你的帮助和指引下才能工作。
但在 DALL-E 2 上,你只要告诉它你想要什么就可以了,就像和一个身为平面艺术家的同事交谈一样。我想这是我们第一次看到这样的人工智能。
DALL-E 2 对社会意味着什么
当我们意识到 DALL-E 2 将引起轰动的时候,我们想让它成为一个例子,展示我们将如何部署新技术,让全世界明白图像是可以伪造的,就像是对人们说:“你知道吗,很快你就不能信任互联网上的图像了。”
我们也想与那些将被该技术施加负面影响的人对话,然后让他们也去使用它。
这不是当前的框架。但作为一个人工智能领域,我希望我们能够实现的是,如果你通过提供数据来帮助训练人工智能,那么你应该以某种方式拥有这个模型的一部分。
但是保持透明度很重要。这将会影响插画家的就业市场,因为一个插画家所能做的事情将会被扩大 10 倍或 100 倍。
这对就业市场的影响很难说。我们真的不知道。我可以轻易想到就业市场变大的情况,也能轻易想到它变小的情况。
当然,有了这些工具,就会有新的工作机会,但肯定会有一个转变。
与此同时,我还看到巨大的社会利益,每个人都得到了这个新的超能力。我用 DALL-E 2 做了很多事情。
我制作了放在家里的艺术品。我还对房子做了一次改造,我很成功地用它实现了一些建筑理念。
我的一些朋友要结婚了。他们的网站上都有由 DALL-E 生成的图片,这对新婚夫妇很有意义。他们永远也不会雇一个插画家来这么做。
最后,我们只是想用 DALL-E 2 来告诉全世界,当我们说,“我们要制造出像人类一样的、能理解世界的强大人工智能,可以像人类一样为你做有用的事情”,我们真的在这样做。
我们想教育人们即将发生的事情,这样我们就可以参与到一场非常艰难的社会对话中来。
支持:Ren
原文:
https://www.technologyreview.com/2022/12/16/1065255/sam-altman-openai-lessons-from-dall-e-2/
相关文章
猜你喜欢