近日,人工智能公司 OpenAI 宣布,开发者可以将文本生成图像模型 DALL·E 2, 直接集成到其应用程序和产品中。
OpenAI 在官网表示,截至 11 月 3 日,已经有超过 300 万人使用 DALL·E 2,每天创建的图片数量达到 400 万张。而在 9 月 28 日,DALL E 2 被允许所有人注册并使用,当时用户量有 150 多万,每天生成的图像约 200 万张。即在一个月左右的时间里,DALL·E 2 的使用人数和生成图片数量都翻了一倍。
如今当更多开发人员和企业将 DALL-E 2 集成到其应用中后,该模型的影响力无疑会进一步扩大。
图 | 在现有基础上,对图像进行编辑和扩展(来源:OpenAI)
OpenAI 在官网表示:“随着研究的发展,将继续把最先进的技术引入 API,包括在图像质量和可用性等方面的进步。我们非常希望看到客户使用 DALL·E 2 产生出各种创意。”
据了解,DALL·E 2 发布于 2022 年 4 月(同年 7 月进入测试阶段),借助于该模型,用户只需简单输入一些文字描述,就可以将文字描述的场景以图片的形式真实展现出来。目前用户能免费生成一定数量的图像,额外的图像则需要付费。
DALL·E 2 通过一种名为“扩散”的过程,来理解文本和对应图像间的关系。除了可以生成和编辑图像,它还可以组合概念、属性和样式,并将原始画像进行扩展,从而创建广阔的新构图或生成原图的变体。
(来源:OpenAI)
值得注意的是,当前的文本生成图像 AI 仍存在一些问题。这些系统可能产出某些有害内容,并在数据使用方面存在着版权和道德风险。
对于此,OpenAI 已采取一定措施,来防止 DALL·E 2 生成暴力、仇恨或色情图像,像将模型训练数据中的有害内容进行删除,并通过过滤器(还设置了自动化和人工监控系统),禁止生成和上传可能违反其政策的文本提示和图片。
该公司还采取了相关技术来防止现实人物(包括历史公众人物)的面部生成。总之, OpenAI 正尽可能减少 DALL·E 2 对不良内容的接触。
在官方博文中 OpenAI 还提到,他们从全球 300 万使用 DALL·E 2 的用户中,得到了很多有关安全方面的经验教训,将继续把信任和安全作为首要任务,以便所有人能够专注于作品构建。
DALL·E 2 系统虽然广受用户欢迎,但文本生成图像模型正在快速发展,它也面临着多方的竞争,像 Midjourney 和 Stability AI,两者目前对用户的限制较少。
然后,还有一个值得关注的问题是,像 DALL·E 2这样的 AI 系 统,训练所用的数据大都直接来自互联网,包括摄影师、设计人员等的版权作品。
对于自己的作品被使用,艺术家们不仅没有得到补偿,文本生成图像模型还可能会模仿他们的风格,甚至产出侵犯版权的作品。这让很多人类创作者感到不满甚至愤怒。
不过,某些开发文字生成图像系统的公司,例如 Shutterstock,最近对外表示正在建立一个贡献者基金,以补偿为训练 AI 提供数据的个人。
对于提供补偿等解决方案,据悉,OpenAI 目前还没有相关计划。该公司负责 API 的产品经理卢克·米勒(Luke Miller)告诉媒体,这是一个非常复杂的问题,需要从很多不同的角度来考虑,公司会从社区等渠道继续寻求用户的反馈。
同时,他也对外提到,用 DALL·E 2 创建图像,其实与其他作品的创作过程没有什么不同,人们首先提出自己的想法,并不断进行调整修改,逐渐取得适合自己需求的满意作品。
参考资料:
https://openai.com/blog/dall-e-api-now-available-in-public-beta/
https://beta.openai.com/docs/guides/images/introduction
https://www.theverge.com/2022/11/3/23438604/text-to-image-ai-openai-dall-e-api-public-beta-price
https://venturebeat.com/ai/dall-e-api-released-by-openai-in-public-beta/
相关文章
猜你喜欢