> 自媒体 > (AI)人工智能 > OpenAI DALL·E 3来了,集成ChatGPT,生图效果太炸了
OpenAI DALL·E 3来了,集成ChatGPT,生图效果太炸了
来源:机器之心Pro
2023-09-28 16:33:45
353
管理

机器之心报道

机器之心编辑部

集成 ChatGPT 后,DALL・E 3 对上下文的理解上了一个大台阶。

终于,openai 的文生图 AI 工具 DALL-E 系列迎来了最新版本 DALL・E 3,而上个版本 DALL・E 2 还是在去年 4 月推出的。

OpenAI 表示,「DALL・E 3 比以往系统更能理解细微差别和细节,让用户更加轻松地将自己的想法转化为非常准确的图像。」

这只刺猬叫「Larry」以及它的更多同类。

Larry 最后安然入眠了。

ChatGPT 集成并不是 DALL・E 3 唯一的新特点,它还能生成更高质量的图像,更准确地反映提示内容。DALL・E 将文本 prompt 转换成图像。即使是 DALL・E 2 ,也会经常忽略特定的措辞导致出错。但 OpenAI 的研究人员说,最新版本能更好地理解上下文,并且处理较长的 prompt 效果会更好。此外,它还能更好地处理向来困扰图像生成模型的内容,如文本和人手。

prompt 为「这幅插画描绘了一颗由半透明玻璃制成的人心,矗立在惊涛骇浪中的基座上。一缕阳光穿透云层,照亮了心脏,揭示了其中的小宇宙。地平线上镌刻着一行醒目的大字 『Find the universe within you』」

prompt 为「一位亚裔中年妇女的黑发上散落着银丝,显得支离破碎,错综复杂地镶嵌在一片碎瓷片中。瓷器上闪烁着飞溅的颜料图案,光泽和哑光的蓝色、绿色、橙色和红色和谐地交织在一起,在动与静的超现实并置中捕捉着她的舞姿。她的肤色与瓷器一样呈浅色,为她的造型增添了一种神秘的气质。」(推特 @nickfloats,上图为 DALL・E 3 的生成结果, 下图为 Midjourney 的生成结果)

目前,DALL・E 3 处于研究预览版本。OpenAI 计划将 DALL・E 3 的发布时间错开, 将于 10 月份首先向 ChatGPT Plus 和 ChatGPT Enterprise 用户发布,随后在秋季向研究实验室及其 API 服务发布。不过,该公司没有透露何时或者是否计划发布免费的公开版本。

DALL・E 系列研究

我们简单为大家梳理介绍下 OpenAI 文本生成图像的 DALL・E 系列研究,也方便读者们了 DALL・E 系列背后的技术。

2021 年 1 月 6 日,OpenAI 博客发布了两个连接文本与图像的神经网络:DALL・E 和 CLIP。DALL・E 可以基于文本直接生成图像,CLIP 则能够完成图像与文本类别的匹配。这两项研究的发布,引起了社区极大的关注。

据博客介绍,DALL・E 可以将以自然语言形式表达的大量概念转换为恰当的图像,可以说是 GPT-3 的 120 亿参数版本,可基于文本描述生成图像。

DALL・E 示例。给出一句话「牛油果形状的椅子」,就可以获得绿油油、形态各异的牛油果椅子图像。

2 个月后,DALL・E 的论文和代码公开。

项目地址:https://github.com/openai/DALL-E论文地址:https://arxiv.org/abs/2102.12092

2022 年 4 月 7 日左右,DALL・E 迎来了升级版本 ——DALL・E 2。与 DALL・E 相比,DALL・E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。并且,新版本还增添了一些新的功能,比如对原始图像进行编辑。

OpenAI 还公布了 DALL・E 2 的研究论文《Hierarchical Text-Conditional Image Generation with CLIP Latents》。

论文地址:https://cdn.openai.com/papers/dall-e-2.pdf

遗憾的是。OpenAI 可能不会像之前一样,公布 DALL・E 3 背后的技术细节。

注重安全与版权问题

OpenAI 称其在 DALL・E 3 上投入了大量工作,包括制定强有力的安全措施,以防止创建「有害」的图像。OpenAI 表示其与外部「红队」成员(一个故意试图破坏系统以测试系统安全性的团队)合作,并依赖输入分类器(一种教语言模型忽略某些单词以避免显式或暴力 prompt 的方法)。DALL・E 3 也无法生成公众人物的图像。

OpenAI 研究员 Sandhini Agarwal 表示她对 DALL・E 3 的安全措施「高度有信心」,并表示该模型在不断改进。OpenAI 还在一封电子邮件中表示:DALL・E 3 拒绝生成在世艺术家风格的图像,这一点与 DALL・E 2 不同。

艺术家们曾起诉 DALL・E 的竞争对手 Stability AI 和 Midjourney,以及艺术网站 DeviantArt,指控它们使用他们拥有版权的作品来训练文本到图像的模型。或许是为了避免诉讼,OpenAI 将允许艺术家将其艺术作品从未来版本的文本到图像 AI 模型中删除,不用于训练。创作者可以提交一张他们拥有版权的图片,并在网站上填写表格要求将其移除。

这样,未来版本的 DALL・E 就可以屏蔽与艺术家的图像和风格相似的结果。

参考链接:

https://openai.com/dall-e-3

https://www.theverge.com/2023/9/20/23881241/openai-dalle-third-version-generative-ai

https://techcrunch.com/2023/09/20/openai-unveils-dall-e-3-allows-artists-to-opt-out-of-training/

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
Chatgpt ?别告诉我你还不会用
近期最热门的话题之一,要数chatgpt了,那么什么是chatgpt?它又能给我们..
GPT-4神器!老外七天制作新游戏,AI全自动完成所有游戏内容..
【17173鲜游快报,专注于快速带来全球新游信息】ChatGPT彻底引爆了AI领域..
如何正确使用ChatGPT?
今天要和大家分享一下如何使用ChatGPT,并且教你们如何正确向它提问哦! ..
GPT-4重磅登场除了写代码碾压人类考高分,它将带来哪些大洗牌?..
3.16知识分子The Intellectual对 ChatGPT 的巨大超越在许多方面,GPT-4 ..
首个发达国家禁用!ChatGPT,可能会颠覆一切
这些还都是冰山一角。大家想想,每个人的大脑能装多少东西?装了这些东西..
GPT-3走红背后,AI 正变成普通人玩不起的游戏
在日常生活让 AI 帮忙完成一些任务,已经不是新鲜事。智能音箱里的 AI,..
OpenAI CEO首次在中国演讲,杨立昆反击5年内GPT将被抛弃|钛媒体焦点..
OpenAI CEO Sam Altman在智源大会上致辞演讲截图(来源:钛媒体App编辑拍..
“要脸面,还是要钱?”男子“裸聊”几分钟之后……..
当你独自刷着手机消息提示音突然打破了宁静陌生“妙龄少女”主动搭讪你的..
北大“韦神”出题,GPT-4挑战失败,初二学生却给出标准答案!网友:又是凑..
近日北京大学北京国际数学研究中心推出的一道数学题获得了数学爱好者的广..
关于作者
巫月(普通会员)
文章
623
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索