> 自媒体 > (AI)人工智能 > GPT-3、Stable Diffusion一起助攻,让模型听懂甲方修图需求
GPT-3、Stable Diffusion一起助攻,让模型听懂甲方修图需求
来源:数据派THU
2023-05-01 22:21:03
298
管理

本文约2000字,建议阅读5分钟

GPT-3、Stable Diffusion 一起助攻,让模型秒变 PS 高手,改图随心所欲。

AI 可以完全按照甲方意愿修图?GPT-3、Stable Diffusion 一起助攻,让模型秒变 PS 高手,改图随心所欲。

扩散模型大火之后,很多人将注意力放到了如何利用更有效的 prompt 生成自己想要的图像。在对于一些 AI 作画模型的不断尝试中,人们甚至总结出了让 AI 好好出图的关键词经验:

的变分自编码器的潜空间中操作来提高扩散模型的效率和质量。

对于一个图像 x,扩散过程向编码的 latent

中添加噪声,它产生一个有噪声的 latent z_t,其中噪声水平随时间步 t∈T 而增加。研究者学习一个网络

此前,曾有研究(Wang et al.)表明,对于图像翻译(image translation)任务,尤其是在成对训练数据有限的情况下,微调大型图像扩散模型优于从头训练。因此在新研究中,作者使用预训练的 Stable Diffusion checkpoint 初始化模型的权重,利用其强大的文本到图像生成能力。

为了支持图像调节,研究人员向第一个卷积层添加额外的输入通道,连接 z_t 和

。扩散模型的所有可用权重都从预训练的 checkpoint 初始化,同时在新添加的输入通道上运行的权重被初始化为零。作者在这里重用最初用于 caption 的相同的文本调节机制,而没有将文本编辑指令 c_T 作为输入。

实验结果

在下面这些图中,作者展示了他们新模型的图像编辑结果。这些结果针对一组不同的真实照片和艺术品。新模型成功地执行了许多具有挑战性的编辑,包括替换对象、改变季节和天气、替换背景、修改材料属性、转换艺术媒介等等。

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
够专业,够聪明,还有点幽默感,试用了国产类ChatGPT “天工”..
最近关于ChatGPT的话题很火,国内也纷纷推出了各类相关的产品。这两天朋..
ChatGPT一周年:论道大模型与AIGC的趋势、投资与产业化之综述篇..
编者按:2022年11月30日,ChatGPT横空出世,并以史上最快速度实现上亿活..
ChatGPT永久封号潮来袭!(这次包含很多Plus)
最近这几天,ChatGPT又双叒开始了一波妖魔化封号了。还是那个熟悉的操作..
ChatGPT爆火出圈,人工智能将如何赋能营销?
近期ChatGPT在科技圈掀起新一轮关于人工智能的热潮,这个聊天机器人模型..
22字声明、近400名专家签署、AI教父Hinton与OpenAI CEO领头预警:AI可能灭..
整理 | 屠敏出品 | CSDN(ID:CSDNnews)经过不到一年的时间,AI 的发展..
关于马斯克新成立的OpenAI,你需要知道的七件事
上周五,特斯拉CEO马斯克宣布启动非盈利人工智能项目OpenAI。公司的使命..
OpenAI发布GPT-4,做题能力更强,还接受图片输入,看懂梗图无障碍!..
新能力:看懂梗图无障碍GPT-4 模型中最大的更新之一是它引入了图像作为输..
意大利要求ChatGPT公开数据处理逻辑,满足才能重新上线..
OpenAI若想重新在意大利上线ChatGPT,需要在4月底前满足意大利监管机构提..
达摩院用128张GPU烧出“中文版GPT-3”,我试了下,原来擅长这个..
杨净 子豪 发自 凹非寺量子位 报道 | 公众号 QbitAI首先,请先看一段“正..
关于作者
婆罗花开(普通会员)
文章
561
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40350 企业收录2981 印章生成210463 电子证书900 电子名片56 自媒体30867

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索