> 自媒体 > (AI)人工智能 > 终结扩散模型:OpenAI开源新模型代码,一步成图,1秒18张
终结扩散模型:OpenAI开源新模型代码,一步成图,1秒18张
来源:机器之心Pro
2023-06-16 21:50:53
630
管理

机器之心报道

机器之心编辑部

扩散模型的时代结束了。

在 AI 画图的领域,人们一直关注的是扩散模型,人们一直在尝试不断改进,推出了 Stable Diffusion、Midjourney、DALL-E 等技术,并在其基础上构建应用。不过最近,OpenAI 提出的全新生成模型看起来要让这一领域经历一场革命。

与高调推出 ChatGPT 、GPT-4 不同,这次 OpenAI 在上个月偷偷上传了一篇论文《 Consistency Models 》,也不能说是偷偷,只是这次没有媒体大张旗鼓的报道,就显得这项研究有些低调。论文内容主要是关于图像生成领域的。

作者阵容也非常强大,有本科毕业于清华大学数理基础科学班、目前在 OpenAI 担任研究员的宋飏。宋飏将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。此外还包括 OpenAI 联合创始人、首席科学家 Ilya Sutskever。

前面我们已经提到,OpenAI 的这项研究主要是图像生成方面的,大家或多或少的都听过这项技术,例如最近热门的 Midjourney 和 Stable Diffusion,它们大都采用扩散模型,由于其生成的图片效果惊艳,很多人都将其视为最好的工具。但扩散模型依赖于迭代生成过程,这导致此类方法采样速度缓慢,进而限制了它们在实时应用中的潜力。

OpenAI 的这项研究就是为了克服这个限制,提出了 Consistency Models,这是一类新的生成模型,无需对抗训练即可快速获得高质量样本。与此同时,OpenAI 还发布了 Consistency Models 实现以及权重。

论文地址:https://arxiv.org/pdf/2303.01469.pdf代码地址:https://github.com/openai/consistency_models

具体而言,Consistency Models 支持快速 one-step 生成,同时仍然允许 few-step 采样,以权衡计算量和样本质量。它们还支持零样本(zero-shot)数据编辑,例如图像修复、着色和超分辨率,而无需针对这些任务进行具体训练。Consistency Models 可以用蒸馏预训练扩散模型的方式进行训练,也可以作为独立的生成模型进行训练。

研究团队通过实验证明 Consistency Models 在 one-step 和 few-step 生成中优于现有的扩散模型蒸馏方法。例如,在 one-step 生成方面,Consistency Models 在 CIFAR-10 上实现了新的 SOTA FID 3.55,在 ImageNet 64 x 64 上为 6.20。当作为独立生成模型进行训练时,Consistency Models 在 CIFAR-10、ImageNet 64 x 64 和 LSUN 256 x 256 等标准基准上的表现也优于 single-step、非对抗生成模型。

有网友将其视为扩散模型的有力竞争者!并表示 Consistency Models 无需对抗性训练,这使得它们更容易训练,不容易出现模式崩溃。

在训练方面,研究团队为 Consistency Models 提供了两种基于自洽性的方法。第一种方法依赖于使用数值 ODE 求解器和预训练扩散模型来生成 PF ODE 轨迹上的相邻点对。通过最小化这些点对的模型输出之间的差异,该研究有效地将扩散模型蒸馏为 Consistency Models,从而允许通过 one network 评估生成高质量样本。

第二种方法则是完全消除了对预训练扩散模型的依赖,可独立训练 Consistency Models。这种方法将 Consistency Models 定位为一类独立的生成模型。

值得注意的是,这两种训练方法都不需要对抗训练,并且都允许 Consistency Models 灵活采用神经网络架构。

实验及结果

实验数据集包括 CIFAR-10 、ImageNet 64x 64 、LSUN Bedroom 256 x 256 、 LSUN Cat 256 x 256。首先该研究在 CIFAR-10 上进行了一系列实验。结果图 3 所示。

Few-Step 图像生成

接着该研究在 ImageNet 64x 64、LSUN Bedroom 256 x 256 数据集上进行实验,结果如图 4 所示。

表 1 表明,CD( consistency distillation )优于 Knowledge Distillation、DFNO 等方法。

表 1 和表 2 表明 CT( consistency training ) 在 CIFAR-10 上的表现优于所有 single-step、非对抗性生成模型,即 VAE 和归一化流。此外,CT 在不依赖蒸馏的情况下获得与 PD ( progressive distillation )相当的质量,用于 single-step 生成。

图 5 提供了 EDM (Karras et al., 2022) 样本(顶部)、single-step CT 样本(中)和 two-step CT 样本(底部)。

了解更多内容,请参考原论文。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
关注|朔尔茨反对将欧洲汽车市场与外国竞争隔绝,德国车企均表态..
文:懂车帝原创 李德喆[懂车帝原创 行业] 据外媒报道,当地时间6月8日,..
阿塞拜疆与格鲁吉亚争夺投资机会,外高加索成中国汽车出海重点市场?..
(文/潘昱辰 编辑/高莘)据格鲁吉亚媒体agenda报道,日前中国驻格鲁吉亚..
事关汽车市场,朔尔茨表态:反对
德国总理:反对将欧洲汽车市场与外国竞争隔绝新华社法兰克福6月8日电(记..
朔尔茨再表态:反对欧洲汽车市场排除外国竞争,对中国也应公平..
【文/观察者网 熊超然】前有美国已宣布对中国电动汽车征收四倍关税,后有..
喵哥试驾了问界新M7 Ultra,底盘和颜值提升明显,要排队提车了..
喵哥在问界新M7 Ultra发布会之前,就试驾到了,今天跟大家详细聊一下改款..
自动驾驶汽车离消费者还有多远?专家解读
4日,工业和信息化部等四部门公布了一份名单,由汽车生产企业和使用主体..
自动驾驶汽车离消费者还有多远?专家解读
原标题:自动驾驶汽车离消费者还有多远?专家解读4日,工业和信息化部等..
自动驾驶汽车离消费者还有多远?专家解读
4日,工业和信息化部等四部门公布了一份名单,由汽车生产企业和使用主体..
换车吗?超111亿元汽车以旧换新补贴,安排上了
中新网6月4日电(中新财经记者 李金磊)2024年汽车以旧换新补贴来了。根据..
关于作者
巫月(普通会员)
文章
933
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40400 企业收录2981 印章生成237610 电子证书1052 电子名片60 自媒体52089

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索