在国内AI大模型已将“文生图”功能搞得如火如荼的时候,ChatGPT终于“姗姗来迟”地用上了AI绘画功能。
北京时间9月21日清晨,OpenAI官方发布一条视频,配以“DALL·E 3(握手)ChatGPT”的文字,正式宣告了旗下两大AI大模型的结合。
官网还给出了具体上线时间:会员版(20美元/月)和企业版10月可用,面向开发实验室的API接口则在今年秋天晚些时候提供。
而对比尚未结合ChatGPT的第二代DALL·E模型,面对相同的描述——“一幅富有表现力的篮球运动员扣篮油画”,DALL·E 2将“星云爆炸”的意象与扣篮动作拼在了一起,而DALL·E 3则直接将“星云爆炸”意象与扣篮运动员进行了融合。
左为DALL·E 2,右为DALL·E 3
从官网放出的示例图片和视频来看,DALL·E 3的最大优势在于整合了ChatGPT强大的自然语言处理能力,不仅在语言理解上大幅飞跃,还能自己写机器易于理解的提示词,再将其“转达”给图像生成的模块,最终就能生成细节和还原想象程度都再次飞跃的图像。
···
除了上述核心功能,AI图像标注、隐私安全、训练数据来源等一直备受关注的问题也均在这次新产品中有所涉及。
OpenAI表示,他们正在开发一种图像来源“鉴别器”,以帮助人们识别某一图像是否是由DALL·E 3生成的AI产物。这一工具会嵌套在DALL·E 3内部,在未来一起推出。
在隐私安全上,OpenAI提出已与红队专家(对模型进行压力测试的领域专家)合作,防止DALL·E 3生成暴力、色情或其他有害图片,在对于公众人物相关的照片和信息也会提高风险评估能力。
还有当前很多创造者所诟病的“我的绘画未经同意便被爬取作为训练数据”的情况,OpenAI表示,艺术家可以填写表格,禁止他们的网络爬虫GPTBot访问自己的个人网站,还可以直接向官方发送邮件指明自己的隐私图像,这样,官方也会将其从训练数据中删掉。
采写:南都记者 杨博雯
相关文章
猜你喜欢