> 自媒体 > (AI)人工智能 > ChatGPT App重大进化!能看能听还会说,多模态模型细节同时公布
ChatGPT App重大进化!能看能听还会说,多模态模型细节同时公布
来源:量子位
2023-09-28 12:01:23
346
管理

梦晨 发自 凹非寺量子位 | 公众号 QbitAI

OpenAI连发两则重磅消息,首先ChatGPT可以看、听、说了。

新版ChatGPT开启一种更直观的交互方式,可以向AI展示正在谈论的内容。

比如拍一张照片,询问如何调整自行车座椅高度。

看到这里,有网友灵魂发问:有多少创业公司在刚刚5分钟之内死掉了?

看听说皆备,全新交互方式

更新后的ChatGPT移动APP里,可以直接拍照上传,并针对照片中的内容提出问题。

比如“如何调整自行车座椅高度”,ChatGPT会给出详细步骤。

但是没有认出一张剧照具体出自哪部电影。

△DALL·E3演示

ChatGPT这次讲的故事文字摘录如下:

过程中更具体的多轮语音交互细节,以及语音试听可参考视频。

多模态GPT-4V能力大揭秘

结合所有公布的视频演示与GPT-4V System Card中的内容,手快的网友已经总结出GPT-4V的视觉能力大揭秘。

那么,你想好第一件事问什么了么?

参考链接:[1]https://openai.com/blog/chatgpt-can-now-see-hear-and-speak[2]https://openai.com/research/gpt-4v-system-card[3]https://x.com/IntuitMachine/status/1706307412401979455[4]https://x.com/youraimarketer/status/1706461715078975778

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
关于作者
搞印刷的黄先..(普通会员)
文章
461
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40335 企业收录2981 印章生成193673 电子证书831 电子名片53 自媒体26178

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索