梦晨 发自 凹非寺量子位 | 公众号 QbitAI
OpenAI连发两则重磅消息,首先ChatGPT可以看、听、说了。
新版ChatGPT开启一种更直观的交互方式,可以向AI展示正在谈论的内容。
比如拍一张照片,询问如何调整自行车座椅高度。
看到这里,有网友灵魂发问:有多少创业公司在刚刚5分钟之内死掉了?
更新后的ChatGPT移动APP里,可以直接拍照上传,并针对照片中的内容提出问题。
比如“如何调整自行车座椅高度”,ChatGPT会给出详细步骤。
但是没有认出一张剧照具体出自哪部电影。
△DALL·E3演示
ChatGPT这次讲的故事文字摘录如下:
过程中更具体的多轮语音交互细节,以及语音试听可参考视频。
多模态GPT-4V能力大揭秘结合所有公布的视频演示与GPT-4V System Card中的内容,手快的网友已经总结出GPT-4V的视觉能力大揭秘。
那么,你想好第一件事问什么了么?
参考链接:[1]https://openai.com/blog/chatgpt-can-now-see-hear-and-speak[2]https://openai.com/research/gpt-4v-system-card[3]https://x.com/IntuitMachine/status/1706307412401979455[4]https://x.com/youraimarketer/status/1706461715078975778
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
猜你喜欢