> 自媒体 > (AI)人工智能 > ChatGPT 年底重磅第六弹来了,视频通话+屏幕共享全都有,还有一个圣诞彩蛋
ChatGPT 年底重磅第六弹来了,视频通话+屏幕共享全都有,还有一个圣诞彩蛋
来源:爱范儿
2025-02-05 15:20:31
110
管理

支持 50 多种语言的 ChatGPT 将能够实时理解视觉场景,帮助你解决问题,甚至化身 AI 导师教你掌握新事物。

在这场同样不到 20 分钟的发布会上,由 OpenAI 首席产品官 Kevin Weil、Jackie Shannon、Michelle Qin 和 Rowan Zellers 等人向我们展示长了「眼睛」的 ChatGPT 究竟能干些什么?

比如说,当你入手了一套手冲咖啡设备却不知从何入门时,不妨给 ChatGPT 打一通「视频通话」。

它就能根据你面前的器具,手把手教你完成每一个步骤,从放置滤纸、倒热水、将磨好的咖啡粉放入滤纸中等等,包教包会。

嘿,Kevin,你的圣诞老人服装很有节日气氛。或许继续练习你的「Ho Ho Ho」,很快就能成为购物中心的圣诞老人了。

实际上,OpenAI 总裁 Greg Brockman 前不久也与安德森·库珀(Anderson Cooper)利用带视觉功能的 ChatGPT 进行了关于人体解剖学的知识小测验。

当库珀在黑板上画出身体部位时,ChatGPT 能够瞬间「理解」他所画的内容。

Google Deepmind 研究科学家 Jonas Adler 更是直接呛声 OpenAI:

OpenAI 总能迅速对我们发布的产品做出回应,而且似乎总能在同一时间发布,这令人感到神奇。然而,我对他们将 Santa 模式作为对 Gemini 2.0 的回应并不太感冒,因为它似乎缺乏与 Gemini 2.0 相匹配的重要性和严肃性。

值得一提的是,昨天,Google 抢先一步推出了具备视觉理解能力的 AI 产品,能够理解并解析用户所处的实际场景,且收获网友的一众好评。

到了今天,OpenAI 也紧随其后,为 ChatGPT 装上了「眼睛」,这也意味着 ChatGPT 从相对单一的模态,进一步拓展至「视觉—语言多模态理解」。

换言之,ChatGPT 将不再局限于用户输入的文字指令与信息,而是能够通过视觉来理解用户所处的上下文环境,包括电脑屏幕上的页面、手机摄像头所捕捉的影像、甚至其他外设的实时画面。

如果说半个世纪前,施乐 PARC 实验室的科学家们幻想过一台能看懂人类行为的计算机。今天 AI 的发展,正在把这个梦想变成了显示器之外的现实。

从纸到键盘,从二进制到自然语言,人类一直在简化与机器的沟通方式。而 ChatGPT 的视觉能力也让我们看到了终极答案,那就是让机器像人一样「看」这个世界。

考虑到 Altman 和前苹果首席设计官 Jony Ive 一直在开发智能 AI 硬件设备,我更期待看到这项功能出现在这款新硬件上。

AI 睁开眼睛的那一刻,也终于走进了人类眼中的世界。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿|原文链接· ·新浪微博

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
王牌竞速:OpenAI的GPT-4被超了
21世纪经济报道记者孔海丽、实习生张奕丹 北京报道这场世人瞩目的国际竞..
全球首个开源GPT-4出世!Llama 3震撼发布,Meta AI免登录可用..
编辑:编辑部【新智元导读】蛰伏许久,Meta刚刚扔出了重磅炸弹:大家期待..
讯飞星火大模型V4.0体验:全面进化,体验不输GPT-4o
在 6 月 27 日举办的讯飞星火 V4.0 发布会上,科大讯飞发布了讯飞星火大..
芝大论文证明GPT-4选股准确率高达60%,人类股票分析师要下岗?..
编辑:编辑部【新智元导读】GPT-4在为人类选股时,表现竟然超越了大部分..
大模型开车哪家强?普渡研究给指南:GPT-4真行啊
白交 发自 凹非寺量子位 | 公众号 QbitAI现在一句口令,就能指挥汽车了。..
谷歌:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了..
编辑:Aeneas 好困【新智元导读】刚刚,谷歌DeepMind、JHU、牛津等发布研..
潞晨尤洋:视频生成的GPT-4时刻,3年后可以见证 | MEET 2025..
编辑部 发自 凹非寺量子位 | 公众号 QbitAI奥特曼说,Sora代表了视频生成..
通义千问GPT-4级主力模型降价97%,1块钱200万tokens
5月21日,阿里云方面宣布,通义千问GPT-4级主力模型Qwen-Long,API输入价..
一夜封神!Llama 3.1大模型震撼发布,真正的全民GPT-4时代来了..
Meta更新了许可证,允许开发人员首次使用包括405B参数规模的Llama模型的..
关于作者
清水大树(普通会员)
文章
848
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40386 企业收录2981 印章生成229719 电子证书1008 电子名片58 自媒体46281

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索