> 自媒体 > (AI)人工智能 > 大模型超进化!ChatGPT将支持图片和语音输入
大模型超进化!ChatGPT将支持图片和语音输入
来源:知未科技
2023-09-28 14:34:14
325
管理

据IT之家,近日,OpenAI宣布推出新版ChatGPT,增加了两项新功能:语音输入和图像输入。OpenAI称,新功能将在未来两周内向ChatGPT Plus订阅用户推出,其他人也将“很快”能够使用这些功能。

语音输入功能类似于手机上的语音助手,用户只需按下一个按钮,说出自己的问题,ChatGPT就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。AI识别语音在技术上并非难事,相当于加了一个“语言-文本”转换环节,目前更重要的是提升准确性,尤其是在面对不同语言、甚至是方言和俚语的情况下,能否依旧准确识别并输出对用户有帮助的内容。另外,跨语种场景下的识别和生成结果,同样需要细细打磨。

图像输入功能方面,用户可以拍摄自己感兴趣的事物,并上传到ChatGPT中。ChatGPT会尝试识别用户想要询问的内容,并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题,或者配合语音或文本输入来进行交流。ChatGPT的优势在于它可以进行多轮对话,而不是一次性搜索。如果用户对答案不满意或想要更多信息,可以继续向ChatGPT提问,从而得到更准确和全面的答案。

而在公司经营层面,OpenAI除了要面对高昂的运营和训练成本,以及尚未寻找到实现盈利的突破口等挑战外,公司还遭到了阻击。当地时间周一,美国电商和云服务巨头亚马逊宣布,将投资40亿美元,投资人工智能初创企业Anthropic。根据新合作协议,Anthropic将使用亚马逊自研的人工智能芯片来构建、训练和部署亚马逊的智能大模型。同时,Anthropic未来将通过亚马逊云来完成其大部分工作业务,从而帮助提升亚马逊云的服务质量。ChatGPT确实在技术上存在优势地位,但面对“钞能力”这种不讲道理的竞争方式,OpenAI同样压力山大。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
赶海的老阿姨..(普通会员)
文章
497
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40335 企业收录2981 印章生成193671 电子证书831 电子名片53 自媒体26178

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索