OpenAI 发布新语音系统「Whisper 」，英文识别能力可接近人类水平-脚本导航

> 自媒体 > （AI）人工智能 > OpenAI 发布新语音系统「Whisper 」，英文识别能力可接近人类水平

OpenAI 发布新语音系统「Whisper 」，英文识别能力可接近人类水平

来源：AI科技评论

2023-08-03 13:47:36

782

管理

图注：方法概述

在许多不同的语音处理任务中训练一个序列到序列的转换器模型，包括多语言语音识别、语音翻译、口头语言识别和语音活动检测；所有任务都表示为要由解码器预测的标记序列，允许单一模型取代传统语音处理管道的不同阶段；多任务训练格式使用一组特殊的标记，作为任务指定者或分类目标

Whisper 架构采用一种简单的端到端方法，通过编码器-解码器 Transformer 来实现：输入音频被分成30秒的块，转换成 log-Mel 频谱图后传递到编码器。解码器可预测相应的文本标题，并与特殊标记混合，由这些标记指导单个模型执行诸如语言识别、短语级时间戳、多语言语音转录和英语语音翻译等任务。

图注：Whisper 架构

值得一提的是，由于「Whisper 」是在一个庞大且多样的数据集上进行，没有针对任何特定的数据集进行微调，因此它不会击败专门研究 LibriSpeech 性能的模型。

此外研究团队还发现，当在许多不同的数据集上测量「Whisper 」的零样本性能时，「Whisper 」相比其他模型表现更加稳健，错误率降低了 50%。

除了足够大的数据集规模外，「Whisper 」还支持多种语言的转录，以及将这些语言翻译成英语。

当前在68万小时音频中，共11.7万个小时覆盖了96中其他语言，还包括12.5万个小时的转录和翻译数据，即大约有三分之一是非英语的。

「Whisper 」会交替执行以原始语言转录或翻译成英语的任务，对此研究团队发现，这种方法在学习语音到文本的翻译方面特别有效，并且优于 CoVoST2 到英语翻译零样本的监督 SOTA。

目前，「Whisper 」已开源，可用于对语音识别方面的进一步研究。

OpenAI 创始人 Ilya Sutskever 对此表示，“终于有一个能理解我说话的可靠的语音识别系统。”

前特斯拉人工智能和自动驾驶部门负责人 Andrej Karpathy 也转发了这一消息称“OpenAI 正处于最好的状态中”。

那么大家怎么看？

参考链接：https://openai.com/blog/whisper/

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

如何理解看待 OpenAI 公布PPO算法？

2023-08-03 13:50

因错误率较高，OpenAI被迫叫停AI内容识别软件

2023-08-03 13:39

相关文章

“中国汽车出口猛增，正席卷全球”

【文/观察者网熊超然】当地时间9月6日，《纽约时报》以“中国的汽车正席..

有人年赚百万汽车出海涌现“零公里二手车”

经济观察报记者王帅国在中国汽车出口连年增长的大背景下，二手车出口..

大佬爆赞！余承东邀请周鸿祎体验享界S9 新车豪华美学拉满..

【CNMO科技消息】一年一度的2024粤港澳大湾区车展已经正式揭幕，亮点太多..

深蓝G318解决了方盒子SUV的痛点？看喵哥试驾，你说该卖多少钱..

最近这几年，随着户外露营的兴起，方盒子已经很火了。经常有朋友跟喵哥讲..

多家车企又降价促销了，特斯拉、小鹏等车，最高下调15.1万..

大家都知道，9月份是车市传统销售旺季，消费者购车热情普遍较高，而车企..

丰田汽车全球产销量连续三个月下滑，汽车之王丰田该咋办？..

在世界汽车的江湖之中，丰田汽车可以说是绝对的王者，甚至多年雄踞世界汽..

昔日销冠跌出前十，长城汽车魏建军的焦虑与反思

赵永坡也在社交平台上介绍：“哈弗H6车型是国内最早一批可以实现OTA升级..

汽车资讯∣上汽大众全新途观L PRO上市;丰田新款皇冠陆放上市..

◆ 上汽大众途观L PRO售价23.68万元起5月30日，上汽大众全新途观L PRO正..

汽车电瓶能用几年？瓦尔塔、骆驼、风帆怎么选？一次性给你讲清楚..

咱们汽车上都有一个小电瓶，这个小电瓶的作用就是用来启动发动机的，一旦..

关于作者

舞月(普通会员)

文章

1083

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

DeepSeek 究竟是个啥？一文带你看明白

2个月前

04

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

05

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

标签云

成员 网址收录40404 企业收录2983 印章生成239783 电子证书1065 电子名片60 自媒体61027

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索