> 自媒体 > (AI)人工智能 > 基于OpenAI Whisper开发的开源、可离线实时语音转文字软件:buzz
基于OpenAI Whisper开发的开源、可离线实时语音转文字软件:buzz
来源:运维开发木子李
2023-08-02 17:57:40
1268
管理

#暑期创作大赛#

功能:导入音频和视频文件并将文字记录导出为 TXT、SRT 和 VTT从计算机麦克风转录和翻译为文本(资源密集型且可能不是实时的)支持Whisper、 Whisper.cpp、Faster Whisper、 Whisper 兼容的 Hugging Face 模型和OpenAI Whisper API命令行界面适用于 Mac、Windows 和 Linux安装:

要安装 Buzz,请下载适合您的操作系统的最新版本。Buzz 可在Mac (Intel)、Windows和Linux上使用。(对于 Apple Silicon,请参阅App Store 版本。)

macOS(英特尔、macOS 11.7 及更高版本)

通过brew安装:

brew install --cask buzzPlain Text

或者,下载并运行该Buzz-x.y.z.dmg文件。

对于 Mac Silicon(以及为了在 Mac Intel 上获得更好的体验),请 在 App Store 上下载Buzz Captions 。

Windows(Windows 10 及更高版本)

下载并运行该Buzz-x.y.z.exe文件。

Linux

sudo apt-get install libportaudio2sudo snap install buzzPlain Text

或者,在 Ubuntu 20.04 及更高版本上,安装依赖项:

sudo apt-get install libportaudio2Plain Text

然后,下载并解压Buzz-x.y.z-unix.tar.gz文件

用法:

要导入文件:

单击“文件”菜单上的“导入媒体文件”(或工具栏上的“ ”图标,或Command/Ctrl O)。选择音频或视频文件。选择任务、语言和模型设置。单击运行。当转录状态显示“已完成”时,双击该行(或选择该行并单击“⤢”图标)以打开转录。

场地

选项

默认

描述

导出为

“TXT”、“SRT”、“VTT”

“TXT”

导出文件格式

字级时序

关/开

离开

如果选中,转录将为音频中的每个单词生成单独的字幕行。

仅当“导出为”设置为“SRT”或“VTT”时启用。

(有关任务、语言和质量设置的更多信息,请参阅实时录制部分。)

现场录音

要开始现场录音:

选择录音任务、语言、质量和麦克风。单击“录制”。

注意:使用默认 Whisper 模型转录音频会占用大量资源。考虑使用 Whisper.cpp Tiny 模型来获得实时性能。

场地

选项

默认

描述

任务

“转录”、“翻译”

“录制”

“转录”将输入音频转换为所选语言的文本,而“翻译”将其转换为英语文本。

语言

有关受支持语言的完整列表,

请参阅

Whisper 的文档

“检测语言”

“检测语言”将尝试根据前几秒检测音频中的口语。

但是,建议选择一种语言(如果已知),因为它在许多情况下会提高转录质量。

质量

“非常低”、“低”、“中”、“高”

“非常低”

转录质量决定了用于转录的 Whisper 模型。

《Very Low》采用的是“tiny”模型;

“Low”使用“base”模型;

“中”使用“小”模型;

“高”使用“中”模型。

较大的模型会产生更高质量的转录,但需要更多的系统资源。

有关模型的更多信息,

请参阅

Whisper 的文档。

麦克风

[可用的系统麦克风]

[默认系统麦克风]

用于录制输入音频的麦克风。

录制从计算机 (macOS )

要录制计算机上应用程序播放的音频,您可以安装音频环回驱动程序(允许您创建虚拟音频设备的程序)。本指南的其余部分将在 Mac 上使用BlackHole,但您可以使用适合您操作系统的其他替代方案(请参阅LoopBeAudio、LoopBack和Virtual Audio Cable)。

1.通过 Homebrew安装

BlackHolebrew install blackhole-2chPlain Text

2.从 Spotlight 或 中打开音频 MIDI 设置/Applications/Utilities/Audio Midi Setup.app。

4.单击左下角的“ ”图标,然后选择“创建多输出设备”。

5.将默认扬声器和 BlackHole 添加到多输出设备。

6.选择此多输出设备作为扬声器(应用程序或系统范围)以在 BlackHole 中播放音频。

7.打开 Buzz,选择 BlackHole 作为麦克风,然后像以前一样进行录制,以查看通过 BlackHole 播放的音频的转录。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
Chatgpt ?别告诉我你还不会用
近期最热门的话题之一,要数chatgpt了,那么什么是chatgpt?它又能给我们..
最新全球社交软件排名,看看微信排第几?
根据《2022年全球数字概览》报告显示,全球社交媒体用户超过46.2亿,相当..
别被火爆全网的ChatGPT“骗了”
深燃(shenrancaijing)原创作者 | 王敏编辑 | 向小园AI要“逆天”?12月..
ChatGPT:关于人工智能聊天机器人,这里有你要知道的一切..
ChatGPT 是 OpenAI 的文本生成人工智能聊天机器人,风靡全球。它能够根据..
GPT-4神秘面纱揭晓,告别单调聊天机器人,它的能力究竟有多强?..
一、GPT-4的起源与原理作为OpenAI的最新力作,GPT-4(即第四代生成预训练..
怎么实时同步别人微信聊天,怎么同步对方微信到自己手机上..
如何实时同步别人微信聊天1. 引言微信已经成为现代社交中不可或缺的一部..
教你恢复微信聊天记录的方法,不管用啥手机,一查一个准,太棒了..
教你两招立马恢复删除的微信聊天记录,不管你使用的是啥手机都可以恢复,..
ChatGPT催生敏捷治理,“问数湾区”探讨AI数治创新
ChatGPT等人工智能大模型的“狂飙”,正为全球带来一场翻天覆地的变革。4..
打不过就加入!“杀猪盘”短信沦为网友发疯工具?冲上热搜了……..
10月14日微博热搜出现了一则很有趣的话题——#杀猪盘短信已然沦为网友发..
关于作者
小北(普通会员)
文章
502
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40348 企业收录2981 印章生成209365 电子证书892 电子名片56 自媒体30867

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索