Whisper 介绍
这是什么 Whisper?
Whisper 是 OpenAI 开发的通用语音识别模型。它训练于大量多样化音频数据集,同时是一个多任务模型,能够执行多语言语音识别、语音翻译和语言识别。Whisper 使用 Transformer 序列到序列模型,训练于多种语音处理任务,包括多语言语音识别、语音翻译、口语语言识别和语音活动检测。这些任务被联合表示为解码器需要预测的令牌序列,使单一模型能够替代传统语音处理管线的多个阶段。多任务训练格式使用一组特殊令牌,作为任务指定符或分类目标。
如何使用 Whisper?
Whisper 可通过命令行或 Python 使用。命令行使用时,您可以通过指定音频文件和模型大小来转录音频文件。Python 使用时,您可以加载模型并使用 transcribe() 方法处理音频文件。
为什么选择 Whisper?
如果你想要一个强大、开源的语音识别系统,功能多样,能处理多种语言和口音,选择它准没错。
Whisper 功能特点
AI Speech Recognition
- ✓多语言语音识别
- ✓语音翻译
- ✓语言识别
- ✓语音活动检测
常见问题
价格
价格信息不可用
Whisper 标签
选择评分







