当前位置: 首页 - 数码 - OpenAI新语音系统Whisper如同魔法师般的耳朵将英文识别能力提升至与人类相当

OpenAI新语音系统Whisper如同魔法师般的耳朵将英文识别能力提升至与人类相当

2025-03-15 数码 0

9月21日,OpenAI 推出了名为「Whisper」的新技术,这是一种使用了68万小时的多语音和多任务监督数据训练的自动语音识别(ASR)系统。据称,其在英语语音识别方面已达到了与人类相当的准确性和鲁棒性。

Whisper 的训练过程中,研究团队发现通过使用庞大且多样化的数据集,可以提高对口音、背景噪声以及特定领域术语等因素的适应能力。这不同于之前的一些研究表明,无监督预训练可以显著提升音频编码器,但由于缺乏同等质量的大规模预训练数据,以及针对特定数据集微调协议,因此存在一定限制。此前部分有监督方式下预训练的语音识别系统表现更高,但其有效性和鲁棒性仍有所局限。

在 Whisper 中,OpenAI 以比现有高质量数据集总和更大的规模进行了弱监督语音识别,并展示了在这样的规模下所训练模型能够在转移现有数据集上实现零错误率,从而消除了任何特定于某一微调协议的问题,从而实现出色的结果。

此外,还有一位前特斯拉人工智能和自动驾驶部门负责人 Andrej Karpathy 在推文中表示 OpenAI 正处于最好的状态。而一些用户也提出了疑虑,比如是否会出现类似 GTP-3 和 Dalle-2 中禁止言论行为的情况?是否会出现 Whisper 编辑或删除用户录制的声音的情况?

因此,这个问题引发了一系列讨论。大家怎么看待这项技术及其潜在应用呢?请参考 OpenAI 官方博客中的详细信息:https://openai.com/blog/whisper/

标签: 欧莱雅数码宝贝进化图猪八戒兽iphone官网csdn官网