当前位置: 首页 - 数码 - OpenAI新语音系统Whisper仿佛拥有人类级别的英文识别能力让论文研究者如获宝贵之财

OpenAI新语音系统Whisper仿佛拥有人类级别的英文识别能力让论文研究者如获宝贵之财

2025-03-15 数码 0

9月21日,OpenAI 推出名为「Whisper」的高级自动语音识别系统,该系统在英语语音识别方面达到了人类水平的性能。该系统是通过训练一个神经网络模型,并利用了来自网上的68万小时多样化数据集来实现的。

研究团队发现,这种大规模且多样化的数据集能够提高模型对不同口音、背景噪音以及专业术语的适应能力。这与之前一些研究显示,无监督预训练可以显著提升音频编码器质量,但由于缺乏同等质量的预训练和特定微调协议,因此其有效性和鲁棒性受到限制。而有监督方式预训练语音识别系统则表现出了更高的鲁棒性。

在「Whisper」中,OpenAI 通过扩展弱监督语音识别到68万小时并展示了这种规模下模型在现有数据集上零错误转移性能,从而消除了任何特定于数据集微调带来的影响,以实现高质量结果。

前特斯拉人工智能和自动驾驶部门负责人 Andrej Karpathy 也赞扬了这一成就,将其视为公司目前最好的状态之一。不过,有用户仍然对使用「Whisper」存在疑虑,担心是否会出现类似GPT-3 和 Dalle-2 中言论编辑删除的问题。

因此,对于这个问题各界都进行了一些讨论。对于如何看待这一技术进步,以及它可能带来的潜在风险和应用,我们期待着更多的声音。参考链接:https://openai.com/blog/whisper/

标签: 推特小米11pro中关村下载软件官网数码大冒险无限钻石版最新版腾讯网