当前位置: 首页 - 数码 - OpenAI新语音系统Whisper仿佛一位和平精英免费开启科技软件的智慧守护者英文识别能力如同人类

OpenAI新语音系统Whisper仿佛一位和平精英免费开启科技软件的智慧守护者英文识别能力如同人类

2025-03-15 数码 0

9月21日,OpenAI 推出了名为「Whisper」的新技术,这是一种使用了68万小时的多语音和多任务监督数据训练的自动语音识别(ASR)系统。据称,其在英语语音识别方面已达到了人类水平的鲁棒性和准确性。

「Whisper」通过集成来自网络的大量数据,提高了对口音、背景噪音以及专业术语的识别能力。这与之前研究表明,无监督预训练可以显著提升模型质量,但由于缺乏高质量同等数据集,因此在一定程度上限制了模型的有效性。相比之下,有监督预训练则显示出更高的鲁棒性。

OpenAI 在「Whisper」中采取了一种新的方法,即扩展弱监督语音识别至68万小时,并展示了即使在这种规模下,所训练模型也能实现高质量结果而无需特定于数据集的小幅调整。

前特斯拉人工智能和自动驾驶部门负责人 Andrej Karpathy 表示 OpenAI 正处于最佳状态,而对于这个新技术,一些用户仍有疑虑。例如,网友 Vincent Lordier 提问,如果类似 GTP-3 和 Dalle-2 中出现过言论控制问题,那么是否也会在使用「Whisper」时出现?

随着这项技术逐渐被应用,我们将看到它如何影响我们的交流方式,以及人们对其隐私保护措施的反应。

参考链接:https://openai.com/blog/whisper/

标签: 数码电子排行榜前十名优衣库数码产品讨论平台数码宝贝4电子科技大学