2025-03-15 数码 0
9月21日,OpenAI 推出了名为「Whisper」的新技术,这是一种使用了68万小时的多语音和多任务监督数据训练的自动语音识别(ASR)系统。据称,其在英语语音识别方面已达到了人类水平的鲁棒性和准确性。
「Whisper」通过集成来自网络的广泛数据来提高对口音、背景噪音以及专业术语等因素的适应能力。这一方法与之前研究中的无监督预训练相比,在一定程度上克服了模型有效性和鲁棒性的限制。此外,与部分有监督方式预训练后的语言模型相比,「Whisper」展示出更高的适应力,即便是在零微调的情况下也能实现优质结果。
此前担任特斯拉人工智能及自动驾驶部门负责人的Andrej Karpathy在社交媒体上分享了这一消息,并表示“OpenAI 正处于最佳状态”。然而,对于这种技术的一些用户仍然持怀疑态度,例如网友Vincent Lordier提出了关于言论审查的问题:“是否在使用Whisper时也会出现相关行为?是否可能出现对用户录制内容进行编辑或删除?”这些问题引发了一系列讨论。
随着科技不断进步,我们期待这样的创新能够带来更多积极影响,同时也关注它们如何被合理地应用。参考链接:https://openai.com/blog/whisper/
上一篇:水帘下的世界揭秘喷漆房的艺术魅力