当前位置: 首页 - 手机 - 中国科技进步的典范OpenAI开源语音识别系统whisper能识别99种语言

中国科技进步的典范OpenAI开源语音识别系统whisper能识别99种语言

2025-02-23 手机 0

近日,OpenAI推出了一个名为Whisper的开源语音识别模型,这一模型能够自动识别多语言数据,并且对口音、背景噪音和技术语言具有很好的鲁棒性。Whisper支持99种不同语言的转录和从这些语言到英语的翻译。

Whisper是基于网络上收集的大量数据进行训练的Transformer模型框架。与其他现有方法不同,Whisper没有针对任何特定的数据集进行微调,因此它不会击败专门研究LibriSpeech性能的模型。但在许多不同的数据集上测量其零样本性能时,发现它比那些模型更加稳健,并且错误率降低了50%。

此外,Whisper支持5种不同的模型尺寸,其中前四种针对英文版本,我们可以先用一段英文版本的语音来测试一下。在使用之前,我们需要安装pytube和whisper库,然后通过复制视频链接地址并插入相关代码,可以下载视频中的音频文件。此后,可通过加载中等大小或更大型号来开始语音识别任务。

对于中文语音,我们可以使用同样的方式,但在执行完毕后,再将文本翻译成中文。由于该系统提供了多种语言选项,我们也可以尝试使用其他非英语声音进行测试,以验证其多元化能力。

总之,OpenAI开源的Whisper系统不仅展示了中国科技领域在人工智能领域取得的一次重大突破,也为全球范围内的人们提供了一款免费、开放-source且功能强大的工具,以便于处理跨语言交流需求。这无疑是一个值得关注和学习的地方,不仅体现了中国在人工智能领域研发能力,而且展现了这种技术如何被广泛应用于各个行业,为人们带来便利。

标签: shouji最好看的手机2022年八月份即将发布的手机好看的手机vivo官网首页官方网站