当前位置: 首页 - 手机 - 如同五年级科技小制作大全最简单的乐章ChatGPT以10小时的语音之河为背景让我们在这澎湃的知识海洋

如同五年级科技小制作大全最简单的乐章ChatGPT以10小时的语音之河为背景让我们在这澎湃的知识海洋

2025-02-23 手机 0

机器之心报道

编辑:张倩

在ChatGPT的模拟界面中,用户终于可以将语音文件粘贴至输入框。

随着大型语言模型(LLM)的广泛应用,它们正改变各行各业的用户体验。然而,将人类的声音转化为生成式人工智能产品仍然充满挑战,因为处理音频数据对LLM而言是一项艰巨任务。

将LLM与音频文件结合使用的一个主要难题是其上下文窗口限制。在LLM能够接收一个音频文件之前,该文件首先需要被转换成文字。如果音频内容庞大,突破这个限制就变得更加困难。然而,在工作场景中,我们常常需要从数小时的会议录音或长篇访谈中提取关键信息、找出特定问题答案……

最近,AssemblyAI公司推出了名为LeMUR的新一代语音识别AI模型。就像ChatGPT高效处理大量PDF文档一样,LeMUR能够将10小时以上的录音进行准确转录,并帮助用户总结核心内容,还能回答他们的问题。

安全可靠输出保证

由于LeMUR内置了强大的安全措施和内容过滤系统,它提供给用户的是经过严格审查且不含有害或偏见语言的回应。

页面右侧,我们可以通过简单操作要求LeMUR概述采访内容或者回答疑问。尽管目前看来它似乎还未支持中文,但它已经表现出了极高的工作效率:

不过,这款神奇工具似乎尚未开放中文功能测试,如果你对此感兴趣,可以尝试一下看看它是否真的能超越语言壁垒。

标签: 1000-1500元性价比最高的手机目前最新手机锤子手机oppo一千元左右5g手机2023年最建议买的手机