当前位置: 首页 - 手机 - 教育与科技的新宠儿能听懂语音的ChatGPT犹如海洋中捕捞宝藏般将10小时录音投入其中你可以问什么都

教育与科技的新宠儿能听懂语音的ChatGPT犹如海洋中捕捞宝藏般将10小时录音投入其中你可以问什么都

2025-02-23 手机 0

机器之心专报

编辑:张倩

突破性进展!现在你可以直接在类 ChatGPT 的输入框中粘贴语音文件了。

大型语言模型(LLM)正以其革新性的方式重塑各个行业的用户体验。然而,开发一个基于人类语音的生成式人工智能产品仍然面临着诸多挑战,其中之一就是如何让这些模型处理音频数据。

将 LLM 应用于长时间录制的音频文件的一大难题在于,它们需要先被转换成文本。由于这项工作量随着录音时长的增加而急剧增长,而大型语言模型又受限于其上下文窗口,因此我们很难找到有效解决方案。不过,在实际应用场景中,我们往往需要处理数小时甚至数天的会议记录、访谈等长篇文献,从中提取关键信息或寻找特定问题答案……

最近,一家名为 AssemblyAI 的公司推出了一个全新的语音识别 AI 模型——LeMUR。这款神奇工具就像能够轻松解析几十页 PDF 文档一样,可以将整个10小时的声音资料转录并整理,然后提供核心要点,并回答用户的问题。

安全可靠,输出精准

LeMUR 内置了严格的安全措施和内容过滤系统,这意味着它能为用户提供一系列经过审查且不带有害意或偏见的话题回应。

通过页面右侧,我们可以指导 LeMUR 来总结采访内容或者回答疑问。据观察,LeMUR 在完成任务上表现得相当出色:

值得注意的是,目前 LeMUR 似乎尚未支持中文。如果你对这个功能感兴趣,不妨亲自试试看一下。

标签: vivo手机2021最新款vivo手机哪款性价比最高oppo手机全部型号及价格魅蓝2021手机性价比排行榜