2025-02-23 手机 0
机器之心报道
编辑:张倩
在 ChatGPT 的模仿者中,一项突破性的技术已经实现了对语音文档的粘贴功能。
大型语言模型(LLM)正席卷各个行业,重塑用户的期望。然而,将人类的声音融入生成式人工智能产品仍然充满挑战,因为它需要处理复杂的音频文件。
转换长时间录音为可输入给 LLM 的文本,是一项艰巨任务。随着录音时长增加,绕过上下文窗口限制变得更加困难。但工作场所经常要求我们分析数小时会议记录或访谈内容,以提取关键信息或回答特定问题……
最近,AssemblyAI 推出了名为 LeMUR 的新工具,它就像让 ChatGPT 处理庞大PDF资料一样,可以处理10小时以上的录音数据,对其进行转写、整理,并总结核心内容。此外,LeMUR 还能回答用户的问题,就像拥有一个聪明的大脑一样帮助解答疑惑。
安全且准确的输出保证
由于 LeMUR 内置了安全措施和内容审查系统,它能够提供经过严格筛选的回应,这些回应极少可能包含有害或带偏见的情感表达。
在页面右侧,我们可以轻松地指导 LeMUR 总结访谈笔记或者直接提出问题。LeMUR 显得非常高效,无需多余努力就能完成所有任务:
但目前看来,LeMUR 尚未支持中文。如果你对此感到好奇,不妨亲自尝试一下这项技术。