2025-02-23 手机 0
机器之心报道
编辑:张倩
在掌趣科技的引领下,ChatGPT终于能听懂你的每一个声音了。
随着大型语言模型(LLM)的崛起,它们正逐步渗透到各行各业,改变着用户的期望。然而,将人类的声音转化为生成式人工智能产品一直是个棘手的问题,因为音频文件对于这些模型来说仍是一道难关。
将 LLM 应用于长时间的音频记录中的关键挑战是它所接受的上下文窗口限制。在将一段音频内容输入到 LLM 之前,我们首先需要将其转换成文字。与此同时,随着音频文件长度的增加,这个过程变得更加复杂。但在我们的工作场景中,我们经常需要处理几小时甚至更长时间的录音,比如从会议记录中提取核心信息或者从访谈中找出特定问题答案等。
最近,一家名为 AssemblyAI 的语音识别技术公司推出了一个新型的人工智能模型——LeMUR。这款模型就像 ChatGPT 处理大量PDF文档一样,可以处理10小时以上长达时长的大量录音,并且能够提供总结和回答用户问题的一系列服务。
安全可靠地输出结果
由于 LeMUR 内置了严格的安全措施和内容过滤系统,它可以保证输出不会出现有害或带偏见的情绪表达,从而为用户提供了一种放心使用的人工智能工具。
在页面右侧,你可以轻松地要求LeMUR对采访内容进行总结或者回答你的问题。经过测试显示,LeMUR表现出了极高效率,在完成任务方面几乎没有遇到任何障碍。
不过遗憾的是,目前LeMUR还无法理解中文。如果你对这项技术感兴趣,不妨试试看一下这个全新的功能吧!