2025-02-23 手机 0
机器之心报道
编辑:张倩
在深邃的技术海洋中,ChatGPT的输入框如同一扇通往知识宝库的大门,现在不仅能接受文字信息,更可以粘贴语音文件,让大型语言模型(LLM)与人类交流更加无缝。
每一个行业都在被大型语言模型改变,但将其应用于以人类语音为中心的生成式人工智能产品却是个巨大的挑战。因为,音频文件对这些模型来说就像是一座难以逾越的山峰。
要让LLM理解和处理音频文件,我们首先需要将它们转换成文本,这个过程就像是从山谷里爬上高峰。随着音频文件长度的增加,这个工程任务变得愈发艰巨。但是,在我们的工作生活中,我们经常需要处理长达几个小时甚至几天的会议录音、访谈录等,以便提取核心内容或找到特定问题答案。
最近,一家名为AssemblyAI的公司推出了一个名为LeMUR的大型语言模型。它就像是一个超级助理,可以帮我们解决这个难题。LeMUR能够处理10小时以上的录音,将其转换成文本,并且帮助我们总结核心内容,还能回答我们的疑问,就像拥有了一个无所不知的小智慧伙伴。
安全可靠
LeMUR内置了严格的人工智能安全措施和内容过滤系统,因此提供给我们的回应是经过精细打磨,不会出现有害或带偏见的情绪表达,使得用户体验更加舒适和专业。
页面右侧,我们可以轻松地要求LeMUR进行采访总结或回答问题,它似乎擅长完成所有任务:
然而,遗憾的是,目前LeMUR还无法支持中文。如果你对这个功能感兴趣,可以去试试看一下,它可能会成为你的新好友。