当前位置: 首页 - 手机 - 科技资讯网站的耳朵终于长出来了10小时语音宝库随心提问就像对话老朋友一样

科技资讯网站的耳朵终于长出来了10小时语音宝库随心提问就像对话老朋友一样

2025-02-23 手机 0

机器之心科技

编辑:张倩

革新传统界限,语音转录即将迎来新纪元。

大型语言模型(LLM)的普及正在重塑各行各业的用户体验。然而,将人类声音融入生成式人工智能系统仍面临诸多挑战,因为音频文件对这些模型构成了一道难题。

将 LLM 应用于音频记录的关键难题在于其上下文窗口限制。在一个长时间的语音记录被输入到 LLM 之前,它首先需要被转换为文字形式。随着音频文件长度的增加,绕过这个限制所需的技术努力也随之增长。不过,在实际工作场景中,我们往往需要处理数小时甚至数天的长篇会议录音、访谈等,以提取核心信息或寻找特定问题答案……

最近,一家专注于语音识别的人工智能公司 AssemblyAI 推出了名为 LeMUR 的革命性模型。这款产品就像 ChatGPT 对待庞大的 PDF 文档一样,LeMUR 能够处理十小时以上的录音内容,从中进行准确转录、提炼核心要点,并回答用户的问题。

安全可靠输出保证

由于 LeMUR 内置了严格安全措施和内容审查系统,它能够提供经过净化处理的大型语言模型回应,这些回应极少可能出现有害或偏见性的表达。

在页面右侧,我们可以通过交互界面要求 LeMUR 提供采访总结或直接回答问题。LeMUR 在完成任务方面展现出惊人的效能:

然而,目前看来 LeMUR 似乎并不支持中文使用。如果你对此感兴趣,可以亲自尝试一下它是否适合你的需求。

标签: 手机网页华为官网商城手机索尼新机华硕手机官网近期最值得入手的手机