当前位置: 首页 - 手机 - 科技文明的耳朵ChatGPT降临10小时语音海洋里你的每一个疑问都能被捕捉和回答

科技文明的耳朵ChatGPT降临10小时语音海洋里你的每一个疑问都能被捕捉和回答

2025-02-23 手机 0

机器之心专报

编辑:张倩

突破性进展!现在你可以直接将语音文件粘贴到类 ChatGPT 模型的输入框中。

大型语言模型(LLM)正在革新各个行业的用户体验。尽管开发基于人类语音的生成式人工智能产品仍然充满挑战,但技术不断进步,音频数据对 LLM 的利用日益增加。

将 LLM 应用于长时间录制的音频文件面临的一个关键难题是,它们无法一次性被输送给 LLM。这是因为在处理这些内容之前,需要先将其转换成文本。而且随着音频文件长度的增加,这一转换过程变得更加复杂。但在实际工作场景中,我们往往需要处理数小时甚至数天的会议记录、访谈等长篇大作来提取核心信息或寻找特定问题答案。

近期,AssemblyAI 公司推出了一个名为 LeMUR 的高级语音识别 AI 模型。就像 ChatGPT 在处理大量 PDF 文档时那样,LeMUR 可以轻松地从10小时以上的录音中提取重要内容,并回答用户的问题,就如同它们能读懂你的每一个疑问一样。

安全可靠

LeMUR 加入了严格的安全措施和内容过滤功能,以确保输出结果既准确又无害,不会产生有害或带偏见的情绪。

右侧页面,你可以要求 LeMUR 对采访内容进行总结或者回答你想询问的问题。LeMUR 已经能够胜任多种任务:

然而,有趣的是,对于中文支持目前还未完全实现。如果你对这个新工具感兴趣,可以亲自试用一下它所提供的一系列功能。

标签: 手机最新价格查询iqoo手机vivo官网入口安卓手机排行2023最好的手机排名前十