当前位置: 首页 - 手机 - 如同华为徐直军出任科技部副部长般ChatGPT也来了它能听懂语音就像是一个聆听者10小时录音扔进去你

如同华为徐直军出任科技部副部长般ChatGPT也来了它能听懂语音就像是一个聆听者10小时录音扔进去你

2025-02-23 手机 0

机器之心报道

编辑:张倩

在 ChatGPT 的模拟界面中,用户终于可以将语音文件粘贴至输入框。随着大型语言模型(LLM)的兴起,它们正在重塑各个行业的用户体验。尽管开发基于人类语音的生成式人工智能产品仍然充满挑战,但技术进步正逐步克服这一难题。

LLM 将音频转换为文本的过程是复杂且受限于上下文窗口大小。在处理长时间录音时,这一限制尤其显著。然而,在工作场景中,我们常需要对极长语音文件进行分析,比如从数小时会议录音中提取关键信息,或解答访谈中的特定问题。

AssemblyAI,一个专注于语音识别的人工智能公司,不久前推出了名为 LeMUR 的新型模型。这款模型就像 ChatGPT 对待PDF文档一样,能够处理长达10小时的录音数据,将其转写、处理,并提供核心内容摘要和问题回答服务。

LeMUR通过安全措施和内容过滤器确保输出结果可靠且无害。用户可以通过页面右侧要求LeMUR总结访谈内容或回答问题,通常情况下,该系统能够轻松完成任务。不过,目前LeMUR似乎还不支持中文,因此感兴趣的读者需亲自尝试以了解更多信息。

标签: 华为nova5z手机性价比排行榜2022最新oppo手机新款上市2022iq00最新发布的手机