2025-02-23 手机 0
机器之心报道
编辑:张倩
在深入挖掘技术前沿的探索中,ChatGPT模仿人类智能的进展再次引人注目。它不仅能够理解和回应复杂的问题,还能将长达10小时的声音记录转化为可供查询的文本信息。
然而,这项任务并非易事。因为大型语言模型(LLM)对处理音频文件存在挑战。在实际应用中,音频文件需要被转换成文字才能输入到LLM系统中。如果是非常长的语音录制,那么如何使其适应LLM上下文窗口限制就变得尤为棘手。这对于工作场景中的需求来说显得尤为重要,比如从几小时会议记录中提取关键点,或是从长篇访谈中找出特定问题答案等。
最近,一家名为AssemblyAI的公司推出了一个新型AI模型—LeMUR,它似乎解决了这一难题。就像ChatGPT可以处理数十页PDF文档一样,LeMUR可以处理10小时以上的录音,并提供核心内容总结以及直接回答用户的问题。
安全且高效
值得一提的是,LeMUR采用了严格的安全措施和内容过滤器来保证输出结果,因此用户可以放心接受来自LLMs回应,而不会受到有害或偏见信息影响。
页面右侧,我们可以轻松地向LeMUR提出要求,无论是整理采访内容还是解答疑惑,都能得到准确迅速的地回答。目前看来,只要你的问题足够清晰,LeMUR都能轻松完成任务。不过,对于那些想尝试中文功能的大众来说,由于当前版本尚未支持中文,该功能可能暂时无法使用,但未来是否会支持仍是一个未知之谜,让我们期待 AssemblyAI 的未来发展吧!
上一篇:循环回响尾气回收工艺之歌
下一篇:主题我这儿有求不锈钢小件加工活