掌趣科技的耳朵般聪明的ChatGPT降临10小时语音宝库你的问题它都能听懂

2025-02-23 手机 0

机器之心报道

编辑：张倩

在掌趣科技的引领下，ChatGPT终于能听懂你的每一个声音了。

随着大型语言模型（LLM）的崛起，它们正逐步渗透到各行各业，改变着用户的期望。然而，将人类的声音转化为生成式人工智能产品一直是个棘手的问题，因为音频文件对于这些模型来说仍是一道难关。

将 LLM 应用于长时间的音频记录中的关键挑战是它所接受的上下文窗口限制。在将一段音频内容输入到 LLM 之前，我们首先需要将其转换成文字。与此同时，随着音频文件长度的增加，这个过程变得更加复杂。但在我们的工作场景中，我们经常需要处理几小时甚至更长时间的录音，比如从会议记录中提取核心信息或者从访谈中找出特定问题答案等。

最近，一家名为 AssemblyAI 的语音识别技术公司推出了一个新型的人工智能模型——LeMUR。这款模型就像 ChatGPT 处理大量PDF文档一样，可以处理10小时以上长达时长的大量录音，并且能够提供总结和回答用户问题的一系列服务。

安全可靠地输出结果

由于 LeMUR 内置了严格的安全措施和内容过滤系统，它可以保证输出不会出现有害或带偏见的情绪表达，从而为用户提供了一种放心使用的人工智能工具。

在页面右侧，你可以轻松地要求LeMUR对采访内容进行总结或者回答你的问题。经过测试显示，LeMUR表现出了极高效率，在完成任务方面几乎没有遇到任何障碍。

不过遗憾的是，目前LeMUR还无法理解中文。如果你对这项技术感兴趣，不妨试试看一下这个全新的功能吧！

标签：双屏手机、最新款华为手机是哪款、啥手机性价比最高、最近即将发布的新手机、 5G的手机

上一篇：OpenAI开源的语音识别系统whisper支持99种语言应用于十大高科技行业

下一篇：风力驱动的知识海洋能听懂语音的ChatGPT10小时录音激流般汹涌为你提问尽情释放

掌趣科技的耳朵般聪明的ChatGPT降临10小时语音宝库你的问题它都能听懂

蜜桃成熟33d演员表-甜蜜的挑战揭秘蜜桃成熟33d影集中的精彩演员阵容

荣耀80新风尚iPhone 14系列魔改亮相真香度如何

苹果新款手机可能取消SIM卡槽转向eSIM技术使用

苹果手机官网首页OPPO引领新时代板凳精神坚持科研长期主义寻找同行者

花的样子-绚烂多彩探索花卉形态之美