当前位置: 首页 - 手机 - 科技小手工制作仿佛ChatGPT拥有耳朵能听懂语音的它来了你想问什么就扔进去10小时录音问什么都可以

科技小手工制作仿佛ChatGPT拥有耳朵能听懂语音的它来了你想问什么就扔进去10小时录音问什么都可以

2025-02-23 手机 0

机器之心报道

编辑:张倩

在 ChatGPT 的模仿者中,一项突破性的技术使得用户能够直接将语音文件粘贴到输入框中。随着大型语言模型(LLM)的普及,它们正在重塑各个行业的用户体验。不过,开发一款以人类语音为基础的生成式人工智能产品仍然充满挑战,因为处理音频文件对这些模型来说是一个棘手的问题。

一个困难之处在于,大型语言模型受到其上下文窗口限制。在将音频文件输入到它们之前,这些文件需要被转换成文字。长时间的录音更是增加了这一工程上的复杂性。但是,在工作场景中,我们往往需要处理数小时甚至数天的会议记录、访谈等长篇文献,以提取关键信息或回答特定问题。

最近,AssemblyAI——一家专注于语音识别技术的公司——推出了名为LeMUR的大型语言模型。这款新工具就像ChatGPT那样能处理庞大的PDF文档一样,LeMUR可以轻松地处理10小时以上的录音数据,将其转录并提炼出核心内容,并且还能回答用户的问题。

安全与可靠性保证

由于LeMUR集成了严格的安全措施和内容过滤系统,它能够提供经过筛选、不易产生有害或偏见信息的一系列回应。

在页面右侧,我们可以通过交互界面要求LeMUR总结采访内容或者回答我们的疑问。据观察,LeMUR表现出的功能非常强大,可以高效完成多种任务:

尽管如此,目前看来LeMUR似乎不支持中文。如果你对此感兴趣,可以尝试一下它最新版本是否已经解决了这一问题。

标签: 华为手机商城官网价格新款手机哪款性价比高京东手机商城oppo手机哪个系列最好手机大全图片