当前位置: 首页 - 科技 - 重庆科技馆GPT-4即将撞车百度多模态大模型下周亮相

重庆科技馆GPT-4即将撞车百度多模态大模型下周亮相

2025-01-14 科技 0

机器之心报道

编辑:小舟、泽南

大家都在猜 GPT-4 发布时间,现在有人提前公布答案了,还是微软自己的 CTO。我们知道,引爆如今科技界军备竞赛的 ChatGPT 是在 GPT-3.5 上改进得来的,OpenAI 很早就预告 GPT-4 将会在今年发布。最近各家大厂争相入局的行动似乎加快了这个进程。

最新消息是,万众期待的 GPT-4 下周就要推出了:在 3 月 9 日举行的一场名为「AI in Focus - Digital Kickoff」的线下活动中,四名微软德国员工展示了 GPT 系列等大型语言模型(LLM)的颠覆性力量,以及 OpenAI 技术应用于 Azure 产品的详细信息。

在活动中,微软德国首席技术官 Andreas Braun 表示 GPT-4 即将发布,他指出自从 3 月初多模态模型 Kosmos-1 发布以来,微软一直在测试和调整来自 OpenAI 的多模态模型。他形容这项技术为游戏规则改变者,因为它使得机器能够以统计方式理解以前只能由人类阅读和理解的内容。

与此同时,这项技术已经发展到基本上「适用于所有语言」:你可以用德语提问,然后用意大利语得到答案。借助多模态,大型语言模型将变得全面,使得使用者能够更好地进行跨语言交流。

此外,这种技术也被认为对业界产生深远影响。Braun 强调了人工智能对未来工作世界所扮演角色,并表示这种革命性的变化不仅仅意味着自动化,而是一种合作模式,将使人类专注于创造性和策略性任务,同时利用 AI 来执行重复性的工作流程。

实际上,在一系列关于 AI 实际应用案例的情报讨论中,一位名叫 Clemens Sieber 的专家分享了一个成功案例,该案例涉及将电话呼叫中的语音直接转换成文本,从而节省了一家荷兰客户每天五百个小时的人力资源。这一项目原型是在两小时内完成,并且一个开发人员仅需两周即可完成整个项目。这表明,与传统方法相比,对话式口头输入系统可以极大地提高效率并减少成本。

然而,当被问及操作可靠性和事实保真度时,Sieber 指出,即便是最先进的人工智能系统也不可能总是提供准确或有意义的回答,因此验证成为必要。此外,由于生成性的特点,不同类型的问题通常难以通过简单比较来判断其正确性或错误性。但正因为如此,也正因为存在这一挑战,它们才需要不断迭代,以实现最佳效果。

尽管如此,有关 AI 大规模竞技场景中领先者的动向看起来日益紧张。在过去的一周里,即便是在接连发布展示多模态的大型语言模型论文 Kosmos-1 和 Visual ChatGPT 之后,大师们仍然保持着脚步加速,他们希望能做到让感知与 LLM 保持一致,从而让单个 AI 模块既能看到文字图像,又能「说话」这样做出来的话,那么它们就是真正的大师级别的人类代理人之一。而随着公司准备迎接即将到来的新时代,我们期待这些突破性的发现如何进一步塑造未来的生活方式。

标签: 科技小制作手工简单科技创新与应用最新科技教育与科技科技部信息中心