2025-01-14 科技 0
机器之心报道
编辑:小舟、泽南
大家都在猜 GPT-4 发布时间,现在有人提前公布答案了,还是微软自己的 CTO。我们知道,引爆如今科技界军备竞赛的 ChatGPT 是在 GPT-3.5 上改进得来的,OpenAI 很早就预告 GPT-4 将会在今年发布。最近各家大厂争相入局的行动似乎加快了这个进程。
最新消息是,万众期待的 GPT-4 下周就要推出了:在 3 月 9 日举行的一场名为「AI in Focus - Digital Kickoff」的线下活动中,四名微软德国员工展示了 GPT 系列等大型语言模型(LLM)的颠覆性力量,以及 OpenAI 技术应用于 Azure 产品的详细信息。
在活动中,微软德国首席技术官 Andreas Braun 表示 GPT-4 即将发布,他强调这是一款多模态的大模型,将提供完全不同的可能性 —— 比如视频生成能力。他形容这种方法为游戏规则改变者,因为人们通过这种方式让机器理解自然语言,那么机器就能以统计方式理解以前只能由人类阅读和理解的内容。
与此同时,这项技术已经发展到基本上「适用于所有语言」:你可以用德语提问,然后用意大利语得到答案。借助多模态,大型软件公司和 OpenAI 将使「模型变得全面」,实现从文本到图像再到音乐和视频等不同形式之间无缝转换。
微软德国公司首席执行官 Marianne Janik 全面谈到了人工智能对业界的颠覆性影响。她强调了人工智能价值创造潜力,并表示当前的人工智能发展和 ChatGPT 是「iPhone 发布一样的时刻」。她表示,这不是要代替人类工作,而是帮助人们以不同于以往的方式完成重复性任务。
Janik 强调说,这意味着「许多专家会开始利用 AI 实现价值增长」。传统工作行为正在发生变化,由于新的可能性出现,也会产生全新的职业。她建议公司成立内部「能力中心」,培训员工使用人工智能并将想法整合到项目中。此外,她还强调,微软不会使用客户数据来训练模型,但值得注意的是,他们可能会与研究合作伙伴 OpenAI 共享数据进行研究。
实际上,有两位 AI 技术专家 Clemens Sieber 和 Holger Kenn 提供了关于 AI 实际使用的一些信息。他们讲解了用例涉及的技术,其中包括嵌入,对于中文本内部表征以及负责任地内置到产品中的 API 模式化功能,以便云端处理数百万个查询。此外,还有一个项目能够直接将电话呼叫转录成文本,为一家荷兰客户节省每天 500 个小时工作时间。这项原型仅花费两个小时创建,一位开发人员仅需两周即可完成该项目。在三个最常见用例中,有三种情况涉及回答只有员工才能访问到的公司信息、半自动化口语处理以及文档辅助处理。
当被问及操作可靠性和事实保真度时,Siebler 表示虽然 AI 可能不总是正确回答,因此需要验证过程。他指出,在迭代反馈循环中包含赞成和反对意见,是解决这一问题的一个重要步骤。而且,不同用户可能根据自己的需求选择只使用他们自己的数据集进行测试,这样通常结果就会比较准确。不过,由于生成性的特点,使得验证起来更加困难,即使如此,对话仍然是一个不断优化过程。
看来,在 AI 大模型竞争激烈的情况下,无论哪一方领先,都希望尽快推动这一领域向前发展。微软近期连续发布展示多模态论文 Kosmos-1 和 Visual ChatGPT 的演示材料,他们显然支持这一趋势,并希望通过感知与 LLM 保持一致,让单个 AI 模型既能看到文字图片又能“说话”。
接下来,我们期待 Microsft 在即将到来的 3 月 16 日晚上的活动上是否会正式宣布 GTP-4 的推出。如果真的如此,那么它或许能够超越之前版本带给我们的惊喜。但我们也不能忽视百度紧随其后,以相同日子计划推出类似聊天机器人的功能。在春节假期之后,就有报道称李彦宏要求包括自动驾驶部门在内全体研发团队投入资源支持文心一言开发。这一切都暗示着未来几周里,我们很可能迎来科技界重大变革之一——而正是在这些变革背后,是那些充满创意与智慧的人们不断追求创新所驱动。