当前位置: 首页 - 智能 - 教育与科技新篇章ChatGPT的多模态功能何时才能以明年的面目向我们揭晓

教育与科技新篇章ChatGPT的多模态功能何时才能以明年的面目向我们揭晓

2025-02-08 智能 0

品玩6月1日讯,据 HumanLoop 创始人 Raza Habib 近日与 OpenAI 高层包括 Sam Altman 及其他 20 位开发者进行的闭门讨论中透露的一些关键信息,显示了 OpenAI 未来发展战略的轮廓。首先,当前的 GPU 限制成为本次讨论中的共同话题之一,因为这些资源严重不足已延缓了许多短期计划推进。客户对 API 的可靠性和速度感到不满,这些问题大多数源自 GPU 短缺。

此外,即使是较长的 32k 上下文也无法普及,更大的上下文(如10万-1M令牌)目前还在研究阶段,需要突破 O(n^2) 注意力扩展的问题。微调 API 也受限于GPU可用性,而有效的微调方法,如适配器或洛拉尚未被应用,因此微调运行和管理依旧非常计算密集型。未来预计将提供更好的微调支持,并可能推出社区贡献模型市场。

专有容量产品同样受到GPU可用性的影响,其中OpenAI为客户提供私人模型副本,但访问此服务需预先承诺10万美元支出。此外,Sam分享了他认为OpenAI近期API路线图的大致内容:

2023年:更便宜、更快的GPT-4是他们主要目标,以降低“智能成本”。随着时间推移,他们努力继续降低API成本。此外,将来可能会实现更长上下文窗口(高达100万令牌)以及对最新模型进行微调支持。

2024年:多模态功能作为GPT-4版本的一部分进行展示,但由于GPU数量有限,这项功能暂时只能给予少数用户体验。在这之前,一有状态的API将取代现有的聊天记录传递机制,使得调用方无需反复传递相同对话历史并重复支付令牌费用。

值得注意的是,由于插件功能尚未完全成熟,其通过API访问ChatGPT能力不会很快见光。这背后原因是插件使用表明它们还没有达到产品市场定位(PMF)。同时,不少开发者担心当OpenAI发布竞争性产品时,对使用其API构建应用程序的情绪会变得紧张。然而Sam表示OpenAI不会发布超越ChatGPT以外更多产品,因为伟大的平台公司往往拥有杀手级应用程序,而ChatGPT正成为其改善API性能的手段之一。

尽管如此,在监管方面,有声音呼吁对未来模型加以约束,但Sam认为现存模型并不危险,他强烈主张开源,并指出OpenAI正在考虑开源其旗舰模型GPT-3。不过,由于托管和维护巨型LLM所需的人才和资源匮乏,这一决定仍待考量。

最后,与之相关的一个重要事实是,无论如何,“规模化”效应仍然有效,即使我们已经取得了一定的进步,也不能忽视进一步扩展带来的潜能。这意味着AGI开发可能比人们想象中要接近,而且缩放效应持续存在的事实对于AGI实现时间具有重大意义。如果这一点成立,那么AGI可能会比一般预期要早到来。

标签: ai机器人下载电视万能遥控器中国未来人工智能龙头人工智能包括哪些智能家居的优势与劣势