教育与科技新篇章ChatGPT的多模态功能何时才能以明年的面目向我们揭晓

2025-02-08 智能 0

品玩6月1日讯，据 HumanLoop 创始人 Raza Habib 近日与 OpenAI 高层包括 Sam Altman 及其他 20 位开发者进行的闭门讨论中透露的一些关键信息，显示了 OpenAI 未来发展战略的轮廓。首先，当前的 GPU 限制成为本次讨论中的共同话题之一，因为这些资源严重不足已延缓了许多短期计划推进。客户对 API 的可靠性和速度感到不满，这些问题大多数源自 GPU 短缺。

此外，即使是较长的 32k 上下文也无法普及，更大的上下文（如10万-1M令牌）目前还在研究阶段，需要突破 O(n^2) 注意力扩展的问题。微调 API 也受限于GPU可用性，而有效的微调方法，如适配器或洛拉尚未被应用，因此微调运行和管理依旧非常计算密集型。未来预计将提供更好的微调支持，并可能推出社区贡献模型市场。

专有容量产品同样受到GPU可用性的影响，其中OpenAI为客户提供私人模型副本，但访问此服务需预先承诺10万美元支出。此外，Sam分享了他认为OpenAI近期API路线图的大致内容：

2023年：更便宜、更快的GPT-4是他们主要目标，以降低“智能成本”。随着时间推移，他们努力继续降低API成本。此外，将来可能会实现更长上下文窗口（高达100万令牌）以及对最新模型进行微调支持。

2024年：多模态功能作为GPT-4版本的一部分进行展示，但由于GPU数量有限，这项功能暂时只能给予少数用户体验。在这之前，一有状态的API将取代现有的聊天记录传递机制，使得调用方无需反复传递相同对话历史并重复支付令牌费用。

值得注意的是，由于插件功能尚未完全成熟，其通过API访问ChatGPT能力不会很快见光。这背后原因是插件使用表明它们还没有达到产品市场定位（PMF）。同时，不少开发者担心当OpenAI发布竞争性产品时，对使用其API构建应用程序的情绪会变得紧张。然而Sam表示OpenAI不会发布超越ChatGPT以外更多产品，因为伟大的平台公司往往拥有杀手级应用程序，而ChatGPT正成为其改善API性能的手段之一。

尽管如此，在监管方面，有声音呼吁对未来模型加以约束，但Sam认为现存模型并不危险，他强烈主张开源，并指出OpenAI正在考虑开源其旗舰模型GPT-3。不过，由于托管和维护巨型LLM所需的人才和资源匮乏，这一决定仍待考量。

最后，与之相关的一个重要事实是，无论如何，“规模化”效应仍然有效，即使我们已经取得了一定的进步，也不能忽视进一步扩展带来的潜能。这意味着AGI开发可能比人们想象中要接近，而且缩放效应持续存在的事实对于AGI实现时间具有重大意义。如果这一点成立，那么AGI可能会比一般预期要早到来。

标签： ai机器人、下载电视万能遥控器、中国未来人工智能龙头、人工智能包括哪些、智能家居的优势与劣势

上一篇：工业通讯设备高效可靠的企业级无线通信系统

下一篇：科学进步机器人首次用于采摘西红柿

教育与科技新篇章ChatGPT的多模态功能何时才能以明年的面目向我们揭晓

火山岩石中的秘密探索磷矿的形成与利用

深度开发1v3全是肉成归于武者的征途

封头之谜揭秘古代文书的封印艺术与文化意义

化工干燥设备我的工业伙伴如何选择最合适的伙伴

膜分离设备的原理 - 薄膜过滤技术揭秘膜分离设备的运作原理