2025-02-08 智能 0
品玩6月1日讯,据 HumanLoop 创始人 Raza Habib 近日与 OpenAI 高级管理人员进行的深入探讨,揭示了该公司即将展开的一系列重大开发计划。这些计划旨在解决当前面临的主要挑战:GPU 资源紧缺和 API 可靠性问题。具体而言,OpenAI 目前正面临着 GPU 限制,这不仅推迟了他们短期内的许多项目,也是客户抱怨中最为突出的问题之一。
Sam Altman 承认这一点,并解释称大多数问题都是由于 GPU 短缺所致。此外,由于长上下文(32k)仍未普及给广泛用户,而 OpenAI 尚未克服 O(n^2) 注意力扩展的问题,他们只能提供较小范围的上下文窗口(10万-1M)。此外,微调 API 也受限于可用 GPU 的数量,其运行和管理过程极具计算密集度。
尽管如此,OpenAI 正在积极寻求解决这些问题并推动创新。未来,他们计划提供更强大的微调支持,并可能会主办一个社区贡献模型市场。此外,对专用容量产品也存在同样的限制,这种服务需要客户预先承诺10万美元支出,以便获得私人模型副本。
接下来是 OpenAI 的近期路线图概述:
2023 年:
更高效、更快速的 GPT-4 版本成为首要任务。
降低“智能成本”,持续优化 API 成本。
长上下文窗口(100 万令牌)的实现,以及对最新模型进行微调支持。
实现有状态的聊天 API,不再需要反复传递对话历史。
2024 年:
多模态功能作为 GPT-4 版本的一部分进行演示,但因 GPU 限制暂时无法扩展到所有用户。
值得注意的是,一些开发者对通过 API 访问 ChatGPT 插件持有保留态度,但 Sam 表示插件不会很快发布,因为它们还没有达到产品市场定位(PMF)。此外,他强调 OpenAI 不会发布与其客户直接竞争的产品,而是将其视为杀手级应用程序来改进 API。这体现了 ChatGPT 的愿景——成为工作中的超级智能助手,同时留出其他潜在应用场景供其他合作伙伴利用。
最后,在监管和开源方面,Sam 呼吁对未来模型实施适当监管措施,同时重申他对于开源重要性的信念,并表示 OpenAI 正考虑开放 GPT-3 源代码。不过,由于托管巨型 LLM 需要大量资源,他认为这不是简单的事宜。而且,即使规模化时代已经结束,对AGI发展时间表也有着深远影响。如果缩放定律继续有效,那么 AGI 可能会变得更加接近,而且时间表可能比预想中要短。