2024-12-26 科技 0
科技的浪潮在不断推进,人工智能领域尤为显著。近日,一款名为“盘古”的中文大模型引起了业界的关注。这款模型由华为云和循环智能联合开发,拥有1100亿参数,是目前行业内首个千亿参数中文大型语言模型。
在HDC.Cloud大会上,余承东宣布了盘古NLP 模型,这是对GPT-3落地难题的一次重要突破。GPT-3虽然是一项重大学术成就,但其商业应用却面临诸多挑战。其中包括少样本学习能力不足、微调效果不佳以及缺乏领域专家的知识库融合能力等问题。
为了克服这些限制,盘古模型采用了一种元学习的迁移学习技术,并结合了P-tuning、priming等最新微调方法。在少样本场景下,盘古表现出了显著优势,比如,在达到相同F1结果所需的数据量方面,它仅需比中文版GPT-3(CPM)减少一半,而在生产效率提升方面则达到了10倍之多。
通过接入大量外部知识并实现基于行业知识的精确理解和预测,盘古能够更好地适应复杂商用场景。在实时辅助销售推送中,它能够提供即时信息讲解和产品推荐,从而提升销售能力。这使得盘古成为解决GPT-3落地难题的一个关键方案,为企业级应用提供了一条可行之路。