2024-12-26 科技 0
在科技传承的光辉下,企业级应用迎来了新的里程碑——盘古问世。作为一个专注于克服GPT-3落地难题的千亿中文大模型,它以其独特的设计和研发,引领了新时代的人物智能探索。
盘古模型,由华为云和循环智能联合开发,是业界首个千亿参数的大型中文预训练语言模型。它拥有1100亿密集参数,在HDC.Cloud大会上由余承东发布。在近半年的时间里,田奇(华为云人工智能首席科技家)与杨植麟(循环智能联合创始人)共同带领的研究团队对该模型进行了精心训练,使用了40TB行业文本数据和超过400万小时行业语音数据。
不同于以往的大规模预训练模型,盘古从一开始就被设计成为了商业化落地的角度。它针对性地解决了GPT-3在实际应用中的问题,如少样本学习能力不足、微调效果不佳以及缺乏领域知识融合等。
通过利用元学习来实现少样本学习,以及将P-tuning、priming等最新技术融入微调框架中,使得盘古在复杂商用场景下的表现显著超越其他竞争者。例如,在实时辅助销售场景中,盘古能够实时给予销售建议,并结合大量外部知识实现精确理解和推荐,从而提升销售效率。
总之,盘古代表了一次重要的人类智慧迭代,它通过破解过去NLP技术面临的问题,为我们打开了一扇通往高效、准确且可扩展的人工智能应用世界的大门。这不仅是技术进步,更是人类智慧传承的一部分,让我们期待这一切将如何影响我们的未来生活。