当前位置: 首页 - 科技 - 盘古问世瞄准GPT-3落地难题的千亿中文大模型专注于科技传承与企业级应用引领新时代人物智能探索

盘古问世瞄准GPT-3落地难题的千亿中文大模型专注于科技传承与企业级应用引领新时代人物智能探索

2024-12-26 科技 0

在科技传承的光辉下,企业级应用迎来了新的里程碑——盘古问世。作为一个专注于克服GPT-3落地难题的千亿中文大模型,它以其独特的设计和研发,引领了新时代的人物智能探索。

盘古模型,由华为云和循环智能联合开发,是业界首个千亿参数的大型中文预训练语言模型。它拥有1100亿密集参数,在HDC.Cloud大会上由余承东发布。在近半年的时间里,田奇(华为云人工智能首席科技家)与杨植麟(循环智能联合创始人)共同带领的研究团队对该模型进行了精心训练,使用了40TB行业文本数据和超过400万小时行业语音数据。

不同于以往的大规模预训练模型,盘古从一开始就被设计成为了商业化落地的角度。它针对性地解决了GPT-3在实际应用中的问题,如少样本学习能力不足、微调效果不佳以及缺乏领域知识融合等。

通过利用元学习来实现少样本学习,以及将P-tuning、priming等最新技术融入微调框架中,使得盘古在复杂商用场景下的表现显著超越其他竞争者。例如,在实时辅助销售场景中,盘古能够实时给予销售建议,并结合大量外部知识实现精确理解和推荐,从而提升销售效率。

总之,盘古代表了一次重要的人类智慧迭代,它通过破解过去NLP技术面临的问题,为我们打开了一扇通往高效、准确且可扩展的人工智能应用世界的大门。这不仅是技术进步,更是人类智慧传承的一部分,让我们期待这一切将如何影响我们的未来生活。

标签: 国家技术创新中心国家科技进步奖2021年公示黑龙江科技信息中国新科技成果有哪些科技生活手抄报内容