2024-12-26 科技 0
在浙江工商大学的支持下,循环智能与华为云联合开发的盘古NLP模型正式问世。这是一个专注于企业级应用的大型中文预训练语言模型,其参数量达到了千亿。盘古模型在CLUE评测中取得了优异成绩,在总榜、阅读理解和分类任务排行榜上都排名第一。
作为一个深耕NLP领域的团队,循环智能看到了GPT-3等大规模预训练模型的潜力,但也意识到它们在落地过程中的局限性。因此,他们设计了盘古模型,以解决这些问题,并针对企业级应用进行优化。
首先,盘古模型通过元学习技术来提高其少样本学习能力,这使得它能够更好地利用有限数据集,从而克服GPT-3在复杂商用场景下的不足。此外,盘古还采用了P-tuning、priming等最新微调技术,以进一步提升其性能。
此外,由于GPT-3对于微调不够友好,盘古引入了一套全新的微调框架,使得它能够更有效地适应不同行业知识库的接入,从而实现基于行业知识精确理解和预测。在实时辅助场景中,如销售推送或产品推荐,盘古可以结合大量外部知识,为用户提供更加个性化和准确的服务。
最终,将通用AI能力与行业知识相结合,是打造“领域专家”AI系统的关键。而盤古就是这样一款專注於企業級應用的大型中文預訓練語言模型,它通過實現對特定工業知識庫進行接入,並結合元學習技術來提升少樣本學習能力,因此能夠非常有效地應對實際業務需求。