当前位置: 首页 - 科技 - 全球科技巨擘推出盘古模型瞄准GPT-3在企业级应用中的落地难题专注于解决中文大型模型的应用场景问题

全球科技巨擘推出盘古模型瞄准GPT-3在企业级应用中的落地难题专注于解决中文大型模型的应用场景问题

2024-12-26 科技 0

全球科技巨擘推出盘古模型,瞄准GPT-3落地难题千亿中文大模型盘古问世专攻企业级应用

在全球著名科技网站上,一则重大新闻吸引了所有人工智能从业者的注意:一款名为“盘古”的新型中文预训练语言模型正式问世。这款模型由华为云和循环智能联合开发,拥有1100亿密集参数,是目前业界首个千亿参数的中文大型语言模型。

据报道,这次刷榜的不是一个普通的AI模型,而是解决了GPT-3在企业级应用中的落地难题。GPT-3虽然强大,但在复杂商用场景中却存在多方面的问题。例如,它对于复杂商用场景的少样本学习能力较弱,而且对微调不友好,在实际应用中难以进一步优化。此外,由于它是一个百科全书式的存在,在很多落地场景中,我们更需要的是一个领域“专家”。

为了克服这些问题,循环智能团队进行了一系列创新性的技术尝试。首先,他们利用迁移学习来提高少样本学习能力,然后将P-tuning、priming等最新技术融入到微调框架中,从而进一步提升微调效果。

数据显示,在少样本场景下,盘古的学习能力远超其他现有的GPT系列和BERT系列。在相同F1结果的情况下,盘古所需数据量仅为中文GPT-3的一九,而实现近10倍生产效率提升。这意味着,以前可能需要两个星期才能完成的一些工作,现在可以用一两天就能做完。

这次事件激发了行业内广泛讨论:未来的人工智能是否应该更加注重实践需求?如何通过技术创新让AI更好地服务于人类?无论答案如何,“盘古”这一成果无疑给予了我们深刻启示——只有不断努力,不断创新的我们,才能真正打开人工智能的大门,让它成为我们的伙伴,为我们的生活带来更多便利。

标签: 中国科研网官网科技手段让古籍里的文字“活”起来神威太湖之光vj师适合5年级的科技小制作