当前位置: 首页 - 科技 - 盘古问世千亿中文大模型如同智慧的太阳照亮教育与科技的双重天际它不仅克服了GPT-3落地难题更是专注于

盘古问世千亿中文大模型如同智慧的太阳照亮教育与科技的双重天际它不仅克服了GPT-3落地难题更是专注于

2024-12-26 科技 0

盘古:中文大模型的商业化实践者

在GPT-3的光芒下,中文NLP社区迎来了新的挑战与机遇。"盘古",一个由华为云和循环智能联合开发的大型中文预训练语言模型,正以其强大的实用性和高效率赢得了行业内外的关注。

据悉,“盘古”是首个千亿参数量的中文大模型,其密集参数达到1100亿,由循环智能(Recurrent AI)和华为云共同研发,并获得鹏城实验室提供算力支持。在HDC.Cloud大会上,由余承东发布,该模型在CLUE测试中表现出色,在总榜、阅读理解排行榜以及分类任务排行榜上均排名第一,其总分甚至超过第二名高出了百分点。

为了克服GPT-3落地难题,开发团队花费近半年的时间,将40TB行业文本数据和超过400万小时语音数据输入到系统中。这不仅解决了少样本学习能力不足的问题,也通过P-tuning等微调技术提升了准确率,从而使“盘古”成为企业级应用的理想选择。

不同于GPT-3单一端到端生成能力,“盘古”能够融入领域知识,为用户提供更加精准、高效的服务。例如,在教育辅导场景中,“盘古”可以根据客户需求推荐全科或单科辅导班,而不仅仅是回答问题,这样的功能极大地提高了用户体验。

尽管如此,对于“盘古”的期待并不限于学术界,它更是一种将科技创新与实际应用相结合的人类智慧工程。在未来的发展道路上,我们期待看到更多这样的突破,为我们带来更加便捷、精准、高效的人工智能服务。

标签: 刷脸支付网站导航科技之锤我是科技之光最近关于中国科技的新闻