2025-02-24 智能 0
【CSDN 编者按】自GPT火遍全球以来,开源大型语言模型的数量激增。为了评估这些模型的性能,LMSYS 组织(UC伯克利博士Lianmin Zheng牵头)创立了Chatbot Arena竞技场,这里通过匿名随机对抗来评估它们,并发布Elo 等级排行榜。社区成员可以贡献新模型、参与投票,共同决定哪个是最强大的。
在这个竞技场中,每次战斗都是一场戏剧性的较量。模型们就像拳手一样互相交锋,只有最强者才能站稳脚跟。在这里,我们不仅能看到战斗的结果,还能感受到每一次击败或胜利背后的故事。
数据显示,大多数用户提问都是以英语为主,这也反映出当前AI研究和应用的现状。不过,不同语言之间的战斗也是非常精彩的。在这里,你可以看到不同语言间的人气争夺战,以及每种语言在不同任务上的表现。
玩家们通过不断地战斗来提升自己的等级,而组织则根据他们在比赛中的表现来更新排名。这种系统不仅公平,而且能够很好地反映每个模型的实力。而且,每一场比赛都有可能改变一切,因为胜负只取决于这一刻。
未来,LMSYS 组织计划继续完善这个平台。他们将添加更多闭源和开源模型,让大家更广泛地参与进来。此外,他们还计划定期更新排行榜,以便让所有人都能看到最新的情况。这是一个持续发展和完善的地方,它不仅是技术展示,也是技术交流的一个窗口。
如果你想加入这项工作,可以访问https://arena.lmsys.org进行投票。如果你想查看特定模型,可以按照指南添加它。这是一个开放的大门,欢迎所有愿意探索未知领域的人士加入。你准备好了吗?让我们一起见证这场关于智能与知识的大战!