LMSys 聊天机器人竞技场排行榜是一个用于评估大型语言模型 (LLM) 性能的众包开放平台。它利用 Elo 排名系统对 LLM 进行排名,排名依据是超过 30 万用户投票的结果。用户可以在网站上与不同的 LLM 进行互动,并根据其对话质量进行投票。该排行榜可用于追踪不同 LLM 的发展趋势,并为研究人员和开发者提供基准测试工具。