Elimination Game
一种测试大语言模型在复杂社交博弈中智能性的基准测试框架,灵感来源于‘狼人杀’游戏。
普通产品其他社交博弈基准测试
Elimination Game 是一种创新的基准测试框架,用于评估大语言模型(LLMs)在复杂社交环境中的表现。它模拟了类似‘狼人杀’的多玩家竞争场景,通过公开讨论、私下交流和投票淘汰机制,测试模型的社交推理、策略选择和欺骗能力。该框架不仅为研究 AI 在社交博弈中的智能性提供了重要工具,还为开发者提供了洞察模型在现实社交场景中潜力的机会。其主要优点包括多轮互动设计、动态联盟与背叛机制以及详细的评估指标,能够全面衡量 AI 的社交能力。
Elimination Game 最新流量情况
月总访问量
502571820
跳出率
37.10%
平均页面访问数
5.9
平均访问时长
00:06:29