Juego de Eliminación
Un marco de prueba de referencia que evalúa la inteligencia de los modelos lingüísticos grandes en juegos sociales complejos, inspirado en el juego 'Werewolf'.
Producto ComúnOtrosInteligencia ArtificialJuegos Sociales
Juego de Eliminación es un innovador marco de prueba de referencia para evaluar el rendimiento de los modelos lingüísticos grandes (LLM) en entornos sociales complejos. Simula escenarios de competencia multijugador similares al juego 'Werewolf', utilizando mecanismos de discusión pública, comunicación privada y eliminación por votación para evaluar el razonamiento social, la selección de estrategias y la capacidad de engaño del modelo. Este marco no solo proporciona herramientas importantes para investigar la inteligencia de la IA en juegos sociales, sino que también ofrece a los desarrolladores la oportunidad de comprender el potencial de los modelos en escenarios sociales reales. Sus principales ventajas incluyen un diseño de interacción multironda, mecanismos de alianzas y traiciones dinámicas e indicadores de evaluación detallados que permiten una evaluación integral de las capacidades sociales de la IA.
Juego de Eliminación Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34