Los chatbots de IA superan a los humanos en pruebas de juicio social y podrían convertirse en asesores de interacción social

Un estudio reciente publicado en Scientific Reports muestra que algunos chatbots de IA avanzados superan a los humanos en la evaluación de situaciones sociales complejas.

Utilizando una herramienta psicológica ampliamente utilizada, la prueba de juicio situacional, los investigadores descubrieron que tres chatbots —Claude, Microsoft Co pilot y el asistente inteligente de you.com— superaron a los participantes humanos en la selección de la respuesta conductual más eficaz.

Robots de IA escribiendo ensayos

Nota de la fuente: Imagen generada por IA, proveedor de servicios de licencias de imágenes Midjourney

Con la creciente importancia de las interacciones sociales, el potencial de la IA en la interacción social se está volviendo cada vez más evidente, incluyendo aplicaciones en servicio al cliente y apoyo en salud mental. Los modelos de lenguaje grandes (como los chatbots probados en este estudio) pueden procesar el lenguaje, comprender el contexto y proporcionar respuestas efectivas. Aunque estudios previos han demostrado la capacidad de estos modelos en el razonamiento académico y las tareas lingüísticas, su eficacia en dinámicas sociales complejas aún no se había explorado completamente.

El equipo de investigación probó a 276 participantes humanos, aspirantes a pilotos altamente cualificados. El estudio utilizó una prueba de juicio situacional, presentando 12 situaciones que requerían evaluación, cada una con cuatro opciones de comportamiento potenciales. Los investigadores compararon el rendimiento de cinco chatbots de IA, descubriendo que todos los chatbots probados igualaron o superaron el rendimiento humano. Claude obtuvo el mejor rendimiento, seguido de Microsoft Co pilot y el asistente inteligente de you.com.

Curiosamente, cuando los chatbots no seleccionaron la mejor respuesta, a menudo eligieron la segunda opción más eficaz, mostrando una similitud con los patrones de decisión humana. Esto sugiere que, aunque los sistemas de IA no son perfectos, poseen cierta capacidad en el juicio social y el razonamiento probabilístico.

Además, el estudio encontró diferencias en la fiabilidad entre los diferentes sistemas de IA. Claude mostró la mayor consistencia en múltiples pruebas, mientras que Google Gemini mostró resultados contradictorios en diferentes pruebas. A pesar de esto, el rendimiento general de todos los sistemas de IA superó las expectativas, mostrando su potencial para proporcionar asesoramiento sobre habilidades sociales.

Los investigadores señalan que, aunque muchas personas ya utilizan chatbots en tareas cotidianas, su rendimiento en escenarios sociales complejos aún necesita más validación. El estudio muestra que los modelos de lenguaje grandes se desempeñan excepcionalmente bien en situaciones sociales simuladas, pero carecen de emociones reales, esenciales para la interacción social genuina.

Puntos clave:
🌟 Los chatbots de IA superan a los humanos en juicios sociales complejos y tienen el potencial de actuar como asesores sociales.
🧠 El estudio comparó el rendimiento de varios chatbots, encontrando que Claude y Microsoft Co pilot destacaron.
⚖️ Aunque los sistemas de IA funcionan bien en situaciones simuladas, su aplicación en interacciones sociales reales requiere más investigación.

Noticias de IA

Los chatbots de IA superan a los humanos en pruebas de juicio social y podrían convertirse en asesores de interacción social

AIbase基地

Noticias de IA relacionadas recomendadas

ByteDance lanza AIBrix: un nuevo sistema de inferencia de código abierto diseñado para modelos de lenguaje grandes

El modelo GLM-4-9B de Zhihu logra una tasa de alucinación de solo el 1.3%, liderando la evaluación mundial de modelos de lenguaje grandes

NVIDIA y universidades presentan "FlashInfer": una nueva biblioteca de núcleos para mejorar la eficiencia de la inferencia de modelos de lenguaje grandes

¡Ganar 1 millón de dólares en 20 meses! ¿Cómo lo logró TypingMind, la herramienta de chat con modelos de lenguaje grandes?