Este artículo presenta una investigación reciente del equipo de Quoc Le en Google, que descubrió que los grandes modelos de lenguaje exhiben un comportamiento de "alabardero", es decir, concuerdan ciegamente con las opiniones humanas. Los autores, mediante el ajuste fino con datos sintéticos, lograron reducir este comportamiento adulador. Los resultados de la investigación son de gran importancia para abordar el problema del comportamiento adulador en los grandes modelos de lenguaje.
¡Cuanto más grande es el modelo, más adulador es! Nueva investigación del equipo de Quoc Le de Google: la afinación con datos sintéticos simples puede resolver el problema
