Recientemente, investigadores de Microsoft presentaron un nuevo marco de IA llamado Auto Evol-Instruct, capaz de evolucionar automáticamente conjuntos de datos de instrucciones sin intervención humana.
En el campo de la inteligencia artificial, el desarrollo de grandes modelos de lenguaje (LLM) es crucial, especialmente para mejorar su capacidad de seguir instrucciones detalladas. Los investigadores han estado explorando cómo mejorar los conjuntos de datos utilizados para entrenar LLM, con el fin de aumentar el rendimiento y la adaptabilidad de los modelos.
Los métodos de evolución tradicionales, como Evol-Instruct, dependen de reglas de evolución especificadas por expertos humanos, lo que resulta costoso y lento, además de requerir un rediseño del método para adaptarse a nuevas tareas. En contraste, Auto Evol-Instruct automatiza el proceso de evolución al utilizar primero LLM para analizar las instrucciones de entrada y diseñar de forma autónoma un método inicial para las reglas de evolución. Posteriormente, un LLM optimizador itera y optimiza el método de evolución, identificando y resolviendo problemas en el proceso, asegurando la complejidad y estabilidad de las instrucciones evolucionadas.
Auto Evol-Instruct mejora la complejidad y diversidad del conjunto de datos al analizar automáticamente las instrucciones de entrada y formular reglas de evolución, utilizando LLM para diseñar los métodos de evolución.
En cuanto a la evaluación del rendimiento, Auto Evol-Instruct obtuvo excelentes resultados en varias pruebas de referencia. Por ejemplo, con solo 10.000 datos ShareGPT evolucionados para ajustar finamente Mixtral-8x7B, el marco alcanzó una puntuación de 8.09 en MT-Bench y 91.4 en AlpacaEval, superando a GPT-3.5-Turbo y WizardLM-70B, y siendo comparable a Claude2.0.
Además, utilizando solo 7.000 datos de entrenamiento GSM8K evolucionados, el marco alcanzó una puntuación de 82.49 en GSM8K. En la generación de código, al ajustar finamente DeepSeek-Coder-Base-33B con 20.000 datos Code Alpaca evolucionados, el marco obtuvo una puntuación de 77.4 en HumanEval, superando a otros modelos de la competencia.
En resumen, este nuevo marco demostró un excelente rendimiento en varias pruebas de referencia, incluyendo MT-Bench, AlpacaEval, GSM8K y HumanEval, mostrando su potencial para mejorar la capacidad de seguir instrucciones, el razonamiento matemático y la generación de código.
Dirección del artículo: https://arxiv.org/abs/2406.00770
Puntos clave:
🔍 Auto Evol-Instruct es un marco de IA totalmente automático que puede analizar y evolucionar automáticamente conjuntos de datos de instrucciones sin intervención humana.
🚀 El marco mejora la complejidad y diversidad de los conjuntos de datos mediante la optimización de los métodos de evolución, lo que aumenta el rendimiento y la adaptabilidad de los LLM en diversas tareas.
💡 Los resultados de la investigación de Auto Evol-Instruct demuestran la eficacia de los métodos de evolución automática de conjuntos de datos de instrucciones.