El conjunto de datos WildChat es un corpus de datos formado por 1 millón de interacciones entre usuarios del mundo real y ChatGPT. Se caracteriza por la diversidad lingüística y la variedad de indicaciones de los usuarios. Este conjunto de datos se utilizó para el ajuste fino de Llama-2 de Meta, creando el chatbot WildLlama-7b-user-assistant, capaz de predecir las indicaciones del usuario y las respuestas del asistente.