Recientemente, Musk y su equipo presentaron oficialmente Grok3 en una transmisión en vivo, proclamándolo como "la inteligencia artificial más inteligente del planeta". Musk también afirmó que Grok3 superó a todos los modelos de IA principales en pruebas de referencia de matemáticas, ciencias y programación, y planea aplicarlo a los cálculos de la misión marciana de SpaceX; incluso prevé lograr un avance a nivel de Premio Nobel en los próximos tres años.
Sin embargo, el rendimiento de Grok3 en las pruebas reales ha resultado decepcionante. Después del lanzamiento, algunos medios realizaron pruebas con Grok3, planteándole una pregunta clásica: "¿Qué es mayor, 9.11 o 9.9?". Sorprendentemente, esta IA, supuestamente la más inteligente, no pudo dar la respuesta correcta, lo que provocó que los usuarios de internet la calificaran de "genio que no quiere responder preguntas sencillas".
Ante esto, Musk respondió que el Grok3 actual es solo una versión beta, y que cuantos más errores se produzcan en esta etapa, mejor; la versión completa se lanzará en los próximos meses.
La información oficial indica que Grok3 ha tenido un buen desempeño en el campo de batalla de grandes modelos Chatbot Arena, pero con una diferencia de solo un 1% a un 2% respecto a sus competidores DeepSeek R1 y GPT-4.0. Musk reveló en la presentación que Grok3 utilizó más de 200.000 chips H100, con un tiempo de entrenamiento total de doscientos millones de horas.