Ayer, XPeng Motors celebró un seminario sobre tecnología de IA en Hong Kong, donde presentó por primera vez su modelo de conducción autónoma a gran escala de 72 mil millones de parámetros: el "Modelo Base Mundial XPeng". Este modelo, que tiene una arquitectura multimodal como núcleo, integra la comprensión visual, el razonamiento en cadena y la capacidad de generación de acciones. Su objetivo es implementarse en el vehículo mediante la tecnología de destilación en la nube y, al mismo tiempo, potenciar productos ecológicos como robots de IA y vehículos voladores.
Según Li Liyun, responsable de conducción autónoma de XPeng Motors, el modelo base se basa en un modelo de lenguaje grande y se entrena con una gran cantidad de datos de conducción, lo que le otorga la capacidad de autoevolución. Mediante un mecanismo de aprendizaje por refuerzo, el modelo mejorará continuamente la eficiencia de la toma de decisiones, con el objetivo de lograr una tecnología de conducción autónoma que supere el nivel de conducción humana. Para apoyar este desarrollo, XPeng Motors ha acelerado la implementación de infraestructura de IA desde 2023, y ya ha construido el primer clúster de computación inteligente de 10.000 tarjetas en la industria automotriz de China, con una capacidad de cálculo de 10 EFLOPS. La utilización del clúster se mantiene estable por encima del 90%, con una eficiencia máxima que supera el 98%.
XPeng Motors ha denominado a este proceso completo, desde el entrenamiento en la nube hasta la implementación en el vehículo, como "fábrica de modelos en la nube", que abarca las etapas de preentrenamiento, postentrenamiento, destilación del modelo y adaptación al vehículo. Actualmente, esta fábrica realiza una iteración completa en promedio cada 5 días, y la cantidad de datos de entrenamiento de video ha aumentado de 20 millones de clips a un objetivo de 200 millones de clips este año. El equipo de desarrollo también ha creado modelos base de varios tamaños, entre ellos el modelo 72B de 72 mil millones de parámetros, que tiene 35 veces más parámetros que los modelos VLA convencionales, lo que marca un avance significativo en la reserva de potencia de cálculo para la conducción autónoma de XPeng.
En cuanto a la trayectoria tecnológica, XPeng Motors ha establecido un ciclo de datos cerrado mediante la "fábrica de modelos en la nube": el modelo base se preentrena y se somete a aprendizaje por refuerzo en la nube, luego se comprime mediante destilación para crear una versión ligera y finalmente se implementa en el vehículo. Esta arquitectura no solo admite la actualización inteligente de los modelos existentes, sino que también proporcionará capacidades subyacentes a productos de vanguardia como robots de IA y vehículos voladores.
Según la información oficial, XPeng Motors inició la construcción de su infraestructura de IA (AI Infra) en 2024, y ya ha formado un sistema completo que abarca desde la recopilación de datos y el entrenamiento de modelos hasta la aplicación en escenarios reales. Ya se han materializado tres logros clave: la verificación de la eficacia continua de la ley de escala en el campo de la conducción autónoma; la consecución del control del vehículo por parte del modelo base en dispositivos de cálculo instalados posteriormente; y el inicio del entrenamiento del modelo de 72 mil millones de parámetros y el desarrollo de un marco específico para el aprendizaje por refuerzo. En el futuro, el Modelo Base Mundial XPeng se integrará profundamente en el ecosistema de IA para impulsar la evolución coordinada de la tecnología de vehículos inteligentes y robótica.