Recientemente, Waymo ha presentado oficialmente un modelo de investigación de IA llamado "Modelo de conducción autónoma multimodal de extremo a extremo" (EMMA). Este modelo está específicamente entrenado y ajustado para la tecnología de conducción autónoma, utilizando el amplio conocimiento de Gemini para comprender mejor las complejas escenas de la carretera. En su artículo de investigación publicado, Waymo detalla el concepto de diseño y las ventajas tecnológicas del modelo, y explora las ventajas y desventajas de los métodos puramente de extremo a extremo.

Nota de la fuente: Imagen generada por IA, proveída por Midjourney.

Waymo afirma que el modelo EMMA se basa en Gemini, aprovechando al máximo sus capacidades y centrándose en tareas de conducción autónoma como la planificación del movimiento y la detección de objetos tridimensionales. El modelo muestra una buena capacidad de transferencia de tareas en varias tareas clave de conducción autónoma. Waymo señala que, en comparación con entrenar modelos individuales para cada tarea, EMMA muestra una mejora significativa en la predicción de rutas, la detección de objetos y la comprensión de mapas viales.

Los resultados de la investigación de Waymo muestran que la construcción de EMMA ofrece una prometedora dirección de investigación para la combinación de más tareas centrales de conducción autónoma en el futuro. El vicepresidente y jefe de investigación de Waymo, Drago Anguelov, afirma: "EMMA demuestra la poderosa capacidad e importancia de los modelos multimodales en el campo de la conducción autónoma. Esperamos explorar más a fondo cómo los métodos y componentes multimodales pueden ayudar a construir sistemas de conducción más generales y adaptables."

EMMA también destaca en su capacidad para procesar entradas de cámara sin procesar y datos de texto. Puede generar diversas salidas de conducción y, al establecer un espacio lingüístico unificado, aprovecha plenamente el conocimiento del mundo y la capacidad de razonamiento de Gemini para mejorar el proceso de toma de decisiones y aumentar la eficiencia de la planificación de extremo a extremo.

Waymo enfatiza que la importancia de esta investigación no se limita a las aplicaciones de vehículos autónomos, sino que también amplía las capacidades de la IA en entornos complejos y dinámicos al aplicar tecnologías de IA avanzadas a tareas del mundo real.

Puntos clave:

🚗 El modelo EMMA está entrenado específicamente para la conducción autónoma, utilizando el conocimiento de Gemini para comprender escenas de carreteras complejas.

📈 En comparación con los modelos tradicionales, EMMA muestra un rendimiento más eficiente en tareas clave.

🌍 Los resultados de la investigación no solo se aplican a la conducción autónoma, sino que también amplían el potencial de aplicación de la IA en entornos dinámicos.