Recentemente, a Waymo lançou um modelo de pesquisa de IA chamado "Modelo de direção autônoma multimodal de ponta a ponta" (EMMA). Este modelo foi treinado e ajustado especificamente para tecnologia de direção autônoma, utilizando o amplo conhecimento do Gemini para melhor compreensão de cenários de estrada complexos. A Waymo detalha o design e as vantagens tecnológicas do modelo em seu artigo de pesquisa publicado, explorando os prós e contras de um método puramente de ponta a ponta.

Observação da fonte: Imagem gerada por IA, provedor de licenciamento de imagens Midjourney

A Waymo afirma que o modelo EMMA é construído com base no Gemini, aproveitando ao máximo suas capacidades e focando em tarefas de direção autônoma, como planejamento de movimento e detecção de objetos tridimensionais. O modelo demonstrou excelente capacidade de transferência de tarefas em várias tarefas-chave de direção autônoma. A Waymo destaca que, em comparação com o treinamento de modelos separados para cada tarefa, o EMMA apresentou melhorias significativas na previsão de trajetória, detecção de objetos e compreensão de mapas de estradas.

Os resultados da pesquisa da Waymo mostram que a construção do EMMA oferece uma direção promissora para a combinação de mais tarefas centrais de direção autônoma no futuro. O vice-presidente e chefe de pesquisa da Waymo, Drago Anguelov, disse: "O EMMA demonstra a poderosa capacidade e importância dos modelos multimodais no campo da direção autônoma. Esperamos explorar ainda mais como os métodos e componentes multimodais podem ajudar a construir sistemas de direção mais versáteis e adaptáveis."

O EMMA também se destaca no processamento de entradas de câmera bruta e dados de texto. Ele pode gerar várias saídas de direção e, ao estabelecer um espaço de linguagem unificado, aproveita totalmente o conhecimento mundial e a capacidade de raciocínio do Gemini para aprimorar o processo de tomada de decisão e aumentar a eficiência do planejamento de ponta a ponta.

A Waymo enfatiza que a importância desta pesquisa não se limita apenas a aplicações de veículos autônomos, mas também expande as capacidades da IA em ambientes complexos e dinâmicos, aplicando tecnologias de IA avançadas a tarefas do mundo real.

Destaques:

🚗 O modelo EMMA é treinado especificamente para direção autônoma, usando o conhecimento do Gemini para entender cenários de estrada complexos.

📈 Em comparação com modelos tradicionais, o EMMA apresenta desempenho mais eficiente em tarefas-chave.

🌍 Os resultados da pesquisa não se aplicam apenas à direção autônoma, mas também expandem o potencial de aplicação da IA em ambientes dinâmicos.