image.png

Google anunció hoy el lanzamiento de su modelo de inteligencia artificial de última generación, Gemini 2.0, su modelo de IA más potente hasta la fecha. Esta importante actualización no solo supone una mejora significativa en el rendimiento, sino que también marca un paso importante hacia la era de los agentes de inteligencia artificial.

Según Sundar Pichai, CEO de Google y Alphabet, Gemini 2.0 ha logrado avances innovadores en capacidades multimodales y en el uso de herramientas nativas. El nuevo modelo no solo puede comprender y procesar entradas de diversas formas, como texto, imágenes, videos y audio, sino que también admite por primera vez funciones de salida multimodales como la generación nativa de imágenes y la conversión de texto a voz.

"Si Gemini 1.0 trataba de organizar y comprender la información, Gemini 2.0 se centra en hacer que la información sea más útil", afirmó Pichai. Actualmente, el modelo está disponible para desarrolladores y probadores de confianza.

Innovación tecnológica y mejora del rendimiento

Demis Hassabis, CEO de Google DeepMind, reveló que la primera versión lanzada es Gemini 2.0 Flash, una versión experimental. Esta versión ha mejorado significativamente su rendimiento manteniendo una baja latencia. Cabe destacar que 2.0 Flash incluso supera a 1.5 Pro en pruebas de referencia clave, con una velocidad de respuesta dos veces mayor.

El nuevo modelo se ejecuta en la plataforma de hardware TPU Trillium de sexta generación de Google, la infraestructura que respalda el 100% del entrenamiento y la inferencia de Gemini 2.0. Actualmente, esta plataforma está disponible para los clientes.

image.png

Aplicaciones prácticas e integración de productos

Google planea integrar rápidamente Gemini 2.0 en su ecosistema de productos. A partir de hoy, los usuarios de Gemini en todo el mundo pueden optar por utilizar la versión experimental 2.0 Flash a través de la versión web, y la versión para dispositivos móviles se lanzará próximamente. Además, la función de descripción general de IA de la Búsqueda de Google integrará las capacidades de inferencia avanzada de 2.0 para resolver temas más complejos y problemas de varios pasos.

Cabe destacar que Google también ha lanzado una nueva función llamada "Deep Research", que estará disponible en Gemini Advanced y que puede funcionar como asistente de investigación, explorar temas complejos y generar informes automáticamente.

Explorando el futuro de los agentes de IA

En este lanzamiento, Google también mostró varios proyectos prototipo de investigación basados en Gemini 2.0:

  • Project Astra: un prototipo de asistente de IA general con capacidad de diálogo multilingüe, que puede utilizar herramientas como la Búsqueda de Google, Lens y Maps, y que tiene una memoria de conversación de hasta 10 minutos.
  • Project Mariner: un prototipo de interacción con el navegador que puede comprender y razonar sobre información de todo tipo en páginas web y ayudar a los usuarios a realizar tareas a través de una extensión de Chrome. En la prueba de referencia WebVoyager, logró el 83,5% de los mejores resultados.
  • Jules: un agente de código de IA para desarrolladores que se puede integrar directamente en el flujo de trabajo de GitHub para ayudar a resolver problemas y ejecutar tareas.

Seguridad y desarrollo responsable

Al impulsar estas innovaciones, Google hace hincapié en la importancia de la seguridad y el desarrollo responsable. La empresa ha tomado varias medidas para garantizar el uso seguro de los agentes de IA:

  • Colaboración con el Comité de Responsabilidad y Seguridad (RSC) para identificar y comprender los riesgos potenciales.
  • Mejora de los métodos de equipo rojo asistidos por IA para mejorar la evaluación y mitigación de riesgos.
  • Establecimiento de mecanismos de evaluación y entrenamiento de seguridad para la entrada y salida multimodales.
  • Incorporación de mecanismos de protección contra instrucciones maliciosas en Project Mariner.

Perspectivas de futuro

El lanzamiento de Gemini 2.0 se considera un hito importante en el desarrollo de la IA. Al combinar capacidades multimodales avanzadas con funciones de agente, Google demuestra su ambición en el impulso del desarrollo de la tecnología de IA. A medida que estas nuevas funciones se integren gradualmente en varios productos, los usuarios podrán disfrutar de servicios de asistentes de IA más inteligentes y prácticos.

Sin embargo, Google también reconoce que la tecnología de agentes de IA se encuentra todavía en una fase inicial y que es necesario seguir recopilando comentarios a través de la colaboración con probadores de confianza para mejorar y perfeccionar esta tecnología. La empresa se compromete a seguir impulsando el desarrollo de la tecnología de IA de forma responsable, garantizando los estándares de seguridad y ética al explorar nuevas posibilidades.

Para obtener más información, consulte: https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents