Google Cloud acaba de anunciar el lanzamiento de Agent2Agent (A2A), un nuevo protocolo de código abierto, diseñado para romper las barreras actuales entre agentes de inteligencia artificial (IA) y permitir la colaboración e intercambio de información sin problemas entre agentes de IA construidos por diferentes fabricantes y con diferentes marcos. Esta iniciativa marca un nuevo comienzo para la IA, hacia una era más abierta, eficiente e inteligente.

QQ_1744247846326.png

Romper barreras, lograr una "conversación" libre entre agentes

Con el creciente despliegue de agentes de IA autónomos en las empresas, la capacidad de lograr que estos agentes trabajen de forma colaborativa en entornos empresariales complejos, gestionando tareas diarias o complejas que abarcan sistemas y aplicaciones, se ha convertido en clave para mejorar la productividad. Sin embargo, la falta de estándares unificados dificulta la comunicación y la colaboración eficaces entre diferentes agentes, creando "islas de información".

El protocolo A2A, lanzado por Google, se propone solucionar este problema. Como protocolo abierto, A2A proporciona un método estandarizado para la comunicación, el intercambio seguro de información y la acción coordinada entre agentes de IA. Independientemente del proveedor que haya desarrollado estos agentes o de la tecnología subyacente que utilicen, siempre que sigan el protocolo A2A, podrán lograr escenarios multiagente reales, superando la limitación tradicional de confinar los agentes a una única "herramienta".

Cinco principios de diseño clave para crear una base de interoperabilidad sólida y fiable

QQ_1744247871562.png

El protocolo A2A se ha diseñado con cinco principios clave para garantizar su capacidad de adaptación a los complejos y cambiantes escenarios de aplicación de la IA del futuro:

  • Acoger las capacidades de los agentes (Embrace agentic capabilities): A2A se centra en permitir que los agentes colaboren de forma natural y no estructurada, incluso si no comparten memoria, herramientas ni contexto.
  • Construido sobre estándares existentes (Build on existing standards): El protocolo se basa en estándares existentes y populares como HTTP, SSE y JSON-RPC, lo que reduce considerablemente la dificultad para que las empresas lo integren en sus infraestructuras de TI actuales.
  • Seguridad por defecto (Secure by default): A2A admite la autenticación y autorización a nivel empresarial desde su diseño, con un nivel de seguridad comparable al de los esquemas de autenticación de OpenAPI.
  • Soporte para tareas de larga duración (Support for long-running tasks): A2A ofrece una gran flexibilidad y admite diversos escenarios, desde tareas rápidas hasta investigaciones profundas que requieren horas o incluso días para completarse. Durante todo el proceso, A2A puede proporcionar a los usuarios retroalimentación, notificaciones y actualizaciones de estado en tiempo real.
  • Agnóstico de modalidad (Modality agnostic): Teniendo en cuenta que el mundo inteligente no se limita al texto, A2A también admite varias modalidades, incluidas las transmisiones de audio y vídeo.

Análisis de las funciones principales: ¿Cómo se "comunican" y "colaboran" los agentes?

El protocolo A2A define las capacidades clave de interacción entre agentes:

QQ_1744247891015.png

  • Descubrimiento de capacidades (Capability discovery): Los agentes pueden anunciar sus capacidades mediante "tarjetas de agente (Agent Card)" en formato JSON, permitiendo que los agentes cliente encuentren los agentes remotos más adecuados para ejecutar una tarea específica.
  • Gestión de tareas (Task management): La comunicación entre agentes se orienta a la finalización de tareas. El protocolo define el objeto "tarea (task)" y su ciclo de vida; las tareas pueden completarse inmediatamente o su estado puede rastrearse mediante la comunicación sincrónica entre agentes para tareas de larga duración. La salida de una tarea se denomina "artefacto (artifact)".
  • Colaboración (Collaboration): Los agentes pueden enviarse mensajes entre sí para transmitir contexto, respuestas, artefactos o instrucciones del usuario.
  • Negociación de la experiencia del usuario (User experience negotiation): Cada mensaje contiene "partes (parts)", un bloque de datos completo de un tipo de contenido específico (como una imagen generada). Los agentes cliente y remotos pueden negociar el formato correcto necesario para las capacidades de la interfaz de usuario, como iframe, vídeo y formularios web.

Cabe destacar que el lanzamiento del protocolo A2A cuenta con el apoyo y la contribución de más de 50 socios tecnológicos y proveedores de servicios líderes. Entre ellos se encuentran gigantes tecnológicos como Atlassian, Box, Cohere, Intuit, Langchain, MongoDB, PayPal, Salesforce, SAP, ServiceNow, UKG y Workday, así como empresas de consultoría de renombre como Accenture, BCG, Capgemini, Deloitte, KPMG y PwC. Numerosos socios han expresado que el protocolo A2A ayudará a impulsar una aplicación más amplia de la IA en las empresas, logrando flujos de trabajo más eficientes e inteligentes.

QQ_1744247859343.png

El código abierto potencia la creación de un ecosistema de agentes próspero

Google destaca que el protocolo A2A se lanzará como código abierto y anima a la comunidad a participar activamente en la evolución del protocolo, incluyendo la presentación de ideas, la contribución a la documentación y la participación en los debates de la comunidad. Actualmente, el borrador completo de la especificación y ejemplos de código están disponibles en el sitio web oficial de A2A. Google planea lanzar la versión del protocolo lista para producción a finales de este año.

Google confía en que el protocolo A2A abrirá una nueva era de interoperabilidad de agentes, fomentando la innovación y creando sistemas de agentes más potentes y versátiles. Al romper las barreras entre agentes, A2A tiene el potencial de liberar un enorme potencial en diversos campos, como la automatización empresarial, el servicio al cliente y la gestión de la cadena de suministro.