Recientemente, Google anunció la publicación de código abierto de su herramienta de marca de agua de texto SynthID, diseñada para ayudar a los desarrolladores a identificar mejor el texto generado por IA. Esta herramienta ya está disponible para el público a través del "Kit de herramientas de IA generativa responsable" de Google.
Pushmeet Kohli, vicepresidente de investigación de Google DeepMind, afirmó que esta tecnología permitirá a otros desarrolladores de IA generativa detectar si la salida de texto proviene de sus propios modelos de lenguaje grandes (LLM), lo que les ayudará a construir aplicaciones de IA de manera más responsable.
En la era actual de rápida propagación de la información, la tecnología de marcas de agua es especialmente importante. Con los modelos de lenguaje grandes utilizados para difundir información política falsa, generar contenido inapropiado, etc., la demanda de herramientas de marca de agua está en constante aumento. Por ejemplo, California está considerando hacer obligatorias las marcas de agua para IA, mientras que China ya lo exige desde el año pasado. A pesar de esto, la tecnología sigue en constante desarrollo.
La tecnología SynthID de Google se presentó por primera vez en agosto del año pasado. Agrega marcas de agua invisibles al texto, imágenes, audio y video generados, lo que facilita la identificación de la salida generada por IA.
Específicamente, SynthID ajusta ligeramente la probabilidad de cada palabra generada en la salida de texto, de modo que estas modificaciones sean reconocibles por el software pero inperceptibles para los humanos. Por ejemplo, cuando el modelo genera "Mi fruta tropical favorita es __.", podría elegir palabras como "mango", "lichi", "papaya" o "durian". Cada palabra tiene una puntuación de probabilidad, y SynthID ajusta estas puntuaciones sin afectar la calidad, precisión y creatividad del texto.
Este ajuste se realiza continuamente a lo largo del texto generado, por lo que un párrafo puede tener más de diez puntuaciones ajustadas, y una página completa puede contener cientos. Finalmente, el patrón de estas puntuaciones de probabilidad ajustadas constituirá la marca de agua. Google afirma que el sistema ya está integrado en su chatbot Gemini y que no afecta la calidad ni la velocidad del texto generado. Sin embargo, todavía enfrenta algunos desafíos con textos cortos, contenido reescrito o traducido, y respuestas a preguntas de hecho.
Google señala en una entrada de blog: "SynthID no es la solución definitiva para identificar el contenido generado por IA, pero es una piedra angular importante en el desarrollo de herramientas de identificación de IA más fiables, que pueden ayudar a millones de usuarios a tomar decisiones más informadas."
Enlace al proyecto:https://ai.google.dev/responsible/docs/safeguards/synthid?hl=es
Puntos clave:
📜 SynthID de código abierto ayuda a los desarrolladores a identificar texto generado por IA.
🛠️ La tecnología de marcas de agua es cada vez más importante para combatir la desinformación y el contenido inapropiado.
💡 SynthID de Google puede ajustar las puntuaciones de probabilidad de la generación de texto para crear una marca de agua.