Con 14 años de experiencia en la industria, anticipamos la llegada de la ola y nos preparamos para enfrentarla. Este artículo tiene como objetivo, desde la perspectiva empresarial, explorar las tendencias tecnológicas y de aplicación en la nueva era de la IA, manteniendo nuestra firme convicción interna y buscando la excelencia externamente.

Un punto de inflexión tecnológico: la interacción entre eficiencia de la potencia de cálculo, algoritmos y datos

Con la rápida evolución de los grandes modelos, la humanidad se encuentra en la vía rápida hacia la superinteligencia artificial (ASI). La madurez de las tecnologías de big data proporciona abundantes recursos para la IA, el desarrollo de la tecnología GPU ha liberado la productividad de la IA, y las innovaciones algorítmicas han superado los cuellos de botella de la potencia de cálculo y los datos. Con la mejora continua de los grandes modelos de lenguaje como DeepSeek, GPT o1 y Grok en las áreas de algoritmos de modelos, parámetros de entrenamiento y potencia de cálculo, nos encontramos en una encrucijada del desarrollo tecnológico de la IA: una interacción entre eficiencia de la potencia de cálculo, algoritmos y datos.

Si tomamos como referencia la Ley de Moore, el desarrollo de la potencia de cálculo llegará primero al techo de eficiencia energética. La era de los grandes modelos básicos que dependen de la acumulación de potencia de cálculo llegará a su fin. Esto no significa que la potencia de cálculo sea ineficaz; más parámetros y potencia de cálculo significan necesariamente mejores resultados del modelo, pero la disminución de los rendimientos marginales hará que la inversión en potencia de cálculo para el desarrollo tecnológico se estabilice. Esto se puede ver claramente en la trayectoria de evolución de los productos de los gigantes de la IA: con el lanzamiento de xAI Grok, la mejora de los resultados derivada de la acumulación de potencia de cálculo ya muestra signos de fatiga, y otros gigantes de la IA como OpenAI han comenzado a explorar áreas de aplicación como AI Agent y a lanzar productos de agentes inteligentes.

Los datos sintéticos y los datos privados son la próxima gran innovación en datos para la era de los grandes modelos. Aunque nos encontramos en la era de la información con una explosión de datos, gracias a los avances en la eficiencia del procesamiento de datos proporcionados por las tecnologías de big data y los avances algorítmicos, el desarrollo de la IA se enfrenta a un problema de escasez de datos. Ya cuando ChatGPT recién se lanzó, Sam Altman advirtió que "nos encontramos en las etapas finales de la era actual de los grandes modelos". Los materiales de alta calidad que se han conservado en la historia de Internet ya se han agotado en GPT-3/4. La cantidad de parámetros de los grandes modelos puede seguir aumentando, pero la cantidad correspondiente de datos de alta calidad es cada vez más escasa, por lo que el rendimiento marginal del aumento de la cantidad de parámetros también disminuirá gradualmente.

Los algoritmos son más bien el "catalizador" del desarrollo de la IA, ya que pueden superar las limitaciones de la potencia de cálculo y los datos, logrando una evolución no lineal. Los avances en el campo de los algoritmos a menudo significan avances en LLM, como ChatGPT basado en Transformer y DeepSeek basado en MoE. Sin embargo, a medida que aumenta la complejidad del modelo, el margen de mejora de los algoritmos se reduce gradualmente. Generalmente se considera que los avances algorítmicos pueden requerir la combinación de más resultados de investigación interdisciplinaria, como el aprendizaje profundo inspirado en la neurociencia y el mecanismo de atención inspirado en la ciencia cognitiva, pero es difícil predecir cuántos "momentos Transformer" habrá en el futuro.

Declaración de Tongfu Shield: el desarrollo de los grandes modelos básicos se estabiliza en la interacción entre eficiencia de la potencia de cálculo, algoritmos y datos, convirtiéndose en una infraestructura sólida para el camino hacia la ASI; los recursos tecnológicos se están desviando gradualmente hacia la extracción del valor de los datos en áreas especializadas y la aplicación de agentes inteligentes de IA; la "aplicación" se convertirá en el tema principal del desarrollo de la próxima era de la IA.

Explosión de aplicaciones: la colaboración de múltiples agentes abre la era de los agentes

El desarrollo de los agentes de IA es una evolución de los "robots de chat" a los "asistentes inteligentes". El núcleo de los agentes es la "ejecución de tareas", lo que permite que la IA no se limite a dar sugerencias, sino que pueda realizar tareas específicas, como realizar un pedido en línea o ejecutar una transacción. La evolución de las tareas simples a las complejas a menudo requiere la cooperación entre diferentes modelos y diferentes agentes. Definimos este concepto de "colaboración de múltiples agentes" como InterAgent (IA), que es una innovación en la arquitectura tecnológica y una reconstrucción del paradigma de aplicación industrial. Creemos que IA impulsará a la IA a lograr un desarrollo revolucionario, desde la inteligencia única hasta la cooperación grupal, y de la asistencia de herramientas a la ejecución autónoma, convirtiéndose en la fuerza impulsora central para impulsar la explosión completa de la era de los agentes.

A nivel tecnológico, el protocolo MCP de Anthropic permite la conexión de diferentes fuentes de datos, modelos y herramientas, proporcionando un protocolo estandarizado para la colaboración de múltiples agentes (IA). El protocolo MCP (Model Context Protocol) define la forma en que las aplicaciones y los modelos intercambian información de contexto, lo que facilita el desarrollo de agentes y hace que la colaboración de múltiples agentes sea más consistente y eficiente. El ecosistema de protocolos MCP todavía se encuentra en una etapa temprana de construcción. Tongfu Shield, como proveedor de servicios de sistemas de confianza para agentes de IA, también participa activamente en la construcción de este ecosistema, implementa servidores MCP, desarrolla complementos funcionales MCP para la comunidad y contribuye a la expansión del ecosistema de colaboración de múltiples agentes.

Figura 1 Servicio de complementos de IA MCP de Tongfu Shield

A nivel de aplicación, a medida que los marcos de agentes como Dify y elizaOS maduran gradualmente, los agentes de IA tienen funciones cada vez más completas en el rol de "asistentes inteligentes". La aparición de Manus ha provocado un debate sobre los "agentes generales". Por un lado, como asistente de IA general, Manus ha demostrado la capacidad de convertir la capacidad de razonamiento lógico de los grandes modelos en productividad real, con un enorme potencial comercial; por otro lado, dado que no ha abierto ningún canal de prueba pública, la autenticidad de la innovación tecnológica de Manus, las estrategias de marketing y la capacidad de creación de valor real son objeto de controversia, especialmente su concepto de "agente general", que todavía tiene limitaciones considerables en la tendencia actual del desarrollo de la IA.

En comparación con la narrativa general y ambiciosa de Manus, las plataformas de aplicaciones de agentes como Dify ya se han aplicado en varios campos, gracias a la fuerza de la construcción comunitaria. En comparación con un gran modelo general, los flujos de trabajo exclusivos para escenarios de aplicación específicos tienen más vitalidad, y esta vitalidad proviene de la esencia del comercio: la creación de valor. Imagine que una empresa crea un agente de IA para la interacción y las ventas con los clientes. Para maximizar los beneficios, utilizará los datos de la más alta calidad y la mejor experiencia de los expertos para entrenar al agente. La barrera de información proporcionada por los datos privados y los conocimientos de la industria hará que sus resultados sean mucho mejores que los de los modelos de agentes generales. Imagine un mercado de agentes de IA que reúne excelentes agentes de varios campos (porque el mercado proporciona suficientes incentivos para los creadores de agentes). Los agentes compiten en el mercado, y solo los agentes con una mejor capacidad de creación de valor pueden sobrevivir. Los agentes excelentes pueden atraer a más usuarios, y más usuarios proporcionarán más datos para impulsar aún más el progreso de los agentes, formando un ciclo positivo.

Figura 2 Plataforma de complementos de IA en cadena de Tongfu Shield (izquierda), mercado de complementos de agentes de IA (derecha)

Declaración de Tongfu Shield: la era de la aplicación de la IA toma al agente como el núcleo de la aplicación y la colaboración de múltiples agentes (InterAgent o IA) como el núcleo tecnológico; la infraestructura de asistencia para la construcción de agentes obtendrá enormes recompensas comerciales, y las palabras clave son "campo vertical", "incentivos de la comunidad" y "plataforma abierta".

El futuro de los modelos: los modelos pequeños lideran la nueva era de la "prueba de Turing"

Mustafa Suleyman, cofundador de DeepMind, propone en su libro "La ola está llegando" una nueva era de la "prueba de Turing" para la IA: darle a una IA 100.000 dólares para ver si puede aprender a realizar transacciones en Amazon y ganar finalmente 1 millón de dólares. Este es un concepto muy interesante. En comparación con la línea de base tecnológica, lo más importante para los usuarios de los agentes de IA es su capacidad de acción, es decir, su capacidad de creación de valor. El éxito comercial es la nueva "prueba de Turing", y esta prueba está diseñada específicamente para los agentes. El desarrollo tecnológico suele estar impulsado por los modelos comerciales, y creemos que la futura dirección del desarrollo de la tecnología de modelos también se desarrollará desde los grandes modelos básicos hasta los modelos pequeños de áreas especializadas con mejor rendimiento y mayor capacidad de generación de beneficios.

Desde el punto de vista tecnológico, el marco tecnológico de los modelos pequeños ya está maduro. A diferencia de la creencia general, el origen tecnológico de los modelos pequeños es en realidad mucho anterior al de los grandes modelos de lenguaje, y su forma primitiva se remonta a los sistemas expertos de la década de 1960. Su idea central es simular la capacidad de toma de decisiones de los expertos humanos mediante bases de conocimientos y mecanismos de razonamiento. El marco MoE (que también inspiró directamente la innovación algorítmica de DeepSeek), que recibió mucha atención alrededor de 2010, también es el marco básico de los modelos expertos. Mediante un mecanismo de enrutamiento dinámico, la entrada se asigna a diferentes submodelos (expertos), lo que reduce la cantidad de cálculos al tiempo que garantiza el rendimiento, sentando las bases para el diseño modular de los modelos pequeños. La madurez de los grandes modelos también proporciona condiciones para mejorar la calidad de los modelos pequeños. Mediante técnicas como la destilación del conocimiento y la poda de modelos, los modelos pequeños pueden reducir considerablemente su tamaño manteniendo el rendimiento.

Desde el punto de vista del modelo comercial, el suelo comercial para los modelos pequeños ya está completo. Los modelos pequeños tienen una excelente relación coste-eficacia, y el coste de implementación de la inferencia es solo una fracción del de los grandes modelos, pero en combinación con bases de conocimientos de expertos, pueden lograr un rendimiento mucho mejor que el de los grandes modelos. Los datos aislados otorgan a los datos un mayor valor comercial y una mayor barrera de entrada. Con la maduración de las aplicaciones comerciales de los modelos pequeños, los datos de alto valor pueden lograr una verdadera factorización de los datos, proporcionando nuevos modelos comerciales y espacio para generar beneficios para el desarrollo empresarial.

Cabe mencionar que la combinación de la identidad digital distribuida y la tecnología de modelos pequeños puede crear modelos comerciales de alto valor en el espacio digital. Mediante modelos pequeños, los datos privados de varios campos pueden maximizar su valor comercial, y la identidad digital del modelo se convierte en la clave para la asignación de derechos de los datos. La tecnología de identidad digital distribuida actual ya está bastante madura. Cómo hacer que cada modelo pequeño y cada agente de IA tengan una identidad confiable, incluso un sistema de cuentas, en el espacio digital es un tema clave para la exploración y la innovación de las aplicaciones comerciales de los agentes de IA.

Figura 3 Matriz de colaboración de múltiples agentes de seguridad de negocios de red eléctrica de Tongfu Shield

Figura 4 Plataforma de control inteligente de agentes de IA para la industria bancaria de Tongfu Shield

Declaración de Tongfu Shield: el éxito comercial es la nueva "prueba de Turing", y los modelos pequeños son la mejor manera para que los agentes de IA superen la "prueba de Turing" de la nueva era. El comercio distribuido y la inteligencia distribuida también brillarán gracias al desarrollo de modelos pequeños.