Boletín diario de IA: Baidu lanzará Wenxin 4.5 Turbo el 25 de abril; Google presenta el nuevo protocolo de agente inteligente A2A; Se regulan las transmisiones en vivo de Douyin que usan incorrectamente herramientas de IA

¡Bienvenido a la sección de noticias diarias de IA! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentamos los temas más relevantes del campo de la IA, con enfoque en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Productos de IA nuevos haga clic aquí para más información: https://top.aibase.com/

1. Baidu anuncia el lanzamiento de Wenxin Large Model 4.5 Turbo el 25 de abril

Baidu anunció que lanzará el modelo de lenguaje grande Wenxin 4.5 Turbo en la conferencia Create del 25 de abril. Aunque aún no se han revelado los detalles específicos, la industria tiene grandes expectativas. El modelo Wenxin 4.5 y el modelo Wenxin X1 se lanzaron el mes pasado y se pusieron a disposición de los usuarios de forma gratuita, mostrando la profunda acumulación de Baidu en el campo de la IA. El modelo Wenxin 4.5 destaca por su excelente capacidad de comprensión multimodal, y el precio de llamada de la API es muy competitivo, atrayendo la atención de numerosos desarrolladores y empresas.

【Resumen de AiBase:】
🚀 El modelo de lenguaje grande Wenxin 4.5 Turbo se lanzará en la conferencia Create del 25 de abril. Los detalles específicos están por revelarse.
💡 El modelo de lenguaje grande Wenxin 4.5 presenta un rendimiento excepcional en la capacidad de comprensión multimodal. El precio de llamada de la API es solo el 1% del de GPT 4.5.
🌟 El fundador de Baidu, Robin Li, afirmó que el modelo de lenguaje grande Wenxin 4.5 será el mejor modelo en la historia de Baidu.

2. ¡Gran cambio en los agentes de IA! Google lanza el protocolo A2A de código abierto, permitiendo la "conversación" libre entre agentes inteligentes

Google Cloud presenta el nuevo protocolo de código abierto Agent2Agent (A2A), diseñado para facilitar la colaboración e intercambio de información entre diferentes agentes de IA. Este protocolo, a través de un método de comunicación estandarizado, elimina las barreras entre los agentes y resuelve el problema de los silos de información. Los principios de diseño del protocolo A2A incluyen el soporte para tareas a largo plazo, seguridad predeterminada e independencia del modo, lo que garantiza su aplicabilidad en aplicaciones de IA complejas.

【Resumen de AiBase:】
🚀 El protocolo A2A promueve la colaboración e intercambio de información sin problemas entre agentes de IA de diferentes fabricantes, eliminando los silos de información.
🔒 Este protocolo se basa en estándares existentes, admite seguridad a nivel empresarial y simplifica el proceso de integración.
🌐 Más de 50 socios tecnológicos respaldan el protocolo A2A, impulsando una aplicación más amplia de la IA en las empresas.

3. WeChat: Video Number inicia una gestión especial para el uso indebido de herramientas de IA en transmisiones en vivo

El Centro de Seguridad de Creación de Videos de WeChat publicó recientemente un anuncio sobre la gestión especial de las conductas de algunos presentadores que usan indebidamente herramientas de IA durante las transmisiones en vivo. Estas conductas no solo engañan a los espectadores, sino que también infringen los derechos de imagen de otros y violan las normas operativas correspondientes. La plataforma tomará medidas punitivas según la gravedad de la infracción para garantizar un entorno de transmisión saludable y seguro. Al mismo tiempo, la plataforma fomenta el uso razonable de la tecnología de IA para mejorar la eficiencia del trabajo, pero rechaza firmemente las conductas de lucro ilícito.

【Resumen de AiBase:】
🚫 Algunos presentadores usan indebidamente herramientas de IA durante las transmisiones en vivo, engañando a los espectadores e infringiendo los derechos de imagen.
⚖️ Los presentadores deben solicitar las credenciales de transmisión. Si se utilizan herramientas de IA para modificar la imagen facial, se considerará una infracción.
📢 Los usuarios pueden denunciar las conductas ilícitas a través de la función de denuncia, y la plataforma las procesará de inmediato.

4. ByteDance lanza Multi-SWE-bench de código abierto, impulsando la actualización inteligente del código de modelos grandes

El equipo de modelos Doubao de ByteDance ha lanzado recientemente Multi-SWE-bench, el primer conjunto de datos de referencia de reparación de código multilingüe, con el objetivo de mejorar la evaluación de la capacidad de los modelos grandes para corregir errores automáticamente. En comparación con el SWE-bench anterior, Multi-SWE-bench no solo cubre Python, sino que también agrega otros seis idiomas como Java y TypeScript, creando 1632 tareas reales e introduciendo un mecanismo de clasificación de dificultad.

【Resumen de AiBase:】
🛠️ Multi-SWE-bench es el primer conjunto de datos de referencia de reparación de código multilingüe, que cubre 7 idiomas de programación principales.
📊 El conjunto de datos contiene 1632 tareas reales, rigurosamente seleccionadas y verificadas manualmente para garantizar su fiabilidad.
🤖 Los experimentos muestran que los modelos de lenguaje grandes presentan un rendimiento aceptable en la reparación de Python, pero la tasa de reparación en otros idiomas es inferior al 10%.

5. JD Retail lanza TimeHF, su primer modelo de series temporales de miles de millones de niveles, capaz de predecir las ventas de productos

El equipo técnico de JD Retail ha lanzado con éxito TimeHF, su propio modelo de series temporales de predicción de ventas de miles de millones de niveles. Este modelo, mediante la técnica de aprendizaje por refuerzo con retroalimentación humana, ha logrado una mejora significativa en la predicción de ventas, con una precisión superior al 10%. TimeHF presenta un rendimiento excepcional en los escenarios de reposición automática de JD y supera el nivel de la industria en varios conjuntos de datos públicos, convirtiéndose en un nuevo referente en la predicción de series temporales.

【Resumen de AiBase:】
🛠️ El modelo TimeHF se basa en la técnica de aprendizaje por refuerzo con retroalimentación humana, con una precisión de predicción mejorada en más del 10%, lo que reduce significativamente la incertidumbre de la predicción de la demanda.
📊 El equipo de JD integró un conjunto de datos de alta calidad de 1.500 millones de muestras, creando un conjunto de datos complejos sin precedentes que sentó las bases para el entrenamiento del modelo.
🚀 TimeHF ha logrado resultados SOTA en varios conjuntos de datos públicos, mostrando un rendimiento de muestra cero y una precisión de predicción más fuertes, y ya se está aplicando en el sistema de cadena de suministro de JD.

6. Google Firebase Studio hace su aparición: una plataforma de desarrollo integral impulsada por IA

El nuevo Firebase Studio de Google es una plataforma de desarrollo en la nube que integra múltiples herramientas de desarrollo, con el objetivo de simplificar el proceso de desarrollo mediante la tecnología de IA. Ofrece una experiencia de desarrollo integral, con soluciones para todo el proceso, desde la concepción hasta la implementación, especialmente destacada en el desarrollo móvil. Aunque actualmente se encuentra en fase de vista previa, sus potentes funciones y su política de prueba gratuita permiten a los desarrolladores desarrollar proyectos con mayor facilidad, presagiando una transformación en el futuro ecosistema de programación.

【Resumen de AiBase:】
🛠️ Firebase Studio integra múltiples herramientas de desarrollo, ofreciendo una experiencia de desarrollo integral que permite la creación rápida de aplicaciones.
🌐 La plataforma incluye un simulador de móviles que permite a los desarrolladores depurar aplicaciones iOS y Android directamente en la nube, mejorando la eficiencia del desarrollo móvil.
🔍 Actualmente se encuentra en fase de vista previa, la estabilidad de las funciones aún necesita mejoras. En el futuro, se deberá equilibrar la diferencia entre los servicios gratuitos y de pago.
Enlace de detalles:https://top.aibase.com/tool/firebase-studio

7. De texto a personajes complejos: ¡Aparece OmniSVG, el modelo de generación SVG más potente!

El lanzamiento de OmniSVG marca un gran avance en la tecnología de generación de SVG. Combinando modelos avanzados de visión-lenguaje y un innovador marcadador SVG, mejora en gran medida la eficiencia y la calidad de la generación. El modelo no solo admite la generación de SVG a partir de texto e imágenes, sino que también puede generar personajes de anime complejos, mostrando una gran flexibilidad y calidad. La aparición de OmniSVG ha traído nuevas posibilidades a los campos del diseño gráfico y el desarrollo web, impulsando el desarrollo de la comunidad AIGC.

【Resumen de AiBase:】
🌟 OmniSVG es un modelo de generación de SVG avanzado desarrollado conjuntamente por StepFun y la Universidad de Fudan, con una excelente capacidad de generación multimodal.
📊 El nuevo conjunto de datos MMSVG-2M contiene 2 millones de recursos SVG y proporciona un protocolo de evaluación estandarizado, impulsando el desarrollo de la tecnología de generación de SVG.
🚀 Los SVG generados por OmniSVG no solo tienen un excelente efecto visual, sino que también son editables, adecuados para flujos de trabajo de diseño profesional.
Enlace de detalles:https://omnisvg.github.io

8. Google lanza el kit de desarrollo de agentes: ADK, liderando una nueva ola en el desarrollo de agentes de IA

El lanzamiento del Agent Development Kit (ADK) de Google el 9 de abril de 2025 marca un gran avance en el desarrollo de agentes de IA. Como un marco de código abierto, ADK tiene como objetivo simplificar la construcción y gestión de sistemas multiagentes, admitiendo un desarrollo e implementación flexibles. Su diseño modular y sus funciones de interacción multimodal permiten a los desarrolladores crear agentes de una manera más natural, mientras que la integración profunda con los servicios de Google Cloud mejora la eficiencia de las aplicaciones empresariales.

【Resumen de AiBase:】
🚀 ADK es un marco de desarrollo de agentes de código abierto lanzado por Google, diseñado para simplificar la construcción y gestión de sistemas multiagentes.
🎤 Admite interacción multimodal, con funciones de flujo de audio y video bidireccional, mejorando la capacidad de conversación natural de los agentes.
🌐 Integración profunda con los servicios de Google Cloud, admite el diseño rápido de prototipos y la implementación sin problemas, reduciendo el umbral tecnológico.

9. Veo 2 llega a la API de Gemini: ¡la revolución de la generación de videos con IA comienza oficialmente!

El modelo de generación de video Veo2 de Google se abre a los desarrolladores a través de la API de Gemini, marcando una nueva etapa en la tecnología de generación de video con IA. Este modelo es conocido por su generación de video de alta fidelidad y su respuesta precisa a instrucciones complejas, admitiendo la generación de texto a video e imagen a video. Los desarrolladores pueden integrar esta API de forma flexible para explorar una amplia gama de posibilidades comerciales y creativas. Sin embargo, también surgen debates sobre la autenticidad del contenido y la propiedad de los derechos de autor, y Google ha incorporado marcas de agua en los videos generados para reducir el riesgo de uso indebido.

【Resumen de AiBase:】
🎥 Veo2 se abre a través de la API de Gemini, admite la generación de texto a video e imagen a video, impulsando el desarrollo de la tecnología de generación de video con IA.
💡 Los desarrolladores pueden integrar Veo2 de forma flexible a través de la API para explorar diversas aplicaciones de videos cortos personalizados y experiencias de historias interactivas.
⚖️ La salida de alta realidad genera debates sobre la autenticidad del contenido y los derechos de autor, y Google incorpora marcas de agua para reducir el riesgo de uso indebido.
Enlace de detalles:https://ai.google.dev/gemini-api/docs/video

10. Anthropic lanza el servicio de suscripción de alta gama Claude Max, con una tarifa mensual de hasta 200 dólares

Anthropic ha lanzado recientemente el plan de suscripción de Claude Max para satisfacer las necesidades de los usuarios de alta gama en servicios de inteligencia artificial. Este plan ofrece dos opciones de precios, 100 y 200 dólares mensuales, con un aumento significativo en los límites de uso, atrayendo a más usuarios. Aunque actualmente no hay opciones de uso ilimitado, la empresa está explorando activamente otras vías de ingresos, incluido el proyecto "Claude for Education" para el sector educativo.

【Resumen de AiBase:】
🌟 Se lanza el plan de suscripción de Claude Max, con una tarifa mensual de hasta 200 dólares, diseñado para usuarios de alta gama.
📈 Dos opciones de precios, con límites de uso significativamente mejorados, atrayendo a más usuarios.
🎓 Explora el proyecto "Claude for Education", centrado en las necesidades de IA en el ámbito educativo.

11. Se lanza OminiControl Art: la destilación de estilos artísticos como el de Studio Ghibli de GPT-4o en el modelo FLUX

El lanzamiento de la tecnología OminiControl Art el 9 de abril de 2025 marca un gran avance en el campo de la creación artística con IA. Esta tecnología, a través del marco OminiControl, combina el estilo artístico de GPT-4o de OpenAI con el modelo FLUX.1, proporcionando a los usuarios una herramienta eficiente y elegante para generar imágenes artísticas de alta calidad. Su filosofía de diseño enfatiza la simplicidad y la practicidad, permitiendo que incluso los usuarios comunes puedan empezar a usarla fácilmente, impulsando una mayor fusión entre la IA y el arte.

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Boletín diario de IA: Baidu lanzará Wenxin 4.5 Turbo el 25 de abril; Google presenta el nuevo protocolo de agente inteligente A2A; Se regulan las transmisiones en vivo de Douyin que usan incorrectamente herramientas de IA

站长之家

Este artículo proviene de AIbase Daily