Boletín diario de IA: Alibaba y Tencent brindan soporte completo al protocolo MCP; Modelo de inferencia multimodal Step-R1-V-Mini de Jieyue Xingchen; Modelo de generación de imágenes Miracle F1 de Meitu WHEE

¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentamos los temas más relevantes del ámbito de la IA, con enfoque en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Conozca los nuevos productos de IA https://top.aibase.com/

1. Alibaba anuncia soporte completo para el protocolo MCP; Tencent le sigue los pasos

Recientemente, el campo de la inteligencia artificial en China ha experimentado una transformación en los estándares tecnológicos, con el Protocolo de Contexto de Modelo (MCP) convirtiéndose en el estándar de facto del ecosistema de IA nacional. El apoyo de Alibaba y Tencent marca una nueva ronda de competencia entre los gigantes tecnológicos chinos en la carrera global por los estándares de IA. MCP, como protocolo de código abierto, simplifica la interacción entre los modelos de IA y las herramientas externas, mejorando la interoperabilidad.

【Resumen de AiBase:】
🚀 El rápido auge del protocolo MCP destaca la urgente necesidad de las empresas tecnológicas chinas de contar con protocolos estandarizados.
🤝 El apoyo de Alibaba y Tencent acelerará la promoción de MCP en China, impulsando la aplicación práctica de los agentes de IA.
⚖️ Si bien la popularización de MCP enfrenta desafíos, también podría generar un nuevo ecosistema de desarrollo de IA, influyendo en la futura competencia tecnológica.

2. Jieyue Xingchen lanza un nuevo modelo de inferencia multimodal: Step-R1-V-Mini

El equipo de Jieyue Xingchen Technology ha presentado Step-R1-V-Mini, un innovador modelo de inferencia multimodal que representa un nuevo avance en este campo. Este modelo admite la entrada de texto e imágenes y la salida de texto, y cuenta con una excelente capacidad de seguimiento de instrucciones y versatilidad. Mediante el uso del aprendizaje por refuerzo multimodal conjunto y el mecanismo de recompensa verificable, Step-R1-V-Mini presenta un rendimiento excelente en razonamiento visual y lógica matemática, ocupando un lugar destacado en la clasificación de razonamiento visual MathVision.

【Resumen de AiBase:】
🧠 Step-R1-V-Mini admite la entrada de texto e imágenes y la salida de texto, con una buena capacidad de seguimiento de instrucciones y versatilidad.
🔍 Este modelo presenta un rendimiento excelente en el campo del razonamiento visual, especialmente en la clasificación MathVision, donde ocupa el primer lugar a nivel nacional.
⚙️ Ya está disponible en la página web de Jieyue AI y ofrece una interfaz API para desarrolladores e investigadores.
Enlace de detalles: https://yuewen.cn/chats/new

3. Meitu WHEE lanza el modelo de generación de imágenes Miracle F1

El modelo de generación de imágenes de inteligencia artificial Miracle F1, lanzado recientemente por la plataforma WHEE, está revolucionando el campo de la creación de imágenes con IA gracias a su excepcional calidad de generación de imágenes y su profunda comprensión de conceptos complejos. Este modelo no solo puede generar imágenes extremadamente realistas, sino que también destaca en la comprensión semántica y la diversidad de estilos, satisfaciendo las necesidades de diferentes usuarios. Los usuarios pueden experimentar esta magia visual a través del sitio web oficial de WHEE.

【Resumen de AiBase:】
✨ Miracle F1 puede generar imágenes extremadamente realistas, simulando los efectos de luz y materiales del mundo real.
🧠 Este modelo comprende con precisión conceptos complejos, mejorando la eficiencia y la precisión de la creación, como si tuviera "lectura de mentes".
🌈 Miracle F1 ofrece estilos diversos, capaces de satisfacer las diversas necesidades del comercio electrónico, la imagen visual de eventos y las ilustraciones.

4. Deep Research ya está equipado con Gemini 2.5 Pro: el modelo de IA más inteligente de Google hace su aparición

Google ha anunciado la actualización de su función Deep Research a la versión experimental de Gemini 2.5 Pro, mostrando una capacidad de razonamiento y una tecnología de integración de información excepcionales. Este avance tecnológico ha generado un amplio interés en la industria, marcando un hito importante para las herramientas de investigación de IA. Gemini 2.5 Pro no solo mejora la eficiencia de la búsqueda, sino que también permite realizar análisis integrales, cambiando los métodos de investigación e impulsando a los profesionales a adaptarse a las nuevas tecnologías. En el futuro, Google planea ampliar el alcance de aplicación de Deep Research para brindar un soporte más inteligente a la investigación académica y comercial.

【Resumen de AiBase:】
🚀 La actualización de Gemini 2.5 Pro mejora significativamente la eficiencia de búsqueda y la capacidad de análisis de Deep Research, pudiendo gestionar temas complejos y generar informes completos.
📊 Este modelo presenta un rendimiento excepcional en varias pruebas de referencia, especialmente en tareas de contexto largo, con una ventana de contexto de hasta 1 millón de tokens, capaz de analizar grandes cantidades de datos.
🌐 Este avance tecnológico marca un hito importante para las herramientas de investigación de IA, y se espera que genere cambios revolucionarios en la investigación académica y comercial.

5. Nuevo modelo de código abierto DeepCoder: programación súper eficiente, superando al modelo o1 de OpenAI

El modelo DeepCoder-14B-Preview, de código abierto y desarrollado conjuntamente por Together AI y Agentica, con 14 mil millones de parámetros, ha demostrado un excelente rendimiento en las pruebas de programación, superando al modelo o1 de OpenAI. El contenido de código abierto del modelo es abundante, incluyendo pesos del modelo, datos de entrenamiento y métodos de entrenamiento, lo que facilita enormemente la investigación en profundidad por parte de los desarrolladores. Mediante el aprendizaje por refuerzo distribuido y conjuntos de datos de alta calidad, DeepCoder ha mejorado significativamente tanto la eficiencia del entrenamiento como la calidad del código, mostrando su gran potencial en el campo de la programación de IA.

【Resumen de AiBase:】
🌟 El modelo DeepCoder-14B-Preview presenta un rendimiento excelente, superando al modelo o1 de OpenAI.
📈 El contenido de código abierto es abundante, incluyendo pesos del modelo y datos de entrenamiento, lo que facilita la investigación para los desarrolladores.
⚙️ Se utilizan varias técnicas para garantizar la calidad de los datos y la eficiencia del entrenamiento, mejorando significativamente el rendimiento del modelo.
Enlace de detalles: https://huggingface.co/agentica-org/DeepCoder-14B-Preview

6. ¡Otro salto en el rendimiento de inferencia! DeepSeek presenta la innovadora tecnología SPCT, para que los grandes modelos comprendan mejor la mente humana

La tecnología de optimización crítica de principios de autoaprendizaje (SPCT) lanzada por DeepSeek AI marca un gran avance en el campo de los grandes modelos de lenguaje. Esta tecnología tiene como objetivo construir modelos de recompensa de IA más generales y escalables, mejorando la capacidad de comprensión y respuesta de la IA en entornos complejos. SPCT resuelve los desafíos que enfrentan los modelos de recompensa existentes en cuanto a flexibilidad de entrada, precisión, escalabilidad en la inferencia y escalabilidad del aprendizaje mediante la generación dinámica de principios y comentarios.

【Resumen de AiBase:】
✨ La tecnología SPCT tiene como objetivo mejorar la generalidad y la escalabilidad de los modelos de recompensa de IA, superando las limitaciones de los modelos existentes.
💡 Mediante la generación dinámica de principios y comentarios, SPCT mejora eficazmente el rendimiento y la capacidad de razonamiento de la IA en tareas complejas.
📈 DeepSeek-GRM-27B supera a los modelos tradicionales en varias pruebas de referencia, mostrando una mayor calidad de recompensa y escalabilidad en la inferencia.
Enlace de detalles: https://arxiv.org/abs/2504.02495

7. ¡Lanzamiento oficial de Anthropic! Informe de uso de Claude AI por estudiantes universitarios publicado

Este artículo explora la aplicación de la inteligencia artificial (IA) en el aprendizaje universitario, especialmente el uso de Claude.ai. Mediante el análisis de una gran cantidad de datos de conversaciones anónimas, la investigación revela las preferencias de uso de la IA entre estudiantes de diferentes especialidades, así como el papel de la IA en el aprendizaje. Aunque la IA ofrece comodidad a los estudiantes, también plantea preocupaciones sobre la externalización de las capacidades cognitivas, destacando los desafíos y oportunidades que enfrentan los educadores en la era de la IA.

【Resumen de AiBase:】
📊 Los estudiantes de carreras STEM son los primeros en adoptar las herramientas de IA, especialmente en informática, donde el porcentaje de uso es significativamente mayor que en otras especialidades.
🛠️ Los estudiantes utilizan principalmente la IA para la creación y el análisis, especialmente en el diseño de contenido educativo y la resolución de problemas técnicos.
🤔 El uso de la IA genera preocupaciones sobre la externalización de las capacidades cognitivas de los estudiantes, por lo que los educadores deben prestar atención a cómo equilibrar el papel de apoyo de la IA y el desarrollo de las habilidades básicas de los estudiantes.

8. Amazon lanza el modelo de voz AI de nueva generación Nova Sonic, que captura cambios en el tono, la entonación y el ritmo

El nuevo modelo de voz de IA Nova Sonic, lanzado recientemente por Amazon, tiene como objetivo mejorar el rendimiento de su asistente de voz Alexa +. Este modelo, que procesa el habla de forma local, puede generar respuestas naturales y fluidas, marcando un gran avance en la tecnología de reconocimiento de voz. Nova Sonic no solo tiene la capacidad de reconocer la voz en entornos complejos, sino que también puede ajustar su respuesta según la entonación y el estilo del usuario, mejorando la experiencia del usuario.

【Resumen de AiBase:】
🌟 Nova Sonic es el nuevo modelo de voz de IA de Amazon, diseñado para mejorar el rendimiento de Alexa +.
💰 El costo de este modelo es un 80% menor que el de GPT-4o de OpenAI, ofreciendo más opciones a los desarrolladores.
🔊 Nova Sonic tiene la capacidad de reconocer el habla en entornos complejos, pudiendo procesar las solicitudes de los usuarios de forma rápida y precisa.
Enlace de detalles: https://www.aboutamazon.com/news/innovation-at-amazon/nova-sonic-voice-speech-foundation-model

9. Google NotebookLM lanzará próximamente una versión para aplicaciones móviles

La herramienta de investigación de inteligencia artificial NotebookLM de Google lanzará próximamente una aplicación cliente móvil independiente, marcando su expansión desde la web a los dispositivos móviles. Esta actualización ofrecerá a los usuarios una experiencia más cómoda, satisfaciendo la demanda de aplicaciones móviles. NotebookLM, desde su lanzamiento, ha recibido una amplia atención por sus funciones innovadoras, y la futura aplicación móvil integrará aún más las capacidades de búsqueda de Google, mejorando la eficiencia del procesamiento de información.

【Resumen de AiBase:】
🚀 NotebookLM lanzará versiones para iOS y Android, mejorando la comodidad de uso en dispositivos móviles.
🔍 Se agrega la función "Discover Sources", que permite a los usuarios buscar e integrar automáticamente el contenido web en sus cuadernos.
🎙️ En el futuro, es posible que se integre profundamente con la capacidad de búsqueda de Google, permitiendo la conversión de URL a resúmenes y mapas mentales.

10. Tecnología de generación de video AI TTT: puede generar directamente un minuto de animación completa de Tom y Jerry sin necesidad de edición ni empalme

Esta investigación, mediante la introducción de una capa de entrenamiento en tiempo de prueba, ha logrado generar un minuto de video de animación de "Tom y Jerry", marcando un nuevo avance en la tecnología de generación de video de IA. Esta tecnología presenta un excelente rendimiento en la coherencia de las imágenes y la integridad de la historia, sin necesidad de edición posterior, mostrando el enorme potencial de la IA en la producción de contenido creativo. Aunque existen algunos defectos, sus perspectivas de aplicación son amplias, y en el futuro podría cambiar el modo de producción de video.

【Resumen de AiBase:】
🚀 Mediante la introducción de la capa TTT, el modelo puede generar un minuto de animación completa sin necesidad de edición posterior.
🎨 El video generado presenta un excelente rendimiento en la consistencia temporal y la coherencia de la historia, acercándose a la calidad de la animación tradicional.
💡 Esta tecnología podría reducir los costos de producción de video y acelerar el proceso creativo, pudiendo expandirse en el futuro a contenidos más complejos.
Enlace de detalles: https://test-time-training.github.io/video-dit/

11. Oficina de Ciberespacio: hasta el 31 de marzo de 2025, ya se han registrado 346 servicios de IA generativa

El 8 de abril, la Oficina de Ciberespacio de Shanghai publicó un anuncio que revela la situación del registro de servicios de inteligencia artificial generativa hasta el 31 de marzo de 2025. De acuerdo con los requisitos de la Oficina Nacional de Información de Internet de China, los departamentos de ciberespacio y las unidades relevantes están promoviendo conjuntamente el trabajo de registro de servicios de inteligencia artificial generativa para promover la innovación y la aplicación regulada en este campo.

【Resumen de AiBase:】

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Boletín diario de IA: Alibaba y Tencent brindan soporte completo al protocolo MCP; Modelo de inferencia multimodal Step-R1-V-Mini de Jieyue Xingchen; Modelo de generación de imágenes Miracle F1 de Meitu WHEE

站长之家

Este artículo proviene de AIbase Daily