Boletín diario de IA: Douyin prueba la integración de Doubao AI; iDream integra DeepSeek para generar indicaciones inteligentes; el modo de voz de Grok está completamente abierto

¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del ámbito de la IA, enfocados en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de los productos de IA.

Productos de IA nuevos infórmese aquí: https://top.aibase.com/

1. Douyin se integra con Doubao AI: ByteDance inicia una estrategia de ecosistema de súper IA

La aplicación Douyin está probando la integración con Doubao AI, lo que marca la aceleración de ByteDance en el desarrollo de su ecosistema de IA. Al abrir accesos en la interfaz de videos cortos y la lista de mensajes, Douyin busca romper las barreras entre los productos de IA y las plataformas de tráfico, mejorando las capacidades de IA y atrayendo más tráfico de usuarios. ByteDance también está impulsando varias líneas de negocio de productos de IA, mostrando un ecosistema de productos de IA integral.

【Resumen de AiBase:】
📱 Douyin está probando la integración con Doubao AI, abriendo dos accesos estratégicos para mejorar las capacidades de IA y el tráfico de usuarios.
💡 ByteDance está impulsando varias líneas de productos de IA internamente, cubriendo múltiples áreas y mostrando un ecosistema de IA integral.
🏆 Los gigantes de internet dan mucha importancia a la aplicación de la tecnología de IA en los ecosistemas de contenido, dando inicio a una nueva era de ecosistemas de servicios de IA.

2. ¡Unión de fuerzas! Jimeng se integra con DeepSeek: de la frase clave a la pintura en un solo paso

La colaboración entre Jimeng y DeepSeek ha traído una gran comodidad a los amantes del arte con IA. Gracias a la función de generación inteligente de frases clave de DeepSeek, los usuarios ya no necesitan preocuparse por la inspiración creativa. Solo necesitan ingresar sus necesidades para obtener frases clave precisas y, a continuación, generar imágenes de alta calidad. Esta innovadora colaboración no solo mejora la eficiencia creativa, sino que también hace que el proceso de pintura sea más fluido y agradable.

【Resumen de AiBase:】
🖌️ Jimeng se integra con DeepSeek, ofreciendo una función de generación inteligente de frases clave para resolver los problemas creativos de los usuarios.
✨ Los usuarios solo necesitan ingresar necesidades simples, y DeepSeek puede generar frases clave detalladas y precisas, mejorando la eficiencia creativa.
🌟 Las frases clave generadas por DeepSeek son de alta calidad y pueden guiar eficazmente a la IA para generar imágenes de alta calidad, con buena respuesta por parte de los usuarios.

3. Modo de voz de Grok totalmente abierto: 11 modos disponibles, con subtítulos integrados, se convierte en una herramienta poderosa para el aprendizaje del inglés

El asistente de IA Grok de la compañía xAI ha abierto oficialmente su esperado modo de voz a todos los usuarios, ofreciendo 11 modos únicos de interacción de voz y una función de subtítulos de voz. Esta actualización no solo mejora la experiencia interactiva de los usuarios, sino que también proporciona una nueva herramienta de aprendizaje para los estudiantes de inglés. Los usuarios han respondido con entusiasmo a esta actualización. Aunque actualmente solo admite inglés, la diversidad de expresiones y la fluidez de Grok han recibido altas calificaciones de los usuarios, y la expectativa de una futura expansión del soporte de idiomas está aumentando.

【Resumen de AiBase:】
🎤 El modo de voz de Grok ya está disponible para todos los usuarios, ofreciendo 11 estilos de interacción únicos, incluyendo 2 modos con restricciones para mayores de 18 años.
📚 La nueva función de subtítulos de voz ayuda a los usuarios a comprender mejor el contenido, convirtiéndose en una herramienta práctica para el aprendizaje del inglés.
🌍 Los usuarios elogian la fluidez y la expresión emocional de Grok, y esperan que en el futuro admita más idiomas.

4. Reestructuración y ajuste de vivo, se crea un nuevo departamento de IA y el entrenamiento de grandes modelos se orienta al lado del cliente

vivo ha realizado recientemente un importante ajuste en su estructura organizativa, creando un nuevo departamento de IA, lo que demuestra su continua inversión y estrategia en el campo de la inteligencia artificial. El nuevo departamento se centrará en el entrenamiento de grandes modelos en el lado del cliente y suspenderá la evaluación de la comercialización, reflejando la importancia que vivo concede al desarrollo a largo plazo de la tecnología de IA. Además, vivo también lanzó DeepSeek-R1, mejorando el nivel de inteligencia del asistente de IA y promoviendo aún más la mejora de la experiencia del usuario.

【Resumen de AiBase:】
🆕 vivo crea un nuevo departamento de IA, lo que marca la continua inversión y estrategia de la empresa en tecnología de inteligencia artificial.
📉 Debido a la intervención de la administración, vivo decide suspender temporalmente la evaluación de la comercialización de los grandes modelos de IA y suspender la inversión de capital.
🚀 El recién lanzado DeepSeek-R1 ha mejorado el nivel de inteligencia del asistente de IA, y la experiencia del usuario ha mejorado notablemente.

5. Nueva tecnología Fast3R: reconstrucción 3D de miles de imágenes con un solo clic, ¡velocidad asombrosa!

Fast3R es una innovadora tecnología de reconstrucción 3D multiperspectiva que puede procesar hasta 1500 imágenes en una sola propagación hacia adelante, mejorando significativamente la velocidad de reconstrucción. En comparación con el método tradicional DUSt3R, Fast3R utiliza una arquitectura basada en Transformer para procesar en paralelo la información de las vistas, eliminando el complejo proceso de alineación, mejorando la velocidad de inferencia y reduciendo la acumulación de errores.

【Resumen de AiBase:】
🌟 La tecnología Fast3R puede procesar hasta 1500 imágenes en una sola propagación hacia adelante, aumentando considerablemente la velocidad de reconstrucción 3D.
⚡ La arquitectura Transformer de Fast3R admite el procesamiento paralelo, eliminando el complejo proceso de alineación de los métodos tradicionales.
🚀 En comparación con DUSt3R, Fast3R muestra ventajas significativas en tiempo y uso de memoria, siendo adecuada para aplicaciones de reconstrucción 3D a gran escala.
Enlace de detalles:https://fast3r-3d.github.io/

6. ¡Una bomba en el campo de la creación musical! DiffRhythm irrumpe en escena: ¡canciones de IA de 10 segundos, voz y acompañamiento con un solo clic!

La aparición de DiffRhythm marca una nueva era en la creación musical. Mediante el modelo de difusión, ha logrado la generación automática de música de extremo a extremo. Los usuarios solo necesitan ingresar la letra y el estilo para obtener una canción completa en tan solo 10 segundos. DiffRhythm no solo puede generar acompañamiento, sino que también puede crear letras automáticamente, combinándose perfectamente con la melodía, lo que revoluciona el modo tradicional de creación musical y abre una nueva era para la creación musical con IA.

【Resumen de AiBase:】
🎤 DiffRhythm utiliza un modelo de difusión para lograr la creación musical de extremo a extremo. Los usuarios solo necesitan ingresar la letra y el estilo para generar una canción completa.
⚡ La velocidad de generación es extremadamente rápida, solo se necesitan 10 segundos para completar una canción de 4 minutos y 45 segundos, 50 veces más rápido que los métodos tradicionales.
🎼 Incorpora un potente modelo de lenguaje grande que puede crear letras automáticamente y combinarlas perfectamente con la melodía, revolucionando por completo la forma tradicional de componer.
Enlace de detalles:https://huggingface.co/spaces/ASLP-lab/DiffRhythm

7. Microsoft lanza el modelo de imagen ART de código abierto, que puede generar imágenes transparentes de múltiples capas

En el campo de la generación de imágenes, la tecnología "Anonymous Region Transformer" (ART) desarrollada por investigadores de Microsoft ha revolucionado la forma en que los usuarios interactúan con los modelos generativos. Mediante la disposición de regiones anónimas, ART puede generar imágenes transparentes de múltiples capas directamente a partir de indicaciones de texto globales e introduce un mecanismo de recorte de regiones por capas, lo que aumenta considerablemente la eficiencia de generación, siendo 12 veces más rápido que los métodos tradicionales.

【Resumen de AiBase:】
🌟 ART puede generar imágenes transparentes de múltiples capas directamente a partir de indicaciones de texto globales y la disposición de regiones anónimas.
⚡️ Emplea un mecanismo de recorte de regiones por capas, mejorando significativamente la eficiencia de generación de imágenes, 12 veces más rápido que los métodos tradicionales.
💡 El nuevo autocodificador de alta calidad admite el control y la generación precisos de imágenes transparentes de múltiples capas, impulsando la creación de contenido interactivo.
Enlace de detalles:https://art-msra.github.io/

8. Herramienta de mapas mentales con IA MindMapper: genera mapas mentales interactivos simplemente con un enlace

En la era de la explosión de información, la aplicación Mind Mapper se ha convertido en una herramienta eficaz para organizar el pensamiento. Puede transformar las ideas de los usuarios en mapas mentales vívidos. Solo necesita ingresar una URL, un enlace de video de YouTube o una indicación de texto para generar rápidamente un mapa mental interactivo.

【Resumen de AiBase:】
🖥️ Mind Mapper puede transformar las ideas en mapas mentales vívidos, admitiendo la entrada de URL, enlaces de video y indicaciones de texto.
🎨 Utiliza la tecnología Mermaid.js, los mapas mentales no solo son estéticamente agradables, sino que también tienen funciones de interacción dinámica, permitiendo a los usuarios obtener fácilmente información detallada.
📤 Ofrece la función de descargar mapas mentales como imágenes PNG, facilitando a los usuarios compartir conocimientos e inspiración.
Enlace de detalles:https://github.com/misbahsy/MindMapper

9. Lei Jun aparece en el primer canal de representantes: Xiaomi aplicará la última tecnología de IA a todos sus terminales

En el primer "canal de representantes" de la tercera sesión de la XIV Asamblea Popular Nacional, el fundador de Xiaomi, Lei Jun, respondió a las preguntas de los periodistas, profundizando en el papel de Xiaomi en la industria manufacturera y la dirección de la innovación tecnológica. Destacó que la industria manufacturera es la base del país, y que Xiaomi aumentará la inversión en I+D, especialmente en el campo de la inteligencia artificial, para mejorar la experiencia tecnológica de los consumidores y contribuir a la modernización al estilo chino.

【Resumen de AiBase:】
🏭 La industria manufacturera es la base del país, y Xiaomi seguirá firmemente el camino de la innovación tecnológica y el desarrollo de alta gama.
💰 Xiaomi planea invertir 105.000 millones de yuanes en I+D entre 2021 y 2025, con una previsión de 30.000 millones de yuanes en 2025, y los negocios relacionados con la IA representan una cuarta parte.
🌍 Xiaomi se dedica a aplicar la última tecnología de IA en campos como teléfonos móviles, automóviles y hogares inteligentes, mejorando su influencia en el mercado global.

10. Ai Poetry Technology completa la ronda de financiación A5, apuntando a nuevas alturas en el campo de la generación de video con IA

Ai Poetry Technology anunció recientemente la finalización de su ronda de financiación A5, con una inversión exclusiva de Jingya Capital, por un monto superior a los 400 millones de yuanes, convirtiéndose en una empresa estrella en el campo de la generación de video con IA. Fundada en 2023 por Wang Changhu, ex responsable de tecnología visual de ByteDance, la empresa cuenta con un sólido equipo y ha recibido rápidamente el favor de numerosos inversores. Esta ronda de financiación se utilizará para acelerar la I+D y la incorporación de talento, con el objetivo de crear modelos y aplicaciones líderes de generación de video con IA.

【Resumen de AiBase:】
📈 Ai Poetry Technology completa la ronda de financiación A5, con un monto superior a los 400 millones de yuanes, convirtiéndose en una empresa estrella en el campo de la generación de video con IA.
🌍 Su producto PixVerse cuenta con más de 40 millones de usuarios y 15 millones de usuarios activos mensuales, con una tecnología líder.
💼 La empresa planea acelerar el desarrollo de modelos e incorporar talento de alto nivel, expandiendo activamente los servicios empresariales B2B y enfrentándose a los desafíos de la comercialización.

AI Diario

Boletín diario de IA: Douyin prueba la integración de Doubao AI; iDream integra DeepSeek para generar indicaciones inteligentes; el modo de voz de Grok está completamente abierto

站长之家

Este artículo proviene de AIbase Daily