¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del ámbito de la IA, con enfoque en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Conozca los nuevos productos de IA aquí: https://top.aibase.com/

1. Luma AI lanza el modelo de generación de video Ray2, logrando efectos de movimiento más rápidos y naturales

Luma AI ha lanzado recientemente el modelo de generación de video Ray2, lo que representa un avance significativo en el campo de la creación de videos con IA. Ray2, entrenado con una gran cantidad de datos, ha mejorado la velocidad y la naturalidad de la generación de videos. Los usuarios pueden generar videos cortos con simples descripciones de texto. Aunque en indicaciones complejas puede haber distorsiones, la retroalimentación general es positiva. Para celebrar este lanzamiento, Luma Labs también ha organizado un concurso, animando a los creadores a participar con la oportunidad de ganar premios.

【Resumen de AiBase:】

🌟 Se lanza el modelo de generación de video Ray2, mejorando la eficiencia y la naturalidad de la creación de videos.

🎥 Permite la generación rápida de video a partir de texto, facilitando la creación de videos cortos para los usuarios.

💰 Se organiza el concurso Ray2, donde los creadores tienen la oportunidad de ganar hasta 7000 dólares en premios.

Enlace de detalles: https://lumalabs.ai/ray

2. xAI, de Musk, lanza la versión web de Grok; no se necesita cuenta X para experimentarla

Recientemente, xAI, la compañía de Elon Musk, lanzó la versión web del chatbot de IA Grok. Los usuarios pueden experimentar sus potentes funciones sin necesidad de acceder a X.com o tener una cuenta X. Solo con visitar grok.com en su navegador y proporcionar su año de nacimiento, los usuarios pueden usar este chatbot inteligente. Grok AI no solo recopila información en tiempo real y responde preguntas, sino que también puede generar imágenes, ofreciendo una experiencia de usuario sencilla.

【Resumen de AiBase:】

🌐 Se lanza la versión web de Grok AI; no se necesita una cuenta X para usarla.

🤖 Solo se necesita el año de nacimiento para experimentar la función de chat inteligente.

🔒 El modo temporal protege la privacidad del usuario; el contenido del chat no se registra.

3. 智谱AI se convierte en la primera empresa china de modelos grandes en ser incluida en la lista de entidades del gobierno estadounidense; afirma que no se ve afectada

智谱AI ha sido incluida en la lista de entidades sujetas a control de exportaciones del Departamento de Comercio de Estados Unidos, convirtiéndose en la primera empresa china de modelos grandes en ser sancionada. A pesar de las sanciones, 智谱AI enfatiza que su tecnología proviene de la Universidad Tsinghua y afirma que las sanciones no afectarán sustancialmente sus operaciones. 智谱AI continúa innovando en el campo de la tecnología de modelos grandes, mostrando un sólido potencial de mercado y capacidad tecnológica.

【Resumen de AiBase:】

📉 智谱AI se convierte en la primera empresa china de modelos grandes incluida en la lista de entidades de Estados Unidos, marcando una nueva ronda de presión sobre la industria de la IA china.

🔧 La empresa destaca que su tecnología proviene de la Universidad Tsinghua, posee tecnología central de modelos grandes de extremo a extremo y las sanciones no afectarán sus operaciones normales.

📱 智谱AI está negociando una colaboración con Apple, lo que demuestra su capacidad tecnológica y su potencial de mercado.

4. 阶跃星辰 lanza su modelo de razonamiento propio Step Reasoner mini

Shanghai Jieyue Xingchen Intelligent Technology Co., Ltd. ha lanzado su modelo de razonamiento propio Step Reasoner mini (Step R-mini), que destaca por su capacidad de razonamiento ultralargo y su excelente rendimiento en áreas como el razonamiento lógico, la codificación y las matemáticas. Entrenado con aprendizaje por refuerzo a gran escala, Step R-mini puede combinar habilidades de ciencias y humanidades, mostrando un rendimiento excepcional en la resolución de problemas complejos y la creación de contenido.

微信截图_20250116133149.png

【Resumen de AiBase:】

🧠 Step R-mini es el primer modelo de razonamiento que destaca por su capacidad de planificación y reflexión proactivas, ofreciendo respuestas precisas y fiables.

📊 En tareas de matemáticas y razonamiento lógico, Step R-mini muestra una excelente capacidad para resolver problemas, pudiendo manejar problemas complejos y ofrecer múltiples soluciones.

🎨 Este modelo comprende profundamente las necesidades del usuario en la creación de contenido, posee un estilo de expresión innovador y puede generar obras literarias con carga emocional.

Enlace de detalles: https://yuewen.cn

5. El equipo de Qwen de Alibaba publica un nuevo modelo de recompensa de proceso; la inferencia matemática evoluciona de nuevo

Un nuevo artículo del equipo de Qwen de Alibaba presenta la aplicación de un nuevo modelo de recompensa de proceso (PRM) en la inferencia matemática, lanzando la serie de modelos Qwen2.5-Math-PRM. Esto mejora significativamente la precisión y la capacidad de generalización de la inferencia. Estos modelos, mediante un innovador mecanismo de filtrado de consenso y estimación de Monte Carlo, solucionan las deficiencias de los métodos tradicionales en el proceso de inferencia, con amplias perspectivas de aplicación en campos como la educación y el cálculo científico.

QQ20250116-104124.png

【Resumen de AiBase:】

🔍 El nuevo modelo supera las limitaciones del marco PRM existente, mejorando significativamente la precisión y la capacidad de generalización de la inferencia matemática.

📊 El mecanismo de filtrado de consenso reduce eficazmente el ruido de los datos en aproximadamente un 60%, mejorando la calidad de los datos de entrenamiento.

🚀 La serie Qwen2.5-Math-PRM ofrece un rendimiento excelente en varios indicadores de evaluación, superando a muchos modelos propietarios, especialmente en tareas de identificación gradual de errores.

6. Kinetix lanza una nueva tecnología de video con IA que permite un control preciso de los movimientos de los personajes

Kinetix ha lanzado recientemente una innovadora tecnología de video con IA que permite un control preciso de los movimientos de los personajes digitales combinando actuaciones reales e instrucciones de texto. El proceso es sencillo e intuitivo, permitiendo a los usuarios sin experiencia en animación crear contenido de alta calidad rápidamente. Gracias a su potente base de datos de animación 3D y su canal de generación de datos sintéticos, Kinetix reduce drásticamente el tiempo de producción y los costes.

image.png

【Resumen de AiBase:】

🤖 La tecnología de IA de Kinetix permite un control preciso de los movimientos de los personajes digitales combinando videos de actuaciones reales e instrucciones de texto.

💡 El sistema permite la captura precisa de diversos movimientos y expresiones; los usuarios pueden ajustar la velocidad, la amplitud y el ritmo de los movimientos, mejorando el rendimiento de los personajes.

⏱️ El tiempo de producción se reduce de semanas a horas, disminuyendo los costes y permitiendo que equipos pequeños y creadores individuales puedan realizar animaciones profesionales.

Enlace de detalles: https://www.kinetix.tech/character-motion-control-for-video-generation-models

7. Nueva tecnología de coloreado de bocetos MangaNinja: introduce el boceto y la imagen de referencia para colorear con precisión

MangaNinja es una innovadora tecnología de coloreado de bocetos que permite obtener resultados de alta precisión al introducir un boceto e imágenes de referencia. Basada en modelos de difusión, utiliza un módulo de reordenación de parches y un esquema de control impulsado por puntos, mejorando significativamente la precisión y la calidad de la imagen. MangaNinja destaca en el tratamiento de escenas complejas, resolviendo eficazmente problemas como los cambios de postura de los personajes y la confusión de colores, ofreciendo a los usuarios mayor inspiración y posibilidades creativas.

image.png

【Resumen de AiBase:】

🌟 MangaNinja es un método de coloreado de bocetos basado en imágenes de referencia, con capacidad de coincidencia precisa y control detallado.

🎨 Mediante un innovador módulo de reordenación de parches y un esquema de control impulsado por puntos, MangaNinja mejora significativamente la precisión y la calidad de la imagen del coloreado.

🖌️ Esta tecnología puede afrontar diversos desafíos de coloreado, incluyendo posturas extremas y la coordinación de múltiples imágenes de referencia, ofreciendo una experiencia interactiva de coloreado de alta calidad.

Enlace de detalles: https://johanan528.github.io/MangaNinjia/

8. Lanzamiento de Microsoft AutoGen v0.4: gran mejora en la flexibilidad y la capacidad multilingüe de los agentes de IA

La última versión de Microsoft AutoGen, la v0.4, mejora significativamente la flexibilidad y la capacidad de control de los agentes de IA, resolviendo las limitaciones de arquitectura y la baja eficiencia que encontraban los usuarios. El nuevo mecanismo de transmisión de mensajes asíncronos y la interoperabilidad entre idiomas permiten a los desarrolladores construir redes de agentes complejas con mayor facilidad.

image.png

【Resumen de AiBase:】

💡 AutoGen v0.4 mejora la flexibilidad de los agentes de IA, resolviendo los problemas señalados por los usuarios.

🌐 La nueva versión admite la transmisión de mensajes asíncronos y la interoperabilidad entre idiomas, mejorando la capacidad de colaboración entre los agentes.

🔧 La interfaz de bajo código de AutoGen Studio se ha actualizado para facilitar el diseño y la gestión de los agentes.

Enlace de detalles: https://www.microsoft.com/en-us/research/blog/autogen-v0-4-reimagining-the-foundation-of-agentic-ai-for-scale-extensibility-and-robustness/

9. 腾讯会议 se actualiza con el nuevo asistente de IA Pro

腾讯会议 ha lanzado recientemente el asistente de IA Pro, basado en el modelo de parámetros de miles de millones de Tencent HunYuan, con capacidad de comprensión profunda y respuesta rápida, ofreciendo soporte preciso para las reuniones. Esta actualización también optimiza las funciones de colaboración organizativa, mejorando la eficiencia de las reuniones, facilitando la gestión de notificaciones y la grabación y el intercambio. Las nuevas funciones de autenticación de identidad personal y empresarial refuerzan la profesionalidad y la seguridad de las reuniones.

image.png

【Resumen de AiBase:】

🤖 El asistente de IA Pro admite la búsqueda en línea y el procesamiento de varias tareas, comprende en profundidad el contenido de la reunión y ofrece respuestas precisas.

📅 Los usuarios pueden crear organizaciones directamente en la reunión, agregar participantes rápidamente y mejorar la eficiencia de la reunión.

🔒 La nueva función de autenticación de identidad mejora la seguridad y la profesionalidad de las reuniones, mejorando la experiencia del usuario.

10. Una startup utiliza agentes de IA para publicar masivamente anuncios en Reddit sin ser detectada

Recientemente, la startup Astral ha llamado la atención por el uso de la tecnología de IA para publicar anuncios en Reddit. La fundadora, Savana Fedde, mostró la rápida capacidad de aplicación de esta tecnología, capaz de generar contenido similar a las discusiones de los usuarios para promocionar los productos de sus clientes. Este método no solo es eficiente, sino que también puede insertar información publicitaria sin ser detectado, generando preocupaciones sobre el futuro del espacio online y la posible erosión de Internet por la comercialización y la información basura sin fin.

image.png

【Resumen de AiBase:】

💡 Astral utiliza la tecnología de IA para generar rápidamente publicaciones publicitarias similares a las de los usuarios en Reddit.

📈 La fundadora diseñó agentes de IA para eludir las restricciones de Reddit, centrándose en la promoción comercial en lugar del servicio al usuario.

🚨 Esta acción genera preocupación sobre el futuro del contenido online; las redes sociales podrían llenarse de anuncios e información basura.

11. 智谱 lanza los modelos GLM-4-Air y GLM-4V-Plus; crea el modelo multimodal gratuito Flash

智谱华章 Technology Co., Ltd. ha lanzado los nuevos modelos GLM-4-Air y GLM-4V-Plus, y ha presentado el nuevo modelo de extremo a extremo GLM-Realtime, que permite una comprensión de video y una interacción de voz con baja latencia. La empresa se dedica a ofrecer soluciones de modelos lingüísticos rentables y ha creado el modelo multimodal gratuito Flash, compatible con diversas aplicaciones para ayudar a los desarrolladores a innovar.

图片

【Resumen de AiBase:】

🌟 Se lanza GLM-Realtime, con función de canto a capella y capacidad de memoria de 2 minutos.

💡 GLM-4-Air-0111 se actualiza completamente, reduciendo el umbral de aplicación al 50% del anterior.

📈 Serie de modelos multimodales gratuitos Flash, compatible con la comprensión y generación multimodales.

Entrada al proyecto: bigmodel.cn

12. Vidu 2.0 se lanza oficialmente; genera videos cortos en 10 segundos, con mejor consistencia del tema principal

El modelo de video grande Vidu ha lanzado oficialmente la versión 2.0, reduciendo el tiempo de generación de videos cortos de 30 segundos a 10 segundos, mejorando la eficiencia tres veces. La nueva versión optimiza la calidad del video, garantizando la consistencia del estilo y del tema principal, con transiciones naturales y fluidas entre el principio y el final. Vidu 2.0 también ofrece paquetes de valor añadido, reduciendo los costes de creación y permitiendo la generación masiva y los pagos locales para mayor comodidad del usuario.

QQ20250115-170654.jpg

【Resumen de AiBase:】

🎥 Vidu 2.0 reduce el tiempo de generación de videos cortos de 30 segundos a 10 segundos.

💡 La nueva versión optimiza la calidad del video y la consistencia.

💰 Los paquetes de valor añadido y los pagos locales mejoran la experiencia de creación del usuario.