¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del ámbito de la IA, con enfoque en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Conozca los nuevos productos de IA aquí: https://top.aibase.com/

1. Lanzamiento oficial de la versión definitiva de "Jichuang", la herramienta AIGC de Giant Engine

La herramienta AIGC "Jichuang" de Giant Engine se ha lanzado oficialmente, ofreciendo diversas maneras de generar contenido, incluyendo la generación de guiones de IA, edición inteligente de videos y personajes digitales. Esta plataforma, mediante el aprendizaje profundo y el procesamiento del lenguaje natural, permite a los usuarios generar contenido de texto y video de alta calidad simplemente introduciendo un tema. Las nuevas funciones de "explosión viral" y aprobación con un clic ayudan a los creadores a responder rápidamente a los cambios del mercado, mejorando la eficiencia creativa y el cumplimiento normativo del contenido.

image.png

【Resumen de AiBase:】

🌟 Jichuang admite la generación de diversos tipos de contenido, mejorando la eficiencia creativa.

📊 Las nuevas funciones de "explosión viral" y aprobación con un clic ayudan a los creadores a responder rápidamente al mercado.

🎨 La tecnología de IA lidera la revolución de la creación de contenido, animando a los creadores a explorar nuevas herramientas.

Enlace de detalles: https://top.aibase.com/tool/douyinjichuang

2. Tongyi Wanxiang presenta el modelo de video 2.1, mejorando significativamente la capacidad de movimiento complejo

El modelo de generación de video Tongyi Wanxiang de Alibaba ha experimentado una importante actualización en su última versión 2.1, lanzando una versión rápida y una versión profesional, enfocadas en el rendimiento eficiente y la capacidad de expresión excepcional, respectivamente. Esta versión ha logrado un progreso significativo en el manejo de movimientos complejos y la reproducción de leyes físicas reales, mejorando la calidad cinematográfica de los videos y la capacidad de seguir instrucciones.

image.png

【Resumen de AiBase:】

🚀 La nueva versión se divide en versión rápida y profesional, mejorando el rendimiento eficiente y la capacidad de expresión.

🐱 Los videos generados son ricos en detalles, resolviendo con éxito el problema de los "garabatos", permitiendo la generación precisa de texto en inglés y chino.

🎬 Los efectos de cámara son como los de un maestro del cine, capaces de ajustar automáticamente la cámara para mejorar la estética del video.

Enlace de detalles: https://tongyi.aliyun.com/wanxiang/videoCreation

3. Microsoft lanza oficialmente el potente modelo pequeño Phi-4 de código abierto

Microsoft ha lanzado en la plataforma Hugging Face el modelo de lenguaje pequeño Phi-4, con 14 mil millones de parámetros, que ofrece un rendimiento excepcional, superando a varios modelos conocidos como GPT-4o y Llama-3.1. Phi-4 obtuvo 91.8 puntos en la competición matemática AMC y 84.8 puntos en la prueba MMLU, demostrando una potente capacidad de razonamiento. Este modelo utiliza un innovador método de generación de datos sintéticos, admite una longitud de contexto de hasta 16k y es adecuado para hardware de consumo.

image.png

【Resumen de AiBase:】

🧩 El modelo Phi-4 de Microsoft, con solo 14 mil millones de parámetros, supera en las pruebas de rendimiento a varios modelos conocidos como GPT-4o y Llama-3.1.

📈 Phi-4 destaca en matemáticas y capacidad de razonamiento, obteniendo altas puntuaciones en las pruebas AMC y MMLU.

🌍 Este modelo es de código abierto y admite usos comerciales, atrayendo la atención de numerosos desarrolladores y entusiastas de la IA.

Enlace de detalles: https://huggingface.co/microsoft/phi-4

4. Nueva técnica de restauración de video SeedVR: de borroso a alta definición, puede procesar videos de cualquier longitud

En el contexto del rápido desarrollo de los medios digitales, la mejora de la calidad del video se ha convertido en un tema importante. La tecnología SeedVR, desarrollada por un equipo de investigación de la Universidad Tecnológica de Nanyang y ByteDance, utiliza un innovador mecanismo de atención de ventana móvil para mejorar significativamente los resultados de la restauración de video, especialmente en el procesamiento de videos generados por IA. Esta tecnología no solo puede procesar videos de cualquier longitud, sino que también puede reparar eficazmente los detalles de la imagen, ofreciendo a los usuarios una experiencia visual más realista.

image.png

【Resumen de AiBase:】

🌟 SeedVR utiliza un mecanismo de atención de ventana móvil, mejorando con éxito la capacidad de procesamiento de secuencias de video largas.

🎥 Esta tecnología utiliza un tamaño de ventana mayor, mejorando significativamente la calidad de restauración de videos de alta resolución.

🚀 Combinando varias técnicas modernas, SeedVR ofrece un rendimiento excepcional en varias pruebas de referencia, especialmente para videos generados por IA.

Enlace de detalles: https://iceclear.github.io/projects/seedvr/

5. TransPixar de Adobe integra sin problemas efectos transparentes como humo y reflejos en las escenas

El sistema TransPixar, desarrollado conjuntamente por Adobe Research y la Universidad de Ciencia y Tecnología de Hong Kong, ha revolucionado la producción de efectos visuales, especialmente en el tratamiento de elementos transparentes. Esta tecnología genera efectos visuales que incluyen canales alfa, mejorando significativamente la eficiencia de producción y reduciendo los costos. El lanzamiento de TransPixar, en un momento de creciente demanda de efectos de alta calidad en la industria, presagia un cambio en los flujos de trabajo de producción cinematográfica del futuro.

【Resumen de AiBase:】

🌟 TransPixar, mediante innovadoras técnicas de IA, puede generar efectos transparentes de alta calidad con datos de entrenamiento limitados, simplificando el proceso de producción de efectos especiales.

💡 Este sistema no solo mejora la eficiencia del trabajo de los grandes equipos de producción, sino que también reduce los costos de producción para los pequeños estudios, permitiéndoles lograr efectos especiales complejos.

🚀 TransPixar muestra un enorme potencial en aplicaciones en tiempo real, capaz de generar rápidamente efectos transparentes, adecuados para videojuegos y realidad aumentada.

6. ¡Producto conjunto de ByteDance y universidades! Modelo STAR: mejora la claridad y la resolución de video

La tecnología STAR, desarrollada conjuntamente por el equipo de investigación de la Universidad de Nanjing, ByteDance y la Universidad del Suroeste, utiliza un modelo de texto a video para lograr el procesamiento de superresolución de video, mejorando significativamente la calidad de los videos de baja resolución. Esta tecnología, combinada con métodos de mejora espacio-temporal, es adecuada para videos de baja claridad descargados de plataformas para compartir videos. El equipo de investigación ya ha publicado en GitHub el modelo preentrenado y el código de inferencia, con un proceso de uso sencillo, impulsando el progreso en el campo del procesamiento de video.

image.png

【Resumen de AiBase:】

🌟 La nueva tecnología STAR, combinada con el modelo de texto a video, logra la superresolución de video, mejorando la calidad del video.

🛠️ El equipo de investigación ya ha publicado el modelo preentrenado y el código de inferencia, con un proceso de uso sencillo e intuitivo.

📩 Se proporciona información de contacto para animar a los usuarios a comunicarse y discutir con el equipo de investigación.

Enlace de detalles: https://github.com/NJU-PCALab/STAR

7. Stability AI lanza SPAR3D: generación de objetos 3D a partir de una sola imagen en un segundo

En la feria CES, Stability AI presentó SPAR3D, una innovadora tecnología de generación 3D en dos etapas que puede generar objetos 3D precisos a partir de una sola imagen en menos de un segundo. SPAR3D no solo proporciona una forma eficiente de diseño de prototipos 3D, sino que también permite a los usuarios editar en tiempo real los objetos 3D generados, mejorando la flexibilidad creativa.

image.png

【Resumen de AiBase:】

⚡ Capacidad de generación en tiempo real: SPAR3D puede generar objetos 3D completos a partir de una sola imagen en un segundo y admite una edición rápida.

🔍 Predicción precisa de la estructura: proporciona formas geométricas precisas y vistas de 360 grados, incluidas las áreas ocultas, garantizando una salida de alta resolución.

🚀 Política de uso abierta: admite usos comerciales y no comerciales, los usuarios pueden obtener y utilizar el modelo de diversas maneras.

Enlace de detalles: https://stability.ai/news/stable-point-aware-3d

8. 238 servicios de inteligencia artificial generativa completaron el registro en la Oficina Nacional de Internet de China en 2024

La Oficina Nacional de Información de Internet de China publicó un anuncio el 8 de enero, indicando que hasta el 31 de diciembre de 2024, 302 servicios habían completado el registro, de los cuales 238 fueron añadidos en 2024. Esto demuestra el rápido desarrollo del sector y la aprobación oficial de más servicios nuevos. El anuncio también exige que las empresas que ofrecen servicios con atributos de opinión pública se registren y mejoren la transparencia de las aplicaciones ya lanzadas para garantizar el cumplimiento y la seguridad.

【Resumen de AiBase:】

🌟 En 2024, un total de 302 servicios de inteligencia artificial generativa completaron el registro en la Oficina Nacional de Internet de China, con 238 nuevos servicios.

🔍 Las empresas que ofrecen servicios con atributos de opinión pública pueden registrarse a través de los departamentos de ciberseguridad locales para garantizar el cumplimiento.

📝 Las aplicaciones ya lanzadas deben publicar la información de los servicios registrados que utilizan para mejorar la transparencia.

9. Lista de las 50 empresas de inteligencia artificial más importantes de China 2024 de Hurun: iFlytek en segundo lugar, SenseTime en tercer lugar

Se ha publicado oficialmente la lista de las 50 empresas de inteligencia artificial más importantes de China 2024 de Hurun. Cambrian ocupa el primer lugar con una valoración de 238.000 millones de RMB, demostrando su gran capacidad en el campo de la IA. iFlytek y SenseTime ocupan el segundo y tercer lugar con valoraciones de 116.000 millones y 50.000 millones de RMB, respectivamente. La lista muestra que Pekín, Shanghái y Shenzhen son los principales centros de empresas de IA, representando conjuntamente el 80% de las empresas incluidas en la lista.

【Resumen de AiBase:】

🌟 Cambrian ocupa el primer lugar con una valoración de 238.000 millones de RMB, seguido de iFlytek y SenseTime en segundo y tercer lugar, respectivamente.

🏙️ Pekín, Shanghái y Shenzhen se han convertido en los principales centros de empresas de inteligencia artificial, representando conjuntamente el 80% de las empresas incluidas en la lista.

📊 Esta lista se centra en empresas de inteligencia no encarnada, y no incluye empresas de robótica y casas inteligentes.

10. ¡No lo creerá! Repetir esta simple instrucción hace que la generación de código de IA sea 100 veces más rápida

Max Woolf, científico de datos senior de BuzzFeed, realizó un experimento utilizando el modelo de lenguaje Claude 3.5. Al solicitar repetidamente a la IA que mejorara el código, logró reducir el tiempo de ejecución de 657 milisegundos a 6 milisegundos, mejorando el rendimiento en 100 veces. En el experimento, la IA demostró su comprensión única de "mejor código", añadiendo automáticamente características empresariales.

【Resumen de AiBase:】

🌟 La IA mejora el rendimiento del código mediante instrucciones repetidas, reduciendo el tiempo de ejecución del código original de 657 milisegundos a 6 milisegundos.

💡 La IA añade automáticamente características empresariales al código, mostrando su comprensión única de "mejor código".

🛠️ La ingeniería de prompts sigue siendo importante, las solicitudes precisas pueden acelerar la generación de resultados, pero los desarrolladores humanos aún necesitan verificar y corregir.

11. NVIDIA lanza la tecnología Groot Teleop, que permite entrenar robots a través de Apple Vision Pro

NVIDIA presentó en la feria CES una serie de tecnologías innovadoras destinadas a acelerar el desarrollo de robots humanoides, especialmente en los sectores industrial y manufacturero. Mediante el plan Isaac GR00T, los desarrolladores pueden utilizar el aprendizaje por imitación para generar una gran cantidad de datos de movimiento sintéticos para entrenar robots humanoides. Esta tecnología no solo reduce el tiempo y el costo de recopilación de datos, sino que también genera videos con conciencia física a través de la plataforma Cosmos, impulsando el desarrollo de la inteligencia artificial física.

image.png

【Resumen de AiBase:】

🚀 NVIDIA lanza el plan Isaac GR00T, utilizando el aprendizaje por imitación para generar datos de movimiento sintéticos y acelerar el desarrollo de robots humanoides.

📊 La plataforma Cosmos, entrenada con 18 billones de datos, genera videos con conciencia física, promoviendo el desarrollo de la inteligencia artificial física.

🤝 Varias empresas de robótica ya han adoptado la tecnología Isaac GR00T, mostrando buenos resultados de aplicación.

12. ¡Invento escalofriante! Un ingeniero crea un rifle robótico con ChatGPT, OpenAI interviene inmediatamente

Recientemente, el ingeniero STS3D creó un rifle robótico capaz de apuntar y disparar mediante instrucciones de ChatGPT, mostrando una velocidad de respuesta y precisión asombrosas. Este invento ha generado un amplio debate, especialmente sobre la preocupación de convertir la tecnología de ciencia ficción en realidad. OpenAI respondió rápidamente, indicando que esta acción viola las políticas de la empresa y prohíbe el uso de sus servicios para desarrollar armas.

【Resumen de AiBase:】

🌐 OpenAI corta rápidamente la relación con el ingeniero que desarrolló el rifle robótico por violar las políticas de uso.

🤖 El rifle robótico de STS3D puede apuntar y disparar según las instrucciones de ChatGPT, mostrando una alta precisión.

⚔️ Aunque OpenAI modificó sus políticas el año pasado, aún prohíbe el uso de sus servicios para desarrollar cualquier tipo de arma.