¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentamos los temas más relevantes del ámbito de la IA, con enfoque en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de los productos de IA.

Conozca los nuevos productos de IA aquí

1. Actualización del modelo 1.5 de la plataforma de IA KeLing: se añade la función de modelo de rostro y el «modo estándar»

La plataforma de IA KeLing se ha actualizado recientemente a la versión 1.5, lanzando varias funciones nuevas, incluyendo un modo mejorado de generación de vídeo de alta calidad y un nuevo modo estándar, que permite generar vídeos de 720p rápidamente. La nueva función de modelo de rostro está disponible para los miembros premium, quienes pueden generar vídeos en cualquier momento después del entrenamiento.

image.png

微信截图_20241125091339.png

【Resumen de AiBase:】

🎨 Se ha mejorado el modo de alta calidad, permitiendo a los usuarios especificar la trayectoria del movimiento y añadir zonas estáticas para un control más preciso.

⚡ Se ha añadido un modo estándar para generar vídeos de 720p rápidamente, reduciendo significativamente el tiempo de creación y ofreciendo una excelente relación calidad-precio.

👤 La función de modelo de rostro está disponible para los miembros premium, resolviendo el problema de la conservación de la identidad facial y permitiendo la generación de vídeos en cualquier momento.

2. Runway añade la función de ampliación de vídeo «Expand Video»

Runway ha lanzado recientemente la función «Expand Video», que permite a los usuarios generar contenido visual adicional a partir del vídeo original mediante indicaciones de texto y ajustar el vídeo. Esta función admite efectos dinámicos, como el zoom rápido y el alejamiento, para hacer los vídeos más dinámicos. Esta herramienta marca un nuevo avance en la tecnología de generación de vídeo, enriqueciendo aún más las posibilidades creativas.

【Resumen de AiBase:】

🎥 Nueva función: RunwayML lanza «Expand Video», que permite a los usuarios ampliar el contenido de un vídeo original mediante indicaciones de texto.

⚙️ Implementación de efectos dinámicos: Los usuarios pueden crear efectos dinámicos como zoom rápido y alejamiento, mejorando la experiencia visual del vídeo.

🚀 Aumento de la velocidad de generación: El nuevo modelo Gen-3Alpha genera vídeos significativamente más rápido, satisfaciendo las necesidades de creación rápida de los usuarios.

3. La serie Huawei Mate70 admitirá la transferencia inalámbrica por IA, demostrada por Yu Chengdong en persona

La próxima serie Huawei Mate70 incorporará la función de transferencia inalámbrica por IA y gestos mágicos. Los usuarios podrán transferir contenido fácilmente con gestos, mejorando la experiencia de usuario. Además, la serie Mate70 incorporará por primera vez el sistema operativo HarmonyOS nativo, lo que marca un avance de Huawei en el ámbito de los sistemas operativos móviles.

【Resumen de AiBase:】

🤖 Transferencia inalámbrica por IA: Los usuarios pueden transferir contenido fácilmente desde su teléfono Mate70 a una tablet con simples gestos.

✋ Gestos mágicos: Cuando no se puedan utilizar las manos, los usuarios pueden utilizar gestos para pasar páginas, etc., aumentando la flexibilidad.

🌐 Sistema operativo HarmonyOS nativo: La serie Mate70 incorpora por primera vez el sistema operativo HarmonyOS nativo, lo que marca un avance de China en el ámbito de los sistemas operativos móviles.

4. Lightricks lanza el modelo de generación de vídeo en tiempo real de código abierto LTX-Video ¡Generar un vídeo solo tarda 4 segundos!

Lightricks ha lanzado LTX Video, un modelo de generación de vídeo de código abierto con 2.000 millones de parámetros. Este modelo puede generar vídeos de hasta 5 segundos a 24 fotogramas por segundo, en solo 4 segundos, con un rendimiento notable. LTXV se integra perfectamente con ComfyUI, mejorando la experiencia del usuario y promoviendo el desarrollo de la industria creativa.

【Resumen de AiBase:】

🚀 El modelo LTXV se basa en la arquitectura de transformador de difusión, cuenta con 2.000 millones de parámetros y genera vídeos más rápido que la reproducción, generando un vídeo de 5 segundos en 4 segundos.

💻 Utiliza precisión bfloat16, funcionando eficientemente en las tarjetas gráficas principales, optimizando el uso de la memoria y garantizando la calidad del vídeo.

🌍 LTXV se integra perfectamente con ComfyUI, reduciendo la barrera de entrada, impulsando la democratización de la tecnología creativa y ofreciendo infinitas posibilidades a los creadores.

Enlace de detalles:https://www.lightricks.com/ltxv

5. EchoMimicV2: Introduzca una imagen, audio y un vídeo de gestos para generar un avatar digital «similar»

EchoMimicV2 es la última tecnología de generación de animaciones, que admite la introducción de una imagen, un vídeo de gestos y un fragmento de audio, pudiendo generar animaciones humanas de alta calidad de medio cuerpo. Esta tecnología mejora los detalles de la animación mediante la estrategia de armonización dinámica de audio-postura, simplifica el proceso de generación e introduce un mecanismo de atención local de la cabeza para resolver el problema de la escasez de datos.

【Resumen de AiBase:】

✨ EchoMimicV2 simplifica las condiciones de control para generar animaciones humanas de medio cuerpo de alta calidad.

🎨 Se utiliza la estrategia de armonización dinámica de audio-postura para mejorar los detalles y la expresividad de la animación.

📊 Un nuevo método de evaluación de referencia muestra que EchoMimicV2 supera a las tecnologías existentes en términos de rendimiento.

6. Tecnología de generación de vídeo facial impulsada por audio JoyVASA

JoyVASA es una nueva tecnología de animación de imágenes impulsada por audio, diseñada para mejorar la calidad del vídeo y la precisión de la sincronización labial. Su innovador diseño en dos fases permite la generación de vídeos de animación más largos, a la vez que admite la animación de personas y animales, mostrando una buena capacidad de soporte multilingüe.

image.png

【Resumen de AiBase:】

🎨 La tecnología JoyVASA desacopla las expresiones faciales del modelo tridimensional, permitiendo la generación de vídeos de animación más largos.

🔊 Esta tecnología puede generar secuencias de acciones basadas en pistas de audio, con capacidad para animar tanto personas como animales.

🌐 JoyVASA se ha entrenado en conjuntos de datos en chino e inglés, ofreciendo soporte multilingüe para usuarios de todo el mundo.

Enlace de detalles:https://jdh-algo.github.io/JoyVASA/

7. PicMenu: Visualice los menús con IA. Capture una foto y genere un menú de alta calidad al instante.

PicMenu es una innovadora herramienta de visualización de menús con IA que, mediante una simple fotografía, transforma los menús tradicionales en papel en una presentación digital dinámica e intuitiva. Ofrece una nueva solución para la transformación digital del sector de la restauración, mostrando una gran utilidad y capacidad tecnológica.

image.png

【Resumen de AiBase:】

📸 PicMenu puede reconocer y extraer automáticamente la información de los platos mediante una fotografía, generando una presentación de menú digital de alta calidad.

🌍 Esta herramienta utiliza múltiples pilas de tecnología de IA para garantizar la eficiencia y precisión de la extracción de información de los platos y la generación de imágenes.

🔧 El proyecto es de código abierto, los desarrolladores pueden obtener el código fuente a través de GitHub para facilitar la personalización y la implementación.

Enlace de detalles:https://www.picmenu.co/

8. NVIDIA lanza el modelo generativo Edify3D: genere activos 3D de alta calidad en 2 minutos

La tecnología Edify3D de NVIDIA puede generar modelos 3D de alta calidad en dos minutos a partir de descripciones de texto o imágenes de referencia, con mapas UV completos, texturas 4K y materiales PBR. Esta tecnología combina modelos de difusión multiperspectivos y técnicas de reconstrucción basadas en transformadores, mejorando significativamente la eficiencia de la creación de activos 3D y admitiendo una variedad de escenarios de aplicación.

【Resumen de AiBase:】

🎨 La tecnología Edify3D puede generar modelos 3D de alta calidad en dos minutos, con mapas UV completos y texturas 4K, adecuados para diversas industrias.

🔍 Esta tecnología combina modelos de difusión multiperspectivos y técnicas de reconstrucción basadas en transformadores, garantizando que los modelos generados tengan una estructura de malla precisa y texturas de alta resolución.

🌐 Edify3D también admite la generación de escenas 3D complejas a partir de indicaciones de texto, ofreciendo un potente soporte para el diseño artístico y el modelado 3D.

Enlace de detalles:https://research.nvidia.com/labs/dir/edify-3d/

9. ¡Más inteligente! La serie de pantallas inteligentes para el hogar de Xiaomi lanza el supermodelo XiaoAi

Xiaomi ha anunciado una actualización de modelos grandes para su serie de pantallas inteligentes para el hogar, añadiendo nuevas funciones como súper preguntas y respuestas y conversaciones informales. Esta actualización cubre seis dispositivos y los usuarios deben configurarla a través de la aplicación XiaoAi. Tras la actualización, el altavoz admitirá la creación de texto y contará con una base de conocimientos más completa, mejorando la experiencia del usuario.

image.png

【Resumen de AiBase:】

🔧 La actualización cubre seis dispositivos, incluyendo Xiaomi Smart Home Screen 10 y Xiaomi XiaoAi Touch Screen Speaker Pro8.

📱 Los usuarios deben actualizar el altavoz a la última versión y configurar la función de modelos grandes en la aplicación.

🌐 Las nuevas funciones admiten la creación de texto y la búsqueda en tiempo real, permitiendo a los usuarios preguntar directamente al altavoz sobre cualquier tema.

10. REDMI K80Pro incorpora el algoritmo de imagen Xiaomi AISP2.0: fusión de cuatro modelos

Xiaomi ha revelado hoy los detalles de la configuración de imagen de la serie de teléfonos REDMI K80, lo que marca una mejora integral de la capacidad fotográfica de esta serie. Xiaomi AISP2.0 incluye el modelo de óptica grande 2.0, el modelo de tono 2.0, el modelo de color 2.0 y el modelo de retrato 2.0, cuya aplicación mejorará aún más la capacidad de procesamiento de imágenes del K80Pro.

image.png

【Resumen de AiBase:】

📷 La serie REDMI K80 incorpora una cámara principal de alta dinámica de nivel insignia y un teleobjetivo flotante, satisfaciendo las necesidades de fotografía de alta calidad.

⚙️ K80Pro incorpora la tecnología Xiaomi AISP2.0, que admite 150 tomas rápidas de alta calidad con algoritmo completo, mejorando la experiencia de disparo.

💰 La versión estándar y la versión Pro mantienen la misma cámara principal y experiencia, pero no incluyen el teleobjetivo flotante de alto coste, ofreciendo una opción más rentable.

11. Pang Donglai emite un comunicado: advierte sobre el uso no autorizado de la voz de Yu Donglai generada por IA en múltiples cuentas

El grupo comercial Pang Donglai ha emitido recientemente un comunicado advirtiendo sobre el uso no autorizado de la voz de su fundador, Yu Donglai, en varias cuentas, modificando el contenido de los vídeos. Estas acciones constituyen una grave violación de los derechos de autor y los derechos de personalidad de la empresa, induciendo a error al público y afectando a la imagen de marca. Pang Donglai afirma que tomará medidas legales para exigir responsabilidades y proteger sus derechos legítimos y el orden normal del ecosistema online.

【Resumen de AiBase:】

🔊 Varias cuentas utilizan IA para generar una voz similar a la de Yu Donglai, realizando ediciones y modificaciones ilegales.

⚖️ Pang Donglai destaca que esta acción infringe los derechos de autor y genera información falsa, dañando el ecosistema online.