¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del campo de la IA, con enfoque en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Descubre nuevos productos de IA https://top.aibase.com/

1. Luma presenta en video las características del modelo Dream Machine

Después de ver el video de presentación del modelo Dream Machine de Luma, me parece que esta herramienta de generación de video con IA es increíblemente potente. No solo ofrece una salida de video de alta calidad, sino que también comprende rápidamente las indicaciones del usuario, generando contenido de video que se ajusta a un estilo estético determinado. Esto resulta muy útil para el proceso de iteración creativa, haciendo que la generación de video sea mucho más eficiente.

【Resumen de AiBase:】

🌟 Alta calidad de video generado, con resolución de hasta 1024 píxeles.

🎨 Capacidad para comprender indicaciones y generar videos con un estilo estético determinado.

⚡ Velocidad de inferencia rápida, ideal para la iteración rápida de ideas.

Enlace de detalles: https://top.aibase.com/tool/dream-machine

2. Se lanza el nuevo proyecto de video de sincronización labial Hallo, con control preciso de expresiones y movimientos de boca

Se ha lanzado el nuevo proyecto de video de sincronización labial Hallo, que genera videos de canto y habla a partir de una sola imagen y audio, permitiendo un control preciso de las expresiones faciales y la postura del personaje, mejorando la precisión de la alineación entre la entrada de voz y la animación generada. Esta tecnología no solo se puede utilizar para la generación de animaciones de personajes virtuales, sino también para personajes reales, admitiendo varios controles de movimiento, aplicaciones entre actores y la generación de animaciones de canto. La tecnología es avanzada, la animación es realista y tiene un amplio potencial de aplicación.

image.png

【Resumen de AiBase:】

⭐️ Genera videos de canto y habla a partir de una sola imagen y entrada de audio.

⭐️ Admite la generación de animaciones de personajes virtuales y reales; el proyecto es de código abierto.

⭐️ Múltiples controles de movimiento, permitiendo un control preciso de las expresiones y posturas, mejorando la diversidad y realismo de la animación.

Dirección del proyecto: https://top.aibase.com/tool/hallo

3. La Universidad de Pekín y Kuaishou presentan conjuntamente el marco de generación de video VideoTetris; los resultados en la generación de videos complejos superan a Pika

Este artículo presenta el trabajo conjunto de la Universidad de Pekín y el equipo de IA de Kuaishou para superar los desafíos de la generación de videos complejos, presentando el marco VideoTetris, que supera con éxito a los modelos comerciales Pika y Gen-2. Este marco define tareas de generación de videos combinados, admite instrucciones complejas y la generación de videos largos, conservando la información de posición y las características de detalle. El equipo utiliza un método de difusión combinada espacio-temporal, optimiza el preprocesamiento de datos de entrenamiento e introduce un mecanismo de atención de fotogramas de referencia para generar videos más dinámicos y naturales.

image.png

【Resumen de AiBase:】

⭐ El marco VideoTetris supera con éxito los desafíos de la generación de videos complejos, superando a los modelos comerciales Pika y Gen-2.

⭐ Define tareas de generación de videos combinados, admite instrucciones complejas y la generación de videos largos, conservando la información de posición y las características de detalle.

⭐ Utiliza un método de difusión combinada espacio-temporal, optimiza el preprocesamiento de datos de entrenamiento e introduce un mecanismo de atención de fotogramas de referencia para generar videos más dinámicos y naturales.

Enlace de detalles: https://top.aibase.com/tool/videotetris

4. Un artista de IA japonés resucita a su esposa usando Luma; los usuarios se emocionan hasta las lágrimas

Este artículo cuenta la historia de Kimio Matsuo, un artista de IA de 65 años, que utilizó la tecnología para "resucitar" a su esposa, Tori-chan, fallecida hace 11 años, conmoviendo a innumerables personas. A través de la tecnología de IA, volvió a componer y grabar las canciones de su esposa, creó videos dinámicos y extrajo y tradujo sus cartas, expresando su cariño y amor por ella. Esta es la historia de una persona común que utiliza la tecnología para crear un sueño, mostrando el poder y la calidez del amor en la era de la IA.

【Resumen de AiBase:】

🌟 Kimio Matsuo resucita a su esposa Tori-chan, fallecida hace 11 años, usando la IA de video Dream Machine de Luma, conmoviendo a muchas personas.

🎶 Utiliza la tecnología de IA para volver a componer y grabar las canciones de su esposa, y crea videos dinámicos, mostrando su profundo cariño por ella.

💖 Usa herramientas de IA para extraer y traducir las cartas que su esposa le escribió, expresando su profundo amor y eterno recuerdo por ella.

Acceso al producto: https://top.aibase.com/tool/luma-ai

Artículo completo: https://www.chinaz.com/ainews/9623.shtml

5. Apple podría retrasar el lanzamiento de su IA; los desarrolladores tendrán que esperar hasta finales del verano para probarla

Según Bloomberg, el plan de inteligencia artificial (IA) de Apple será un proceso largo y lento. El plan de Apple Intelligence anunciado la semana pasada por la compañía, se espera que esté disponible para que los desarrolladores lo prueben a finales del verano. Esto significa que no formará parte de las primeras versiones beta de la actualización del nuevo sistema operativo de Apple, y solo se lanzará una versión preliminar este otoño.

【Resumen de AiBase:】

🍏 El plan de inteligencia artificial (IA) de Apple estará disponible para que los desarrolladores lo prueben a finales del verano.

📉 El plan de Apple no formará parte de las primeras versiones beta de la actualización del nuevo sistema operativo.

💬 El plan Apple Intelligence cambiará la forma en que los consumidores interactúan con sus dispositivos y compran.

6. KREA AI lanza una función de mejora de video para mejorar la calidad del video con un solo clic

Este artículo presenta la función de mejora de video "Enhancer" lanzada por KREA AI, que puede mejorar la calidad de las imágenes y videos, y admite resoluciones y velocidades de fotogramas más altas. Los usuarios pueden simplemente subir la imagen o video que necesitan mejorar, KREA AI lo procesará en línea y finalmente generará un video de alta calidad.

【Resumen de AiBase:】

⭐ La función Enhancer está disponible para todos y puede mejorar la calidad de las imágenes y videos.

⭐ Se puede usar con herramientas de video de IA; después del procesamiento, se puede ver una comparación directa del efecto antes y después en la página.

⭐ Puede generar videos con un máximo de 2.5x píxeles y una velocidad de fotogramas de hasta 120 fps.

Acceso al producto: https://top.aibase.com/tool/krea-ai

7. Colaboración entre Tsinghua y Pekín para lanzar LVBench, una prueba de referencia para la comprensión de videos largos

Este artículo presenta el proyecto LVBench, una prueba de referencia para la comprensión de videos largos, desarrollado en colaboración por Zhipu, la Universidad Tsinghua y la Universidad de Pekín, con el objetivo de abordar los desafíos que presentan los modelos de lenguaje grandes multimodales en el procesamiento de videos largos. Este proyecto incluye horas de datos de preguntas y respuestas de múltiples categorías, que abarcan diferentes tipos de contenido de video, con el objetivo de impulsar los avances tecnológicos e innovaciones en el campo de los videos largos. Muchas instituciones de investigación ya están trabajando en el conjunto de datos LVBench, aportando nueva vitalidad al campo de la comprensión de video y el aprendizaje multi-modal.

【Resumen de AiBase:】

🔍 LVBench es un proyecto de prueba de referencia para la comprensión de videos largos, que incluye horas de datos de preguntas y respuestas de múltiples categorías.

💡 El conjunto de datos LVBench abarca varias tareas, como el resumen de videos, la detección de eventos, el reconocimiento de personajes y la comprensión de escenas.

🚀 El lanzamiento de la prueba de referencia LVBench impulsará los avances tecnológicos e innovaciones, aportando nueva energía al desarrollo del campo de los videos largos.

Enlace de detalles: https://github.com/THUDM/LVBench

8. Modelo de generación de mallas MeshAnything: convierte cualquier 3D en una malla creada por un artista

Recientemente, los activos 3D creados mediante reconstrucción y generación han alcanzado un nivel de calidad comparable a los activos hechos a mano, destacando su potencial en el campo de la sustitución. MeshAnything es un modelo autorregresivo para generar mallas 3D creadas por artistas, que logra la generación de mallas de alta calidad mediante VQ-VAE y un transformador de decodificador únicamente condicionado a la forma. Este método mejora significativamente la eficiencia de almacenamiento, renderizado y simulación, manteniendo al mismo tiempo una precisión comparable a los métodos anteriores.

image.png

【Resumen de AiBase:】

⚙️ MeshAnything utiliza un modelo autorregresivo para generar mallas 3D de alta calidad creadas por artistas.

🔍 Las mallas de MeshAnything mejoran la eficiencia de almacenamiento, renderizado y simulación, manteniendo la precisión.

🌐 MeshAnything tiene amplias aplicaciones en diversos campos, satisfaciendo las necesidades creativas de diferentes usuarios.

Enlace de detalles: https://top.aibase.com/tool/meshanythingMeshAnything

9. Neurocientíficos de Harvard y Google DeepMind crean un cerebro artificial en ratones virtuales

Este artículo presenta una investigación innovadora en la que investigadores de la Universidad de Harvard y el equipo de Google DeepMind utilizan la tecnología de inteligencia artificial para crear un "cerebro" artificial para ratones virtuales. Han creado con éxito un modelo de ratón 3D biomecánicamente realista y han utilizado el algoritmo de aprendizaje por refuerzo profundo de DeepMind para entrenar una red neuronal artificial que actúa como cerebro, logrando resultados de simulación que superan a los reales. Esta innovación promete revolucionar los campos de la neurociencia y la inteligencia artificial.

image.png

【Resumen de AiBase:】

🧠 El ratón virtual tiene un "cerebro" artificial que puede controlar con precisión el movimiento en entornos complejos.

🔬 El cerebro de red neuronal artificial entrenado con el algoritmo de DeepMind puede producir diversas trayectorias y fuerzas de movimiento complejas.

🤖 Tiene un amplio potencial de aplicación futura, pudiendo crear un nuevo campo de "neurociencia virtual" y aportar nuevas estrategias para el tratamiento de enfermedades del sistema nervioso.

10. McDonald's anuncia el fin de su colaboración con IBM para pedidos de autoservicio con IA

McDonald's anuncia el fin de su colaboración con IBM para pedidos de autoservicio con IA, eliminando la tecnología que se estaba probando en más de 100 restaurantes antes del 26 de julio de 2024. Si bien no está claro por qué McDonald's ha finalizado su colaboración con IBM, la compañía afirma que está probando si un chatbot de pedidos de voz puede acelerar el servicio y confía en los resultados de las pruebas. La industria de la restauración anhela la introducción de la tecnología de IA para mejorar la eficiencia.

【Resumen de AiBase:】

🍔 McDonald's finalizará su colaboración con IBM para pedidos de autoservicio con IA y eliminará la tecnología que se estaba probando en más de 100 restaurantes.

🤖 McDonald's está probando un chatbot de pedidos de voz para acelerar el servicio.

🔮 La industria de la restauración anhela la introducción de la tecnología de IA para mejorar la eficiencia.

11. Estudio: es difícil distinguir si se está hablando con un humano o con ChatGPT después de cinco minutos de conversación

Los modelos de lenguaje grandes (LLM), como el modelo GPT-4 en la plataforma de chat ChatGPT, muestran una capacidad asombrosa, haciendo difícil distinguir si el texto generado es escrito por un humano. Un estudio de la Universidad de California en San Diego descubrió que es difícil para las personas distinguir si están hablando con GPT-4 o con un humano, lo que demuestra el grado en que las máquinas muestran inteligencia humana.

image.png

【Resumen de AiBase:】

🔍 El modelo GPT-4 muestra en el estudio una capacidad de conversación difícil de distinguir de la humana.