Meta presenta VFusion3D: convierte imágenes 2D o descripciones de texto en objetos 3D de alta calidad

AIbase基地

Publicado elNoticias de IA · 4 minutos de lectura · Aug 10, 2024

246

Recientemente, un equipo de investigación de Meta y la Universidad de Oxford ha desarrollado un potente modelo de IA llamado VFusion3D. Este modelo tiene una capacidad asombrosa: puede convertir una sola imagen 2D o una descripción de texto en un objeto 3D de alta calidad, marcando un salto significativo en la creación de contenido 3D, con un enorme potencial en realidad virtual, videojuegos y diseño digital.

El equipo de investigación, liderado por Junlin Han, Filippos Kokkinos y Philip Torr, abordó un desafío de larga data en el campo de la IA: la escasez de datos de entrenamiento 3D. Para superar este obstáculo, utilizaron ingeniosamente modelos de IA de video preentrenados para generar datos 3D sintéticos, entrenando así un sistema de generación 3D más robusto.

En las pruebas, VFusion3D mostró resultados impresionantes. En comparación con los sistemas líderes anteriores, los evaluadores humanos prefirieron las reconstrucciones 3D generadas por VFusion3D en más del 90% de los casos. Sorprendentemente, el modelo solo necesita unos segundos para generar activos 3D a partir de una sola imagen.

Probé personalmente las funciones de VFusion3D utilizando su demo pública en Hugging Face. La interfaz es muy sencilla e intuitiva. Los usuarios pueden cargar sus propias imágenes o seleccionar algunos ejemplos precargados, incluyendo personajes clásicos como Pikachu, Darth Vader e incluso un pequeño cerdo con mochila.

A pesar de su excelente rendimiento técnico, no es perfecto. Los investigadores señalan que el sistema a veces tiene dificultades con ciertos tipos de objetos (como vehículos y texto). Con el desarrollo continuo de los modelos de IA de video, se espera que estos problemas se mejoren.

VFusion3D de Meta demuestra cómo los métodos ingeniosos de generación de datos pueden abrir nuevas áreas en el aprendizaje automático. Con el avance de la tecnología, es razonable esperar que en el futuro más diseñadores y desarrolladores puedan utilizar fácilmente estas potentes herramientas de creación 3D.

Acceso al producto: https://junlinhan.github.io/projects/vfusion3d.html

Puntos clave:
🌟 VFusion3D puede convertir una sola imagen 2D o texto en modelos 3D de alta calidad, impulsando una revolución en la creación de contenido 3D.
🚀 En comparación con otros sistemas líderes, el 90% de los evaluadores prefirieron los resultados generados por VFusion3D.
💡 En el futuro, VFusion3D podría cambiar los flujos de trabajo de diseño y desarrollo, haciendo que la industria creativa sea más eficiente y democrática.

Informe financiero del tercer trimestre de Meta: crecimiento sólido del negocio principal, pero pérdidas de 4400 millones de dólares en el metaverso

Meta (anteriormente Facebook) publicó recientemente su informe financiero del tercer trimestre de 2023. Si bien el negocio principal mostró un excelente desempeño, las enormes pérdidas del departamento del metaverso provocaron preocupación entre los inversores, lo que provocó una caída de más del 3% en el precio de las acciones en las operaciones posteriores al cierre. Este informe financiero muestra la compleja situación de crecimiento de Meta. Los datos muestran que, hasta el 30 de septiembre, los ingresos del tercer trimestre de Meta alcanzaron los 40 600 millones de dólares, un 19% más que el año anterior, superando las expectativas del mercado de 40 300 millones de dólares. Sin embargo, el departamento de Reality Labs, dedicado al metaverso, registró...

¿Conducción autónoma en el metaverso? ¡Juega con la IA de Gigai Tech para una reconstrucción de escenas 4D más fluida!

Recientemente, Gigai Tech propuso un nuevo marco llamado DriveDreamer4D, diseñado para utilizar el conocimiento previo del modelo del mundo para mejorar la reconstrucción de escenas de conducción 4D. Los métodos tradicionales de reconstrucción de escenas 4D se basan principalmente en dos escuelas de pensamiento: NeRF y 3DGS. NeRF es como un súper pintor que utiliza redes neuronales para representar un conjunto de fotografías en un modelo 3D. 3DGS, por otro lado, utiliza un conjunto de funciones gaussianas tridimensionales para simular varios objetos en la escena. Sin embargo, ambos métodos tienen un inconveniente...

Plataforma SaaS de metaverso ligero lanzada por Baidu Xirang, que incluye la plataforma de creación de metaversos de Baidu

La plataforma SaaS de metaverso ligero Baidu Xirang se lanzó oficialmente el 9 de agosto. Se trata de un servicio diseñado específicamente para acelerar la transformación digital de las empresas. Esta plataforma integra la experiencia acumulada de Baidu Xirang en los campos del metaverso, la inteligencia artificial, la computación en la nube y las aplicaciones móviles, ofreciendo la capacidad de suscripción a escenarios ligeros. Mediante la combinación libre de espacios y componentes, permite construir escenarios propios de marketing, exposiciones, medios de comunicación integrados, cultura y educación, ayudando a las empresas a reducir costes y mejorar la eficiencia.

¡Recibe una carta de cese y desistimiento de 28 páginas! La búsqueda de inteligencia artificial de MITAA deja de incluir los metadatos y resúmenes de los documentos de CNKI

Recientemente, el equipo de búsqueda de IA de MITAA recibió una carta de cese y desistimiento de 28 páginas de la Compañía de Publicaciones Electrónicas de Revistas Académicas Chinas (CNKI). La carta indica que la búsqueda de IA de MITAA ha proporcionado a los usuarios una gran cantidad de metadatos y resúmenes de documentos académicos de CNKI sin el permiso de CNKI, una acción que se considera una violación grave de los derechos legítimos de CNKI.