El equipo de investigación de la Universidad Tecnológica de Nanyang ha generado un gran interés con su primera tecnología de generación de modelos de ciudades 3D a gran escala llamada "GaussianCity". Este nuevo marco, desarrollado por el equipo de investigación, no solo ha logrado una asombrosa mejora de 60 veces en la velocidad de generación, sino que también ha superado las limitaciones de escala de los métodos tradicionales, permitiendo la generación de ciudades 3D ilimitadas.
Este logro tecnológico ha sido aceptado por CVPR2025 (la principal conferencia de visión por computadora y reconocimiento de patrones), convirtiéndose en un gran avance en los campos de la realidad virtual, la conducción autónoma y los gemelos digitales.
Según se informa, GaussianCity ha alcanzado el nivel más avanzado en la generación de modelos de ciudades 3D desde la perspectiva de drones y calles. Su velocidad de renderizado alcanza los 10.72 fotogramas por segundo (FPS), 60 veces más rápido que el método CityDreamer existente. Aunque CityDreamer ha mostrado un buen rendimiento en la generación de ciudades 3D, su eficiencia computacional y capacidad de ampliación de escala han estado limitadas. GaussianCity, mediante la introducción de un diseño de algoritmo innovador, ha superado con éxito estas dificultades.
GaussianCity se basa en dos importantes avances tecnológicos. En primer lugar, emplea un método de representación de escenas 3D compacto llamado "BEV-Point" (punto de vista cenital), lo que reduce considerablemente la necesidad de memoria, permitiendo la generación de escenas a gran escala sin estar limitado por los recursos de hardware. La tecnología tradicional de dispersión gaussiana 3D (3D Gaussian Splatting, 3DGS) requiere miles de millones de puntos para procesar ciudades de escala infinita, ocupando fácilmente cientos de GB de memoria. GaussianCity, mediante BEV-Point, mantiene el uso de memoria constante, logrando una generación verdaderamente ilimitada. En segundo lugar, el equipo de investigación ha desarrollado un decodificador de atributos gaussianos con percepción espacial, que utiliza un serializador de puntos para integrar la estructura y las características contextuales de los puntos BEV, garantizando que los modelos de ciudades generados sean eficientes y realistas.
Cabe destacar que el equipo de desarrollo de GaussianCity ha anunciado que el artículo, el código y la información relacionada del proyecto ya están disponibles de forma completamente gratuita. La aparición de GaussianCity ha abierto nuevas posibilidades en varios campos. En la realidad virtual (RV) y la realidad aumentada (RA), permite generar rápidamente entornos urbanos a gran escala de alta calidad, ofreciendo a los usuarios una experiencia inmersiva; en el campo de la conducción autónoma, GaussianCity se puede utilizar para reconstruir escenas 3D geométricamente precisas, proporcionando ciudades gemelas digitales realistas para entrenamiento y prueba; en la planificación urbana y el desarrollo de juegos, su eficiencia y escalabilidad también mejorarán considerablemente la eficiencia de la creación.
Enlace al proyecto: https://github.com/hzxie/GaussianCity