L'équipe de recherche de l'Université de technologie de Nanyang a suscité un vif intérêt avec sa première technologie de génération de modèles de villes 3D à très grande échelle, baptisée « GaussianCity ». Ce nouveau framework, développé par l'équipe de recherche, a non seulement amélioré la vitesse de génération de 60 fois, mais a également dépassé les limites de taille des méthodes traditionnelles, permettant la génération de villes 3D illimitées.
Ces résultats ont été acceptés par CVPR2025 (conférence de pointe sur la vision par ordinateur et la reconnaissance de formes), marquant une avancée majeure dans les domaines de la réalité virtuelle, de la conduite autonome et des jumeaux numériques.
GaussianCity a atteint un niveau de pointe dans la génération de modèles de villes 3D sous des angles de vue aérienne et de rue. Sa vitesse de rendu atteint 10,72 images par seconde (FPS), soit 60 fois plus rapide que CityDreamer, une solution existante. Bien que CityDreamer ait fait ses preuves dans le domaine de la génération de villes 3D, son efficacité de calcul et ses capacités d'extension à grande échelle ont toujours été limitées. GaussianCity, grâce à un algorithme innovant, a réussi à surmonter ces difficultés.
GaussianCity repose sur deux avancées technologiques clés. Premièrement, il utilise une méthode compacte de représentation de scènes 3D, « BEV-Point » (vue aérienne), réduisant considérablement les besoins en mémoire vive et permettant la génération de scènes à grande échelle sans être limité par les ressources matérielles. Les techniques traditionnelles de diffusion gaussienne 3D (3D Gaussian Splatting, 3DGS) nécessitent des milliards de points pour traiter des villes d'échelle infinie, occupant facilement des centaines de Go de mémoire vive. GaussianCity, grâce à BEV-Point, maintient une utilisation de mémoire vive constante, permettant une génération véritablement illimitée. Deuxièmement, l'équipe de recherche a développé un décodeur d'attributs gaussiens sensible à l'espace, utilisant un sérialiseur de points pour intégrer la structure et les caractéristiques contextuelles des points BEV, garantissant ainsi un modèle de ville généré à la fois efficace et réaliste.
Il est important de noter que l'équipe de recherche de GaussianCity a annoncé que l'article, le code et les documents associés du projet sont désormais en open source. GaussianCity ouvre de nouvelles possibilités dans plusieurs domaines. En réalité virtuelle (RV) et en réalité augmentée (RA), il permet de générer rapidement des environnements urbains à grande échelle de haute qualité, offrant aux utilisateurs une expérience immersive. Dans le domaine de la conduite autonome, GaussianCity peut être utilisé pour reconstruire des scènes 3D géométriquement précises, fournissant des villes jumelles numériques réalistes pour l'entraînement et les tests. En urbanisme et en développement de jeux, son efficacité et son extensibilité amélioreront considérablement l'efficacité de la création.
Accès au projet : https://github.com/hzxie/GaussianCity