南洋理工大学の研究チームが開発した「GaussianCity」という超大規模3D都市モデル生成技術が注目を集めています。この新しいフレームワークは、生成速度が従来の60倍に向上しただけでなく、従来の方法では不可能だった規模の制限を突破し、無限に広がる3D都市の生成を可能にしました。

この技術成果は、コンピュータビジョンとパターン認識に関するトップ会議であるCVPR2025に採択され、仮想現実、自動運転、デジタルツインの分野における大きなブレークスルーとなっています。

QQ_1741059255887.png

GaussianCityは、ドローン視点とストリートビューの3D都市モデル生成において最先端のレベルに達しています。レンダリング速度は10.72フレーム毎秒(FPS)と、既存のCityDreamer方式と比べて60倍高速です。CityDreamerも3D都市生成分野で優れた成果を上げていますが、計算効率と規模拡張能力に限界がありました。GaussianCityは革新的なアルゴリズム設計により、これらの課題を克服しました。

GaussianCityの中核となるのは、2つの重要な技術的ブレークスルーです。まず、コンパクトな3Dシーン表現方法「BEV-Point」(バードアイビューポイント)を採用することで、メモリ消費量を大幅に削減し、大規模シーン生成におけるハードウェアリソースの制約を解消しました。従来の3Dガウシアン・スプラッティング(3D Gaussian Splatting、3DGS)技術では、無限の規模の都市を処理するために数十億個の点が必要となり、数百GBのメモリを消費していましたが、GaussianCityはBEV-Pointによってメモリ使用量を一定に保ち、真の無制限生成を実現しました。次に、空間認識能力を持つガウシアン属性デコーダを開発し、点シリアライザを使用してBEVポイントの構造とコンテキスト特徴を統合することで、生成された都市モデルの高効率性と高精度を両立させています。

特筆すべきは、GaussianCityの開発チームが論文、コード、関連資料をすべてオープンソース化したことです。GaussianCityの登場は、様々な分野に新たな可能性をもたらします。仮想現実(VR)と拡張現実(AR)では、高品質な大規模都市環境を迅速に生成し、没入感のある体験を提供します。自動運転分野では、幾何学的に正確な3Dシーンを再構築し、トレーニングとテストに現実的なデジタルツイン都市を提供します。都市計画やゲーム開発においても、その効率性と拡張性は創作効率を大幅に向上させるでしょう。

プロジェクト入口:https://github.com/hzxie/GaussianCity