わずか10秒！WonderWorld AIで一枚の画像から3Dシーンをリアルタイム生成

AIbase基地

公開日AIニュース · 1 分で読めます · Oct 9, 2024

813

最近、スタンフォード大学とマサチューセッツ工科大学の研究者らが共同で、単一の画像からリアルタイムで3Dシーンを生成できるAIシステム「WonderWorld」を開発しました。この新技術により、ユーザーは段階的に仮想環境を構築・探索し、生成されるシーンの内容とレイアウトを簡単に制御できます。

WonderWorld最大の課題は、高速な3Dシーン生成の実現でした。従来の方法では、シーンの生成に数分から数時間かかることが一般的でしたが、WonderWorldはNvidia A6000 GPU上でわずか10秒で新しい3D環境を生成できます。この速度によりリアルタイムでのインタラクションが可能になり、この分野における大きな進歩を示しています。

WonderWorldの動作原理は、入力画像から出発して、まず予備的な3Dシーンを生成することです。その後、システムはシーン画像と対応するFLAGS表現を交互に生成するループに入ります。ユーザーはカメラを移動させて新しいシーンの生成を制御し、テキスト入力を使って目的のシーンの種類を指定できます。

特筆すべきは、FLAGS表現が前景、背景、天空の3層で構成されている点です。各層には「サーフェル」と呼ばれる要素の集合が含まれており、3D位置、方向、スケール、透明度、色によって定義されます。これらのサーフェルは、深さと法線マップの推定によって初期化され、最適化を経て最終的なシーンが作成されます。

シーン遷移時の幾何学的歪みを軽減するために、WonderWorldはガイド付き深度拡散プロセスを採用しています。この方法は、事前に学習された深度マップ拡散モデルを使用して、深度推定を調整し、シーンの既存部分の形状に合わせます。

実験によると、WonderWorldは速度と視覚的な品質の両方において、従来の3Dシーン生成手法を明らかに凌駕しています。ユーザー調査では、生成されたシーンは他の手法で生成されたシーンよりも視覚的に説得力があると評価されました。

WonderWorldは速度と視覚的な品質において従来の方法を大幅に上回っていますが、依然としていくつかの限界があります。例えば、前方表面しか作成できず、仮想世界での移動角度は約45度以内という制限があります。さらに、生成された世界は現在、紙の切り抜きのように見え、木のような詳細なオブジェクトを処理する際には、「穴」や「浮遊」要素が発生する可能性があります。

これらの制限はあるものの、研究者らはWonderWorldの可能性に大きな期待を寄せており、特にゲーム開発、仮想現実、動的な仮想世界の作成において大きな可能性を秘めていると考えています。ユーザー調査において生成されたシーンの視覚効果はより説得力があると評価されており、この技術の幅広い応用が期待されます。

プロジェクト入口：https://kovenyu.com/wonderworld/

要点：
🌟 WonderWorld AIは、写真1枚だけでリアルタイムに3Dシーンを生成でき、速度はわずか10秒です。
🎮 このシステムは、ユーザーがシーンの内容とレイアウトを制御でき、ゲーム開発や仮想現実アプリケーションに適しています。
🚧 現状の技術にはいくつかの制限があり、主に前方表面しか生成できないことと、詳細な処理が不十分な点が挙げられます。

AIシステム WonderWorld 3Dシーン NvidiaA6000GPU

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

Meta、AIシステムMoChaを発表：テキストが生き生きとしたアニメキャラクターに、口パクと動きは自然で滑らか

Metaとウォータールー大学の研究者らが最近、テキストによる簡単な説明から、同期した音声と自然な動きのある全身アニメーションキャラクターを生成できる、MoChaという新しいAIシステムを発表しました。この革新的な技術は、コンテンツ制作の効率と表現力を大幅に向上させ、多くの分野で大きな可能性を秘めています。従来の方法を打ち破り、全身アニメーションと正確な口パクを同期させる、これまでのAIモデルが主に顔の表情に焦点を当てていたのに対し、MoChaは全身の自然な動きをレンダリングできる点がユニークです。

Apr 2, 2025

報道：アップルがNVIDIAのAIシステムに10億ドル投資

Mar 26, 2025

平面を卒業！MIDI：画像要素から360度3Dシーンを生成

Mar 12, 2025

Manus AIシステムのプロンプト漏洩、公式の対応は？

汎用AIインテリジェンス製品Manusは、リリース直後から多くのユーザーが招待コードを求めて殺到しました。製品のパフォーマンスが注目を集める一方で、Manusの裏にある技術に関しても強い関心が寄せられています。Manusを複製しようとする多くのチームが現れたことに加え、先日jianというユーザーがManusシステムをクラッキングし、単純にManusに「/opt/.manus/」ディレクトリ下のファイルを出力するよう要求したところ、重要な情報や実行コードの一部を取得することに成功しました。

Mar 11, 2025

1.7k

羅永浩氏のARスタートアップ「細紅線科技」、春の新卒採用を開始 AIシステム開発にシフト

羅永浩氏が率いるARスタートアップ企業、細紅線科技（Thin Red Line）は、2025年春の採用活動を正式に開始し、大きな注目を集めています。現在募集中の正社員ポジションはすべてプロダクトマネージャーで、シニアソフトウェアプロダクトマネージャー、AI分野ソフトウェアプロダクトマネージャー、IM分野ソフトウェアプロダクトマネージャー、BIデータプロダクトマネージャー、事業化プロダクトマネージャーなどがあります。勤務地は上海と北京ですが、具体的な給与は公開されていません。業界メディア36氪の報道によると、羅永浩氏の最新の...

Mar 10, 2025

AIシステムによる医療画像変化の精密検出

医療分野において、画像データの分析は複雑で煩雑なプロセスでした。最近、ウィル・コーネル医科大学の研究者らが、時間経過による医療画像の変化を高効率かつ正確に分析・検出できる、LILAC（学習に基づく縦断的画像変化推論）と呼ばれる新しいAIシステムを開発しました。この研究は2月20日に『米国科学アカデミー紀要』に掲載され、LILACの複数の医療現場における幅広い応用可能性を示しています。従来の医療画像分析方法は、多くのカスタマイズと事前準備を必要とする場合が多々ありました。

Feb 28, 2025

「ChatGPTの生みの親」がAI企業「シンキング・マシーンズ・ラボ」設立を発表

OpenAIの元最高技術責任者（CTO）ミラ・ムラティ氏が昨年秋にOpenAIを突然退社した後、新たな起業の道を歩み始めました。先日、彼女は「シンキング・マシーンズ・ラボ（Thinking Machines Lab）」という新しいAIスタートアップ企業の準備を進めていることを明らかにしました。具体的な製品の詳細はまだ公開されていませんが、同社はAIシステムをより理解しやすく、カスタマイズ可能で、より幅広い能力を持つことを目指していると表明しています。シンキング・マシーン

Feb 19, 2025

1.5k

昆仑万維、Matrix-Zero世界モデルを発表：国内初となる3Dシーンとインタラクティブビデオ生成

昆侖万維は本日、Matrix-Zero世界モデルの正式発表をいたしました。これにより、国内で初めて3Dシーン生成とインタラクティブビデオ生成の両方の機能を備えたAI企業となり、空間知能分野における重要な一歩を踏み出しました。Matrix-Zeroの最大の特徴は、その強力な3Dシーン生成機能です。この機能は、ユーザーが入力した画像を、グローバルに一貫性があり、自由に探索できるリアルな3Dシーンに変換できます。この画期的な技術は、以下の重要な特性を備えています。グローバルな一貫性: Matri

Feb 14, 2025

6.3k

昆仑万維がMatrix-Zero世界モデルを発表　3Dシーン、インタラクティブ動画生成に対応

2025年2月14日、昆侖万維集団はMatrix-Zero世界モデルを発表し、中国における空間知能分野における重要な一歩を踏み出しました。Matrix-Zeroには、3Dシーン生成大規模モデルとインタラクティブ動画生成大規模モデルの2つのサブモデルが含まれており、AI技術によるデジタルコンテンツ制作方法の変革、映画制作、ゲーム開発、具象知能などの業界の革新的な発展を目指しています。

Feb 14, 2025

3.8k

Meta、新たなフレームワークを発表、高リスクAIシステムのリリース制限を計画

Metaは最近、最先端AIモデルがもたらすリスクを評価・軽減し、必要に応じて開発の中止またはこれらのシステムのリリース制限を行うことを目的とした、新たなリスクポリシーフレームワークを発表しました。このフレームワークは「最先端AIフレームワーク」と呼ばれ、MetaがどのようにAIモデルを高リスクと重要リスクの2つのカテゴリに分類し、それに応じて対策を講じてリスクを「許容できるレベル」まで軽減するかを詳細に説明しています。このフレームワークでは、重要リスクは特定の脅威シナリオの実行に独自に貢献できるものとして定義されています。一方、高リスクとは

Feb 12, 2025

1.3k

AIニュース

AIデイリー

AIタイムライン

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要