Stability.aiは12月14日、高品質な3Dモデルを生成するStable Zero123を公式サイトでオープンソース化しました。これは、共同でオープンソース化されたZero123モデルを最適化することで、訓練効率を40倍向上させたものです。
このモデルは、SDXLの高精度画像モデルと組み合わせて使用でき、1000万以上の3Dモデルデータセットを用いて訓練されています。現在は主に研究用途に限定されていますが、将来的には商用利用も可能になる予定です。
Stability.aiは12月14日、高品質な3Dモデルを生成するStable Zero123を公式サイトでオープンソース化しました。これは、共同でオープンソース化されたZero123モデルを最適化することで、訓練効率を40倍向上させたものです。
このモデルは、SDXLの高精度画像モデルと組み合わせて使用でき、1000万以上の3Dモデルデータセットを用いて訓練されています。現在は主に研究用途に限定されていますが、将来的には商用利用も可能になる予定です。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
【AIデイリーニュース】へようこそ!ここでは、AIの世界を探求するための毎日のガイドとして、AI分野のホットな話題を毎日お届けします。開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品のアプリケーションへの理解を深めます。最新のAI製品はこちらをご覧ください:https://top.aibase.com/1、テンセントHunyuánが5つのオープンソース3Dモデルを発表:30秒で生成、マルチプラットフォームに対応テンセントHunyuánは、Hunyuan3D-2.0をベースとした5つの新しいオープンソース3D生成モデルを発表しました。より高速な生成が可能です。
SD3.5の経緯と変遷 6月、Stability AIはStable Diffusion 3 Mediumを発表しましたが、FLUXの発表後、SD3は事実上放棄された状態でした。FLUXにあらゆる面で劣り、Stability AIの横暴な条件によってSD3の評判は急落しました。今回、公式は教訓を生かし、3.5版を開発し、SD3.5は制作者とクリエイターに提供可能なことを約束しました。
Shutterstockが、Nvidia Edifyアーキテクチャに基づいたテキストから3Dモデルを生成するAIサービスを発表。Getty ImagesもEdifyを採用し、AIによる画像微調整オプションを提供。NvidiaとShutterstockの連携により、クリエイティブ分野の可能性がさらに広がる。この新サービスは、クリエイティブプロフェッショナルにさらなる制御と創作の機会を提供する。
Convolutional Reconstruction Model(CRM)は、清華大学チームが開発した、単一画像から3Dモデルを生成するフィードフォワード型モデルです。CRMは、6つの直交ビュー画像を生成し、畳み込みU-Netを用いて高解像度の三次元平面を作成します。このモデルは、テスト時の最適化を必要とせず、わずか10秒で高忠実度のテクスチャメッシュを画像から生成できます。研究チームは、バラ、カエル、ゾウなどの物体におけるCRMのパフォーマンスを示しており、レゴ風のモデル作成にも可能性があります。
MeshyはMeshy-2バージョンをリリースし、3Dモデル生成ツールの品質とユーザーエクスペリエンスを向上させました。より多くのアートスタイル、幾何学的およびテクスチャの詳細、そして便利なメッシュ設定を追加しました。Meshyは、テキストから3D、画像から3D、テキストからテクスチャなど、シンプルで使いやすい方法を提供します。Unity、Blenderなどのクリエイティブツールとのシームレスな統合をサポートし、画像から3Dモデルを生成することもできます。新しいAIテクスチャ機能により、ユーザーはテキストだけで3Dモデルに高品質のテクスチャを生成できます。
汎用3Dモデル生成技術は急速に進歩しており、VAST社と影眸科技はポケモン風3Dモデルを10秒で生成するサービスを発表しました。幻獣パルーは著作権侵害の疑いが指摘されていますが、専門家はAI生成の可能性は低いと見ており、モデル間に差異があると指摘しています。VAST社と影眸科技の技術的ブレークスルーは、AIが3Dモデル生成において著しい進歩を遂げていることを示しています。幻獣パルーの社長は2022年にAIによる著作権問題解決への関心を表明しており、懸念を引き起こしています。技術の進歩にもかかわらず、専門家は現時点でのAI生成3Dモデルは十分とは言えず、課題も多いと考えています。
GPTEval3DはGPT-4Vを活用したプロンプトジェネレーターを用いて、テキストから3Dモデルを生成するモデルのEloレーティングを提供します。この新しい技術により、人的リソースの節約と、3Dモデルの迅速かつ容易な評価、ならびに精度と信頼性の向上が実現します。ペアワイズ比較の結果に基づいてモデルにEloレーティングを割り当てることで、主観的なバイアスを回避します。3DTopia/GPTEval3Dは、構造化された方法と明確なドキュメントを提供し、評価エクスペリエンスを向上させます。この革新的なアプローチにより、3Dモデルの評価がより迅速かつ客観的に行われ、業界に新たな評価方法をもたらします。
テンセントは、高品質なテクスチャ生成の課題を解決するPaint3D技術を発表しました。Paint3Dは、テキストまたは画像を入力として、非照明の3Dモデル上に高解像度のテクスチャを生成します。2段階のテクスチャ生成フレームワークを採用し、事前学習済みの2D画像生成モデルからガイダンス情報を取得します。UVテクスチャ空間で非照明拡散モデルをトレーニングすることで、3Dモデルのテクスチャ生成効果を向上させます。Paint3Dは、埋め込み照明テクスチャを生成できる唯一のアルゴリズムであり、この分野における大きな進歩を示しています。