Snap Inc.の研究チームは先日、SnapGenという人工知能画像生成ツールを発表しました。これは、ハイエンドスマートフォンで高解像度画像を直接生成できるツールです。この技術により、ユーザーはスマートフォンでも効率的で手軽な画像制作体験が可能になり、従来のAI画像生成が要求していた強力な計算能力の制約を打破しました。
SnapGenの最大の強みは、そのモデルのコンパクトさと効率性です。SDXLなどの一般的な画像生成ツールと比較して、SnapGenのパラメーター数は3億7900万個と、約7分の1に抑えられています。このコンパクトな設計により、SnapGenはストレージ容量の消費が少ないだけでなく、実行速度も非常に優れています。テスト結果によると、SnapGenは画像とテキスト記述の一致度において0.66という高得点を記録し、SDXLの0.55を上回っており、その品質の高さが明らかになっています。
速度面でもSnapGenは特に優れています。iPhone 16 Pro Maxでは、約1.4秒で1024×1024ピクセルの高品質画像を生成できます。この速度の向上により、ユーザーは制作中に遅延を感じることはほとんどなく、生成された画像をすぐに楽しむことができます。
これらの性能向上を実現するために、研究チームはネットワークアーキテクチャを体系的に再設計し、モデルパラメーターと遅延を削減しながら、高品質な画像生成を確保しました。特にデコーダー部分を最適化し、同種のシステムと比べて36倍小さくしました。さらに、小型モデルの性能を大型モデルと同等にするために、SD3、SD3.5などの大型AIシステムの学習方法を参考に、タスクの難易度に応じて学習戦略を動的に調整できる独自のトレーニングプロセスを開発しました。
SnapGenの登場により、モバイルデバイスにおけるAI画像生成技術は新たな飛躍を迎えました。今後、ユーザーはスマートフォンでより高速で高品質な画像制作を体験し、ソーシャルメディアコンテンツ制作の進歩をさらに促進していくでしょう。