MITとGoogleが共同で開発したStableRep技術は、AIによって生成された画像を用いて、効率的なAIモデルの学習を行う技術です。
この技術は目覚ましい成果を上げていますが、処理速度が遅い、意味が一致しないといった課題も存在します。基盤となるモデルには、現実世界のデータによる学習が不可欠です。
StableRep技術はGitHubでオープンソースとして公開されており、商用利用も可能です。ただし、画像生成には時間がかかり、コストが高くなる可能性があります。
MITとGoogleが共同で開発したStableRep技術は、AIによって生成された画像を用いて、効率的なAIモデルの学習を行う技術です。
この技術は目覚ましい成果を上げていますが、処理速度が遅い、意味が一致しないといった課題も存在します。基盤となるモデルには、現実世界のデータによる学習が不可欠です。
StableRep技術はGitHubでオープンソースとして公開されており、商用利用も可能です。ただし、画像生成には時間がかかり、コストが高くなる可能性があります。
ドイツの人工知能スタートアップ企業であるBlack Forest Labs(ブラックフォレストラボ)は最近、FLUX ProファインチューニングAPIを発表しました。このAPIを使用することで、わずか5枚のサンプル画像を使用してFLUX Pro AI画像モデルをカスタマイズし、特定ブランドの視覚スタイルに合わせることが可能です。Black Forest Labsによると、ファインチューニング後もモデルは柔軟性を維持し、ユーザーが提供するコンテンツを新しい画像制作に統合できます。このシステムは…
ドイツ工科大学ダルムシュタット校の最新の研究は、興味深い現象を明らかにしました。最先端のAI画像モデルでさえ、単純な視覚推論タスクで明らかな誤りを犯すということです。この研究結果は、AIの視覚能力の評価基準に新たな視点をもたらします。研究チームは、ロシアの科学者ミハイル・ボンガードが考案したボンガード問題をテストツールとして使用しました。この種の視覚パズルは、12枚の単純な画像で構成され、2つのグループに分けられ、両グループを区別する規則を識別することが求められます。
OpenAIは最近、sCM(Simplified, Stable, and Scalable Consistency Model)と呼ばれる画期的な技術を発表しました。この革新的な技術は、AI画像モデルのトレーニング方法を根本的に変えました。既存のコンシステントモデル(CMs)を基に大きな進歩を遂げ、高速な画像生成を切り開きました。技術的な主な利点は次のとおりです。高品質な画像をわずか2ステップの計算で生成A100GPUで1枚の画像を生成するのにわずか0.11秒従来の拡散モデルと比較して、速度が50倍に向上最大15億のパラメータを持つ巨大モデルを実現