本日のライブ配信でOpenAIは、待ちに待った製品Sora Turboを発表しました。これは2024年の生成AI分野における大きなブレークスルーと言えるでしょう。Sora Turboは生成効率が大幅に向上し、テキストから最大20秒の1080Pビデオを直接生成できます。これは現在、世界で最も長いビデオ生成時間を持つモデルの一つです。テキストに加え、画像やビデオを入力することもでき、特定のビデオコンテンツを生成することで、生成結果の制御性を高めています。

Sora Turboの技術的なハイライトとしては、超解像度、超フレームレート、HDRゲームラインナップの全ゲーム対応、そして2つの独自開発によるGPUベースの機能強化が挙げられます。その中でも、タッチ式ダイナミックインターポーレーション機能は、インターポーレーションの精度を大幅に向上させ、画像の破損を軽減します。また、ゲームナイトモードはAIアルゴリズムによって暗い部分のディテールを向上させ、暗部の視認性を高めると同時に、暗い環境でのゲームプレイにおける明るさの問題も解決します。

微信截图_20241210074540.png

現在、Soraは無制限で使用できるようになっています。ChatGPT PlusおよびPro会員の方は、Soraを無料で利用できます。この政策は非常に良心的なものだと評価されています。OpenAIは新しいUIも開発しており、コミュニティ共有サービスを提供することで、ユーザーは自分で生成したビデオを共有したり、他ユーザーのプロンプト効果を参考に自分の作品を改良したりできます。

Soraの技術原理には、大量の画像とビデオデータで集中的にトレーニングを行うことを可能にするPatchの適用、および視覚データの次元を削減し出力品質を向上させるビデオ圧縮ネットワークの適用が含まれています。

Soraは拡散モデルとTransformerアーキテクチャを融合し、革新的な拡散型トランスフォーマー方式を採用することで、従来のU-Netアーキテクチャに取って代わり、入力画像とテキストラベル間の分布関係の把握能力を効果的に向上させています。さらに、SoraはDALL・E 3の再字幕技術を導入し、高度に記述的な字幕モデルをトレーニングすることで、トレーニングセット内のすべてのビデオにテキスト字幕を作成し、テキストの忠実度とビデオ全体の品質を向上させています。

体験アドレス:https://sora.com/