会員無料トライアル！OpenAI動画生成モデルSora Turbo登場：最長20秒1080P動画に対応

AIbase基地

公開日AIニュース · 1 分で読めます · Dec 10, 2024

490

本日のライブ配信でOpenAIは、待ちに待った製品Sora Turboを発表しました。これは2024年の生成AI分野における大きなブレークスルーと言えるでしょう。Sora Turboは生成効率が大幅に向上し、テキストから最大20秒の1080Pビデオを直接生成できます。これは現在、世界で最も長いビデオ生成時間を持つモデルの一つです。テキストに加え、画像やビデオを入力することもでき、特定のビデオコンテンツを生成することで、生成結果の制御性を高めています。

Sora Turboの技術的なハイライトとしては、超解像度、超フレームレート、HDRゲームラインナップの全ゲーム対応、そして2つの独自開発によるGPUベースの機能強化が挙げられます。その中でも、タッチ式ダイナミックインターポーレーション機能は、インターポーレーションの精度を大幅に向上させ、画像の破損を軽減します。また、ゲームナイトモードはAIアルゴリズムによって暗い部分のディテールを向上させ、暗部の視認性を高めると同時に、暗い環境でのゲームプレイにおける明るさの問題も解決します。

微信截图_20241210074540.png

現在、Soraは無制限で使用できるようになっています。ChatGPT PlusおよびPro会員の方は、Soraを無料で利用できます。この政策は非常に良心的なものだと評価されています。OpenAIは新しいUIも開発しており、コミュニティ共有サービスを提供することで、ユーザーは自分で生成したビデオを共有したり、他ユーザーのプロンプト効果を参考に自分の作品を改良したりできます。

Soraの技術原理には、大量の画像とビデオデータで集中的にトレーニングを行うことを可能にするPatchの適用、および視覚データの次元を削減し出力品質を向上させるビデオ圧縮ネットワークの適用が含まれています。

Soraは拡散モデルとTransformerアーキテクチャを融合し、革新的な拡散型トランスフォーマー方式を採用することで、従来のU-Netアーキテクチャに取って代わり、入力画像とテキストラベル間の分布関係の把握能力を効果的に向上させています。さらに、SoraはDALL・E 3の再字幕技術を導入し、高度に記述的な字幕モデルをトレーニングすることで、トレーニングセット内のすべてのビデオにテキスト字幕を作成し、テキストの忠実度とビデオ全体の品質を向上させています。

体験アドレス：https://sora.com/

餓了麼、ローカルライフAIアルゴリズムコンテスト開始、総賞金30万元

本日、餓了麼はローカルライフ分野に特化したAIアルゴリズムコンテストの開始を発表しました。これは、最先端技術が具体的なアプリケーションの革新を促進し、生活サービス業界の効率性とユーザーエクスペリエンスを向上させる方法を探求することを目的としています。今回のコンテストは、スマート高齢化ケア、スマートデリバリー、インテリジェントなビジネス効果の3つのトラックで構成され、各トラックで上位5チームが選出され、総額30万元の賞金プールを分け合います。1位は5万元、2位は3万元、3位は1万元、そして5000元が2チームに贈られます。

香港科技大学、初のローカル生成AI大規模モデルを発表

香港科技大学が主導する香港生成AI研究開発センター（HKGAI）は2月25日、初のローカル生成AI大規模モデル「HKGAI V1」を発表しました。この画期的な進歩は、香港のAIエコシステムに新たな活力を注入し、香港がこの最先端技術分野で重要な進展を遂げたことを示しています。HKGAI V1は、業界で初めてDeepSeek技術を用いて全パラメーター微調整と継続的学習を行った大規模モデルであり、強力なローカルナレッジベースを備え、広東語の理解と生成が可能です。

『コールオブデューティ』シリーズ、PS5/PS4作品で生成AIの活用を確認

人気シリーズ『コールオブデューティ』において、アクティビジョン・ブリザードが生成AI技術の開発過程での活用を正式に発表しました。プレイヤーコミュニティでは、ゲーム内における独特なキャラクターデザインなどをきっかけに、AI活用が噂されていましたが、公式発表によって大きな注目を集めています。Steamの『コールオブデューティブラックオプス6』製品ページには、「生成AIツールを使用してゲーム内アセットの開発を支援しています」と明記されています。ただし、具体的な使用方法については詳細が明らかになっていません。現時点の情報によると…