最近、Hotshotという新しいテキストからビデオを生成するAIツールが登場し、その動画生成能力の高さに注目が集まっています!公式が公開した動画のクオリティは、非常に素晴らしいです!

微信截图_20240821101958.png

まずは生成された動画をご覧ください:

この新しいHotshotモデルは、最大10秒間の720p動画を生成でき、漫画のようなアニメーションやトレース風の動画など、様々なアニメーションスタイルに対応できる柔軟性が特徴です。主な特徴は以下の通りです。

テキストからビデオへの生成:テキストを入力すると、最大10秒間の720p動画を生成でき、迅速かつ簡単な制作が可能です。

ウォーターマークなしの動画出力:無料ユーザーが生成した動画にはウォーターマークがありません。クリエイターはより自由に作品を作成できます。

多様な動画スタイル:Hotshotは、漫画風やダイナミックな映像など、様々なスタイルの動画を生成し、多様な創作ニーズに対応します。

高い適応性と拡張性:このモデルは、より長い動画時間と高解像度への拡張の可能性があり、将来的には音声生成にも対応する可能性があります。

強力な技術基盤:Hotshotは6億個の動画クリップを学習データとして使用し、多数のGPUを活用して効率的な動画生成を実現しています。

このAI動画生成モデルは現在、公開された「早期プレビュー」段階にあり、Hotshotの公式ウェブサイトで無料で体験できます。ただし、1日あたりの生成回数は2本に制限されており、生成された動画にはウォーターマークがありません。

Hotshot開発チームは4ヶ月でモデルの学習を完了

Hotshotを開発したスタートアップ企業は2023年に設立され、Aakash Sastry氏、John Mullan氏、Duncan Crawbuck氏の3人の創業者によって設立されました。

Sastry氏はソーシャルメディアXで、「過去10年間で初めて、顧客向けに強力で革新的なビデオアプリケーションを構築できる可能性が開けました。」と述べています。この新しいHotshotモデルは、その目標達成の基礎であり、彼らはこれが始まりであり、今後さらに多くの驚きを提供すると述べています。以前、Hotshotは無料の消費者向けAI写真作成・編集アプリで人気を博していましたが、現在は、この新しいテキストからビデオへのAIモデルに重点を置いています。

Sastry氏によると、Hotshotチームはわずか4ヶ月でこのモデルの学習を完了しました。これは簡単なことではありませんでした!彼らは6億個の動画クリップを使用し、数千個のGPUを使用して学習を行いました。その過程での技術的な課題は想像に難くなく、時にはマシンの故障にも悩まされました。

モデルの学習を円滑に進めるために、チームメンバーはほぼ24時間体制で学習プロセスを監視していました。Sastry氏は、より長い動画時間と高解像度を模索しており、将来的には音声要素を追加する可能性もあると述べています。

彼の見解では、AI生成コンテンツは今後12ヶ月以内にデジタルメディアの主流となり、特にYouTube動画制作において、クリエイターはテキストからビデオ、さらには音声まで、生成プロセスを完全に制御できるようになるでしょう。

AIbaseチームもHotshotをテストし、その生成動画には可能性があるものの、現在の品質とディテールは一部の競合他社には及ばないことを発見しました。「An ice sculptor carving an intricate design, chips flying as they work」というプロンプトを入力した際の生成動画は以下の通りです。

動画の動きは比較的スムーズですが、解像度は向上させる必要があります。もし試してみたい場合は、以下のリンクからアクセスできます。

製品へのアクセス:https://top.aibase.com/tool/hotshot

重要なポイント:

🌟 Hotshotの新しいテキストからビデオを生成するAIツールが公開された「早期プレビュー」段階に入り、無料で体験できます。

🚀 このモデルはわずか4ヶ月で6億個の動画クリップと数千個のGPUを使用して学習され、大きな可能性を示しています。

🎥 創業者のSastry氏は、今後1年以内にAIで生成された完全なYouTube動画が普及し、クリエイターはより多くの制御権を持つようになると予測しています。