最近、Hedra LabsがCharacter-1の研究プレビュー版をリリースしました。この技術により、ユーザーは任意の人物写真と音声コンテンツから、その人物が話す、歌うダイナミックな動画を生成できます。

想像してみてください。人物写真をアップロードし、任意の音声コンテンツを追加するだけで、瞬時にダイナミックな動画が生成されます。写真の人物が生き生きと話し始めたり、歌ったりする様子を、唇の動き、表情、姿勢が音声コンテンツと完璧に一致した状態で再現できます!ワクワクしませんか?

Hedra Labs公式デモ動画

主な特徴と機能のハイライト:

  • マルチプラットフォーム互換性:デスクトップでもモバイルデバイスでも、ユーザーはCharacter-1を簡単に使用できます。

  • 無制限の長さでの生成:現在のプレビュー版では30秒の動画生成に対応していますが、H100の供給が十分であれば、60秒ごとに90秒分のコンテンツを生成できます。

  • 様々な表現形式に対応:Character-1は会話だけでなく、歌唱やラップなどの表現形式にも対応しています。

Hedraはユーザーフレンドリーなインターフェースを提供しており、専門家でなくても簡単に使い始めることができます。ユーザーはHedraの公式ウェブサイトにアクセスし、テキスト読み上げ機能を使用するか、オーディオファイルを直接アップロードして、キャラクターの説明を入力し、ダイナミックな動画を生成できます。

HedraのAI技術は、動画コンテンツの高品質とリアルさを保証します。人物の表情、姿勢、音声の同期性はいずれも満足のいく仕上がりです。

公式から提供されている事例を見ると、Character-1は歌、演技、様々な感情表現をするキャラクターを完璧に演じることができます。この技術は人間キャラクターのみに限定されず、明確な顔の特徴を持つ無生物の物体であっても、豊かな表現力を備えた動画を生成できます。

使用方法も非常に簡単です。具体的な手順は以下のとおりです。

Hedra体験アドレスを開きます:https://top.aibase.com/tool/hedra

ページにアクセスすると、操作インターフェースが表示されます。

image.png

インターフェースはシンプルです。最初のボックスにキャラクターのセリフを入力し、音声を選択します。もちろん、生成されたオーディオを使用しない場合は、自分のオーディオをインポートすることもできます。

image.png

ここでは、「こんにちは、これはAIbaseが作成した動画です。今日は皆さんと一緒にHedraを体験し、動画生成を呼吸するほど簡単にします。」という簡単なセリフを入力しました。

次に、2番目のボックスに、話させる画像をアップロードします。ここでは、以前に作成した美女の写真をアップロードしました。

image.png

画像がない場合は、下のテキストボックスにキャラクターの説明を入力し、「作成」をクリックして生成することもできます。

画像のアップロードが完了したら、3番目のボックスの下にある「動画生成」をクリックします。

image.png

以下は生成された動画の効果です。

ご覧のとおり、Hedraで生成された動画では、人物が非常に生き生きとしており、口元だけでなく体の他の部分も動き、表情も豊かです。ただし、プラットフォームで使用可能な音声は限られているため、外国人のアクセントと私の画像の人物がうまく合っていません。また、生成された動画は元の画像よりもぼやけている点が少し残念です。プラットフォームでの画質の向上に期待します。

ここでは、自分でオーディオをアップロードしました。オーディオはCapCutで生成し、女性のトーンを選択してテキストを入力し、朗読させました。

image.png

再度テストしてみます。

オーディオのインポートを選択します。

image.png

生成結果は次のとおりです。

ぼやけの問題は、Krea AIの動画強化機能で解決できます。ただし、無料体験版では動画の長さが10秒を超えることはできないため、10秒を超える場合は自分で切り取る必要があります。また、フレームレートを高く設定しすぎると、途中で有料アップグレードが必要になりますのでご注意ください(泣)。

image.png