Hedra完全ガイド：写真に表情をつけて話させる方法

aibase

公開日AIニュース · 1 分で読めます · Jul 18, 2024

110

最近、Hedra LabsがCharacter-1の研究プレビュー版をリリースしました。この技術により、ユーザーは任意の人物写真と音声コンテンツから、その人物が話す、歌うダイナミックな動画を生成できます。

想像してみてください。人物写真をアップロードし、任意の音声コンテンツを追加するだけで、瞬時にダイナミックな動画が生成されます。写真の人物が生き生きと話し始めたり、歌ったりする様子を、唇の動き、表情、姿勢が音声コンテンツと完璧に一致した状態で再現できます！ワクワクしませんか？

Hedra Labs公式デモ動画

主な特徴と機能のハイライト:

マルチプラットフォーム互換性:デスクトップでもモバイルデバイスでも、ユーザーはCharacter-1を簡単に使用できます。
無制限の長さでの生成:現在のプレビュー版では30秒の動画生成に対応していますが、H100の供給が十分であれば、60秒ごとに90秒分のコンテンツを生成できます。
様々な表現形式に対応:Character-1は会話だけでなく、歌唱やラップなどの表現形式にも対応しています。

Hedraはユーザーフレンドリーなインターフェースを提供しており、専門家でなくても簡単に使い始めることができます。ユーザーはHedraの公式ウェブサイトにアクセスし、テキスト読み上げ機能を使用するか、オーディオファイルを直接アップロードして、キャラクターの説明を入力し、ダイナミックな動画を生成できます。

HedraのAI技術は、動画コンテンツの高品質とリアルさを保証します。人物の表情、姿勢、音声の同期性はいずれも満足のいく仕上がりです。

公式から提供されている事例を見ると、Character-1は歌、演技、様々な感情表現をするキャラクターを完璧に演じることができます。この技術は人間キャラクターのみに限定されず、明確な顔の特徴を持つ無生物の物体であっても、豊かな表現力を備えた動画を生成できます。

使用方法も非常に簡単です。具体的な手順は以下のとおりです。

Hedra体験アドレスを開きます:https://top.aibase.com/tool/hedra

ページにアクセスすると、操作インターフェースが表示されます。

インターフェースはシンプルです。最初のボックスにキャラクターのセリフを入力し、音声を選択します。もちろん、生成されたオーディオを使用しない場合は、自分のオーディオをインポートすることもできます。

ここでは、「こんにちは、これはAIbaseが作成した動画です。今日は皆さんと一緒にHedraを体験し、動画生成を呼吸するほど簡単にします。」という簡単なセリフを入力しました。

次に、2番目のボックスに、話させる画像をアップロードします。ここでは、以前に作成した美女の写真をアップロードしました。

画像がない場合は、下のテキストボックスにキャラクターの説明を入力し、「作成」をクリックして生成することもできます。

画像のアップロードが完了したら、3番目のボックスの下にある「動画生成」をクリックします。

以下は生成された動画の効果です。

ご覧のとおり、Hedraで生成された動画では、人物が非常に生き生きとしており、口元だけでなく体の他の部分も動き、表情も豊かです。ただし、プラットフォームで使用可能な音声は限られているため、外国人のアクセントと私の画像の人物がうまく合っていません。また、生成された動画は元の画像よりもぼやけている点が少し残念です。プラットフォームでの画質の向上に期待します。

ここでは、自分でオーディオをアップロードしました。オーディオはCapCutで生成し、女性のトーンを選択してテキストを入力し、朗読させました。

再度テストしてみます。

オーディオのインポートを選択します。

生成結果は次のとおりです。

ぼやけの問題は、Krea AIの動画強化機能で解決できます。ただし、無料体験版では動画の長さが10秒を超えることはできないため、10秒を超える場合は自分で切り取る必要があります。また、フレームレートを高く設定しすぎると、途中で有料アップグレードが必要になりますのでご注意ください（泣）。

PixverseがMCPを発表：ワンクリックでAIビデオ生成の新たな境地へ

生成AI技術の急速な発展に伴い、ビデオ制作分野は新たな変革期を迎えています。AIビデオ生成分野をリードするプラットフォームであるPixverseは、最近、Model Context Protocol（MCP）を発表し、ユーザーと開発者により効率的で柔軟なビデオ生成ソリューションを提供します。MCPとは何か？AIビデオ生成の新たな方法を解き放つPixverseのMCP（Model Context Protocol）は、AIビデオ生成のために特別に設計された…

即夢ビデオ3.0内部テスト：滑らかなカメラワーク、人物の表情を正確に捉える

昨夜、即夢はビデオ3.0モデルの内部テストを開始しました。新しいビデオモデルは、カメラワークがよりスムーズになり、以前のモデルと比べてプロンプトの遵守度も向上しています。公式から提供されたいくつかの例を見ると、大幅な動きでも安定性が向上しており、人物が崩れる事態は起こりにくくなっています。男性がゴルフをする、子犬が料理をする、少年が熱唱する、ぬいぐるみとロボットが抱き合うなど、様々なシーンを簡単に処理できます。即夢3.0の主なハイライトは以下の通りです。1、豊富なカメラワーク　緊張感を高める急速なパンから、広大なシーンを見せるゆったりとしたパン、そして…

Vidu Q1正式リリース高画質、滑らかな動画を実現

生数科技は、高性能な生成AIビデオモデルであるVidu Q1を正式にリリースしました。最高の画質、滑らかな映画のようなトランジション、正確なサウンドエフェクト、強化されたアニメーションスタイルにより、業界で話題となっています。AIbaseの情報によると、Vidu Q1はVBench総合ビデオ生成評価基準において既存の競合製品を凌駕し、4つの主要機能の全面的なアップグレードにより、クリエイターにプロの映画スタジオに匹敵する制作体験を提供します。プロジェクトの詳細については、Viduの公式ウェブサイトとソーシャルメディアで公開されており、AIビデオ生成技術の進化を象徴しています。

AIデイリーニュース：OpenAIが来週GPT-4.1シリーズを発表か；Pikaに新しいAIビデオ機能Twists追加；商湯科技が日日新V6を発表

【AIデイリーニュース】へようこそ！ここでは、AIの世界を探求するための毎日のガイドとして、AI分野のホットなトピックを毎日お届けします。開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を支援します。最新のAI製品はこちらをご覧ください：https://top.aibase.com/1、報道によるとOpenAIは来週、GPT-4.1シリーズ（Mini版とNano版を含む）を発表する見込みです。OpenAIがGPT-4.1シリーズとo3シリーズを発表することは、同社が多様な分野での進歩を遂げていることを示しています。

Pika、超現実的な操作技術「Pika Twists」を発表：AIビデオ編集が新たな境地へ

AIビデオ生成プラットフォームのPikaは最近、画期的な新技術を発表しました。この技術により、ユーザーはビデオ内のあらゆるキャラクターやオブジェクトを、超現実的な方法で操作できるようになります。この画期的な機能の発表は、世界中のクリエイターから熱烈な反響を呼び起こしました。AIbaseの情報によると、Pikaのこの技術は、非常にリアルなビデオ編集効果を実現します。クリエイターコミュニティから公開されたデモ映像は驚くべきものであり、ビデオコンテンツ制作におけるAIの可能性を無限に示しています。超現実的な操作：ビデオ編集の新たな体験Pikaの新技術は、高度なA…

AIアバター生成企業Synthesia、Shutterstockとビデオコンテンツライセンス契約を締結

英国のスタートアップ企業Synthesiaは、人工知能技術を用いてリアルなアバターを生成する企業です。最近、アメリカのストックビデオ企業Shutterstockとライセンス契約を締結し、Shutterstockの豊富なビデオライブラリを活用して、同社の技術のリアルさを向上させることを目指しています。契約金額は公表されていませんが、Synthesiaは、これにより最新のAIモデルが人間の表情、声の調子、ボディランゲージをより正確に捉えるのに役立つと述べています。Synthesiaはデジタル…

阿里巴巴、OmniTalkerを発表：AIビデオ生成技術が新たなブレイクスルーへ、単一参照ビデオでスタイル化された音声と表情の同期を実現

先日、アリババ傘下の研究開発チームが「OmniTalker」という新しいAI技術プロジェクトを発表しました。このプロジェクトは、その驚異的なビデオ生成能力で業界の注目を集めています。OmniTalkerは、参照ビデオを1つ使用するだけで、ビデオ中の人物の音声スタイルと表情を正確に捉え、それを基に唇の動きと表情が自然なダイナミックビデオを生成できます。この技術の発表は、アリババの生成AI分野における高い能力を示すだけでなく、ビデオコンテンツ制作に革命的な可能性をもたらします。