中国Z.com(ChinaZ.com)6月19日発表: 6月20日より、百度スマートクラウドの曦灵デジタルヒューマンプラットフォームが大幅にアップグレードされます。今回のアップグレードでは、精巧な2D/3Dデジタルヒューマンを効率的かつ低コストで生成できるようになっただけでなく、ライブ配信、ショートビデオ、対話など複数のシーンでマトリックス状に統合され、ユーザーエクスペリエンスが大幅に向上しました。企業IPの構築、観光IPのデザイン、エンターテインメントIPの開発など、曦灵プラットフォームはワンストップでスマートで便利、使いやすいデジタルヒューマンサービスを提供します。

アップグレードされた曦灵プラットフォームは、デジタルヒューマンの生成において目覚ましい能力を発揮します。ユーザーは人物像のスタイルを記述する文章を簡単に入力するだけで、システムは人間の思考を模倣し、わずか10分以内にリアルな3Dデジタルヒューマンを自動生成します。この迅速かつ正確な生成方法は、企業、観光、エンターテインメントなど複数の分野に、全く新しいIP創造の可能性を提供します。

微信截图_20240619085847.png

2Dデジタルヒューマンのクローン作成においても、曦灵プラットフォームは優れた技術力を示しています。ユーザーは鮮明な正面写真一枚をアップロードするだけで、プラットフォームは数秒で対応する2Dデジタルヒューマンのイメージを生成します。AI名刺や保険外交員など、大量のデジタルヒューマンを生成する必要があるものの、ビデオ撮影の条件が整っていないシーンでは、この機能は大きな利便性を提供します。

イメージクローンに加えて、曦灵プラットフォームは高速クローンと高品質クローンという2つの選択肢を提供しています。高速クローンは、口を閉じた1~4分のビデオでトレーニングするだけで、30分以内にクローン作成が完了し、口元の特徴は大規模モデルのマッチング結果に基づいており、効率性を重視するアプリケーションシーンに適しています。一方、高品質クローンは、口を開けた5~8分のビデオでトレーニングする必要があり、本人に1:1で再現し、非常にリアルで、本人のデジタル分身を作成し、高精度な再現性を求める場合に適しています。

さらに、曦灵プラットフォームは音声クローン機能も提供しています。ユーザーは30秒の音声録音をするだけで、デジタルヒューマンのナレーションやコンテンツ制作に使用できる、専用の定制音声を生成でき、ユーザーによりパーソナライズされた選択肢を提供します。