Pegasus-1

強力な動画 - テキスト生成モデル

一般製品ビデオ動画テキスト生成
Twelve Labsが提供するPegasus-1は、動画のタイトル、要約、カスタムテキスト出力の生成をサポートする強力な動画-テキスト生成モデルです。800億個のパラメータを備え、従来の動画-言語モデルと比較して、MSR-VTTデータセットで61%、Video Descriptionsデータセットで47%の性能向上を実現しています。ユーザーはAPIを介してPegasus-1モデルを呼び出し、タイトル、要約、チャプター、カスタムフォーマットを含む動画のテキスト出力を生成できます。Pegasus-1モデルは、動画の視覚、音声、音声情報を総合的に考慮しており、既存のソリューションと比較して、より包括的で正確なテキストを生成します。

Pegasus-1 代替品