Pegasus-1
Modèle puissant de génération de texte à partir de vidéo
Produit OrdinaireVidéoVidéoGénération de texte
Développé par Twelve Labs, Pegasus-1 est un puissant modèle de génération de texte à partir de vidéo, capable de générer des titres, des résumés et des sorties textuelles personnalisées pour des vidéos. Ce modèle, doté de 80 milliards de paramètres, a surpassé les modèles vidéo-langage précédents de 61 % sur l'ensemble de données MSR-VTT et de 47 % sur l'ensemble de données Video Descriptions. Les utilisateurs peuvent générer des sorties textuelles pour les vidéos via une API, incluant des titres, des résumés, des chapitres et des formats personnalisés. Pegasus-1 prend pleinement en compte les informations visuelles, audio et vocales des vidéos, offrant des sorties textuelles plus complètes et précises que les solutions existantes.