Pegasus-1
Potente modelo de generación de texto a partir de vídeo
Producto ComúnVideoVídeoGeneración de texto
Pegasus-1, desarrollado por Twelve Labs, es un potente modelo de generación de texto a partir de vídeo que permite generar títulos, resúmenes y descripciones de vídeo personalizadas. Con 80 mil millones de parámetros, Pegasus-1 ha mejorado un 61% en el conjunto de datos MSR-VTT y un 47% en el conjunto de datos Video Descriptions, en comparación con modelos anteriores de lenguaje-vídeo. Los usuarios pueden acceder al modelo Pegasus-1 a través de una API para generar texto a partir de vídeo, incluyendo títulos, resúmenes, descripciones por capítulos y formatos personalizados. Pegasus-1 tiene en cuenta la información visual, de audio y de voz del vídeo, generando descripciones más completas y precisas que las soluciones existentes.