Jockey es un agente de vídeo conversacional basado en la API de Twelve Labs y LangGraph. Combina las capacidades de los modelos lingüísticos grandes (LLM) existentes con la API de Twelve Labs, utilizando LangGraph para la asignación de tareas y distribuir la carga de los flujos de trabajo de vídeo complejos a los modelos base adecuados. Los LLM se utilizan para la planificación lógica de los pasos de ejecución y la interacción con el usuario, mientras que las tareas relacionadas con el vídeo se remiten a la API de Twelve Labs, respaldada por modelos base de vídeo (VFM), para procesar el vídeo de forma nativa, sin necesidad de representaciones intermedias como subtítulos pregenerados.