doesVideoContain es un modelo que utiliza inteligencia artificial para detectar el contenido de vídeos en el navegador. Permite a los usuarios capturar automáticamente capturas de pantalla de vídeos e identificar momentos importantes mediante descripciones en frases sencillas en inglés. Este modelo funciona completamente en el cliente, protegiendo la privacidad del usuario sin necesidad de pagar por APIs y puede procesar archivos locales grandes sin necesidad de subirlos a la nube. Utiliza Transformers.js y ONNX Runtime Web del ecosistema Web AI, junto con lógica personalizada para realizar cálculos de similitud de coseno.