En el torrente de medios digitales, el video está creciendo a una velocidad sin precedentes. Sin embargo, los métodos tradicionales de búsqueda y análisis siempre han estado limitados por las restricciones tecnológicas. Twelve Labs está cambiando radicalmente esta situación, utilizando el poder de la inteligencia artificial para brindar una capacidad revolucionaria de comprensión del contenido de video.
La búsqueda de video tradicional se limita a los títulos y etiquetas, como ver solo la punta del iceberg. El fundador de Twelve Labs, Jae Lee, sabe que la verdadera comprensión de video requiere una tecnología más profunda. Sus modelos no solo identifican palabras clave, sino que también comprenden las acciones, los objetos y los sonidos de fondo en el video.
Esto significa que los usuarios pueden hacer preguntas extremadamente precisas, como "¿Cuándo entra la persona con camisa roja al restaurante?", y obtener respuestas precisas. Esta capacidad revolucionaria ha atraído la atención de gigantes tecnológicos como Nvidia y Samsung.
A diferencia de los modelos multimodales generales de Google y Microsoft, Twelve Labs ha tomado un camino diferente, centrándose en la comprensión de video. Sus modelos permiten a los desarrolladores personalizar herramientas de análisis de video, con aplicaciones que van desde la inserción de anuncios hasta la moderación de contenido.
Más encomiable aún es que Twelve Labs, al mismo tiempo que innova tecnológicamente, mantiene una sensibilidad ética. Están desarrollando estrictos mecanismos de prueba de sesgos para garantizar la imparcialidad e inclusividad de los modelos de IA.
El modelo Marengo de la compañía ha superado el análisis de video individual, pudiendo abarcar video, imágenes y audio, ofreciendo capacidades de búsqueda "de cualquier cosa a cualquier cosa". Esta tecnología de incrustación multimodal abre nuevas posibilidades para aplicaciones complejas como la detección de anomalías.
Recientemente obtuvo una financiación de 30 millones de dólares, y con el respaldo de inversores como SK Telecom y HubSpot Ventures, Twelve Labs se encuentra a la vanguardia del desarrollo de la inteligencia artificial. La incorporación de Yin Jin, ex arquitecto de Siri de Apple, ha impulsado aún más la estrategia de globalización de la empresa.
Los objetivos de la empresa son ambiciosos: en el futuro, se expandirá a varios sectores verticales como la automoción y la seguridad, e incluso podría incursionar en la tecnología de defensa. La inversión de In-Q-Tel, en particular, sugiere posibles aplicaciones de su tecnología en seguridad nacional.
Twelve Labs está redefiniendo la forma en que entendemos e interactuamos con el contenido de video. En esta era de explosión de información, empresas como esta, que se centran en una IA responsable e innovadora, serán una fuerza clave para impulsar la revolución de los medios digitales.
Cuando el video deje de ser contenido estático y pueda comprenderse e interactuarse con él de forma profunda, como con el texto, entraremos en una nueva era de la información. Y Twelve Labs está a la vanguardia de esta era.