Dans le flot incessant des médias numériques, la vidéo connaît une croissance sans précédent. Cependant, les méthodes traditionnelles de recherche et d'analyse restent limitées par les contraintes technologiques. Le laboratoire Twelve révolutionne la situation en utilisant la puissance de l'intelligence artificielle pour apporter une capacité de compréhension révolutionnaire au contenu vidéo.
La recherche vidéo traditionnelle se limite aux titres et aux balises, comme si l'on ne voyait que la partie émergée de l'iceberg. Le fondateur de Twelve Labs, Jae Lee, sait que la véritable compréhension vidéo nécessite une technologie plus approfondie. Leur modèle ne se contente pas d'identifier les mots clés, il comprend également les actions, les objets et les sons de fond présents dans la vidéo.
Cela signifie que les utilisateurs peuvent poser des questions extrêmement précises, telles que « Quand la personne en chemise rouge est-elle entrée dans le restaurant ? », et obtenir des réponses exactes. Cette capacité révolutionnaire a attiré l'attention de géants de la technologie tels que Nvidia et Samsung.
Contrairement aux modèles multimodaux universels de Google et de Microsoft, Twelve Labs a choisi une approche différente en se concentrant sur la compréhension vidéo. Leur modèle permet aux développeurs de personnaliser des outils d'analyse vidéo, applicables à de nombreux domaines, de l'insertion publicitaire à la modération de contenu.
Plus remarquable encore, Twelve Labs, tout en innovant sur le plan technologique, reste sensible aux questions d'éthique. Ils développent des mécanismes stricts de test des biais pour garantir l'impartialité et l'inclusivité de leur modèle d'IA.
Le modèle Marengo de l'entreprise a dépassé l'analyse vidéo unique et est capable de parcourir les vidéos, les images et l'audio, offrant une capacité de recherche « n'importe quoi vers n'importe quoi ». Cette technique d'intégration multimodale ouvre de nouvelles possibilités pour des applications complexes telles que la détection d'anomalies.
Récemment financée à hauteur de 30 millions de dollars, et soutenue par des investisseurs tels que SK Telecom et HubSpot Ventures, Twelve Labs est à la pointe du développement de l'intelligence artificielle. L'arrivée de Yin Jin, ancien architecte de Siri chez Apple, apporte un nouvel élan à la stratégie d'internationalisation de l'entreprise.
Les objectifs de l'entreprise sont ambitieux : à l'avenir, elle prévoit de s'implanter dans plusieurs secteurs verticaux, tels que l'automobile et la sécurité, et pourrait même s'aventurer dans le domaine de la technologie de défense. L'investissement d'In-Q-Tel suggère notamment des applications potentielles de sa technologie dans le domaine de la sécurité nationale.
Twelve Labs est en train de redéfinir notre façon de comprendre et d'interagir avec le contenu vidéo. À l'ère de l'explosion de l'information, des entreprises comme Twelve Labs, qui se concentrent sur une IA responsable et innovante, seront des forces motrices de la révolution des médias numériques.
Lorsque la vidéo ne sera plus un contenu statique, mais pourra être comprise et interagie en profondeur comme du texte, nous entrerons dans une nouvelle ère de l'information. Et Twelve Labs est à l'avant-garde de cette ère.