デジタルメディアの急増に伴い、ビデオコンテンツはかつてない速さで増加しています。しかし、従来の検索・分析手法は技術的な限界に縛られてきました。Twelve Labsは、人工知能の力でビデオコンテンツに対する革命的な理解能力をもたらすことで、この現状を一変させようとしています。

従来のビデオ検索は、タイトルやタグといった表層的な情報に留まり、氷山の一角しか見えていませんでした。Twelve Labsの創設者であるJae Lee氏は、真のビデオ理解にはより深いレベルの技術が必要であることを深く理解していました。彼らのモデルは、キーワードの認識だけでなく、ビデオ内の動作、物体、背景音も理解します。

image.png

つまり、ユーザーは「赤いシャツを着た人がレストランに入った時間」といった非常に具体的な質問をし、正確な答えを得ることができます。この画期的な能力は、NVIDIAやSamsungなどのテクノロジー大手からも注目を集めています。

GoogleやMicrosoftの汎用的なマルチモーダルモデルとは異なり、Twelve Labsはビデオ理解に特化しています。彼らのモデルにより、開発者は広告挿入からコンテンツ審査まで、あらゆる用途に対応できる独自のビデオ分析ツールをカスタマイズできます。

さらに特筆すべきは、Twelve Labsが技術革新を続けながら、倫理的な側面にも常に配慮している点です。彼らは厳格なバイアステストメカニズムを開発しており、AIモデルの公平性と包括性を確保しています。

同社のMarengoモデルは、単一のビデオ分析を超え、ビデオ、画像、オーディオを横断的に「任意から任意」の検索能力を提供します。このマルチモーダル埋め込み技術は、異常検知などの複雑なアプリケーションに新たな可能性を開きます。

最近3000万ドルの資金調達を行い、SK Telecom、HubSpot Venturesなどの投資家の支持を得て、Twelve Labsは人工知能発展の最前線に立っています。元Apple Siriアーキテクトである尹金氏の加入は、同社のグローバル化戦略に新たな勢いをもたらしました。

同社の目標は野心的です。今後、自動車、セキュリティなど複数の垂直分野に進出し、国防技術への参入も視野に入れています。特にIn-Q-Telからの投資は、同社の技術が国家安全保障分野で潜在的に活用できることを示唆しています。

Twelve Labsは、私たちがビデオコンテンツを理解し、インタラクトする方法を再定義しています。情報爆発の時代において、責任感と革新性を兼ね備えたAI技術に特化したTwelve Labsのような企業は、デジタルメディア革命を推進する原動力となるでしょう。

ビデオが静的なコンテンツではなく、テキストのように深く理解され、インタラクトできるようになったとき、私たちは全く新しい情報時代を迎えるでしょう。そして、Twelve Labsはその最前線に立っています。