世界最大の商業画像ライブラリであるGetty Imagesは先週、AI開発者向けに高画質写真サンプルのトレーニングデータセットを提供するという重要な発表を行いました。このデータセットは、商業、教育、医療、スポーツ&フィットネス、物品、イラスト、アイコンなど15のカテゴリーにわたる3,750枚の高品質写真で構成されており、様々なAIアプリケーションの開発とトレーニングを支援することを目的としています。

このデータセットはHugging Faceプラットフォームで公開されており、利用規約に同意し、連絡先情報を提供することで無料でアクセスできます。Getty Imagesはこの取り組みを通じて、企業や開発者を無料サンプルで惹きつけ、同時に有料ライセンスサービスの普及を目指しています。

QQ20240909-140533.png

同社は5億7,200万枚以上の写真を保有しており、そのうち2億枚以上は商業利用可能ですと主張しています。各写真は年齢や性別などの情報を含む構造化メタデータが添付されており、平均して1枚あたり50個のキーワードが付与されています。これはAIモデルのトレーニングに役立つだけでなく、ユーザーに安全なトレーニングリソースを提供し、著作権侵害のリスクを軽減します。

この取り組みは、従来の画像ライブラリサービスがAI時代への積極的な転換を示しており、画像認識と生成技術の発展に新たな原動力をもたらします。Getty Imagesの戦略的取り組みは、業界全体に大きな影響を与え、AIと従来の画像ライブラリサービスの融合とイノベーションを促進する可能性があります。

AI技術が画像処理と生成分野で急速に発展するにつれて、高品質なトレーニングデータは開発者にとって貴重なリソースとなります。Getty Imagesのこの行動は、間違いなく業界に新たな基準を打ち立てています。

アドレス:https://github.com/mayuelala/FollowYourCanvas