2025年1月17日、テンセントはAI生成画像の識別ツールをリリースしました。このツールは、画像がAIによって生成されたものかどうかを判別するのに役立ちます。
テンセント混元安全チームの朱雀ラボが開発したAI生成画像検出システムは、画像をアップロードして検証を待つことで、数秒で画像がAI生成かどうかを判断できます。このシステムは主に、AI生成画像と現実の画像の違いを捉えることで識別します。例えば、AI生成画像には、翼が生えた犬や葉巻をくわえた猫など、現実にはありえない内容が含まれることがあります。また、AI生成画像には「透かし」つまり明示的または暗示的な識別子が追加されており、肉眼で見える場合もあれば、目立たない場合もあります。検出ツールを使用することで読み取ることができます。さらに、AI生成画像には、肉眼では見えない隠れた特徴も含まれています。例えば、HSV色空間を調整すると、AI生成画像では局所的なテクスチャが密集して明るい点として現れるなどです。
AI生成画像の識別は、単一の根拠だけに頼ることはできません。検出システムは、AIモデルを使用して、画像のテクスチャ、意味、および隠れた特徴など、様々な特徴の違いを捉える必要があります。朱雀ラボは、140万件の正負のサンプルを使用してモデルのトレーニングを行い、様々な生成コンテンツのシナリオを網羅しました。最終的なテストでは、検出率は95%以上に達し、継続的に最適化と改善が行われています。朱雀ラボは、テキスト検出システムも開発しており、大量のデータ学習を通じてテキスト検出を実現しています。これもまた、大量の正負のサンプルを収集してトレーニングを行い、比較方法を用いて文章のAI生成確率を推定することで、未知のデータに対する検出能力を高めています。現在、このシステムはニュース通信、公文書、小説、随筆など、多様な文体を網羅しており、今後、詩などについても対応を強化していく予定です。
朱雀ラボがAI検出ツールを開発した当初の目的は、混元大規模言語モデルのトレーニングデータの最適化でしたが、AIの爆発的な普及に伴い、学術界や産業界で「AIでAI生成物を検出する」というニーズが高まっています。そこで、ラボはAI生成画像検出ツールとAI生成テキスト検出ツールの2つのツールを開発し、体験サービスを提供しています。
今後、AI生成動画の検出ツールもリリースし、検出能力の更なる向上を目指します。
体験アドレス:
https://matrix.tencent.com/ai-detect/ai_gen
https://matrix.tencent.com/ai-detect