騰訊、AI生成コンテンツ検出ツールを発表、虚偽情報の拡散に対抗

人工知能技術の急速な発展に伴い、AIが生成するテキスト、画像、動画は様々な分野で活用されるようになりました。しかし、同時に信頼性の危機も発生しており、虚偽情報の拡散は社会に潜在的な脅威をもたらしています。この課題に対処するため、テンセントは先日、AI技術を用いてAI生成コンテンツの偽物を識別する、全く新しいAI生成コンテンツ検出ツールを発表しました。

このツールはテンセントの朱雀ラボによって開発され、AI生成テキスト検出システムとAI生成画像検出システムの2つのシステムで構成されています。テンセントは公式声明で、AI生成画像は見た目ではますますリアルになっていますが、依然として識別可能な特徴があると指摘しています。アップロードされた画像を数秒で迅速に検証することで、ユーザーはその画像がAIによって生成されたものかどうかを判断できます。

検出ロジックにおいて、システムは主に、本物の画像とAI生成画像の微妙な違いを捉えることで識別を行います。例えば、AI生成画像は常識に反する場合や、場合によっては透かしを追加する必要がある場合があります。さらに、AI生成画像には特定の隠れた特徴が含まれている可能性があります。検出の正確性を確保するために、テンセントはモデルのトレーニングに140万件の正負のサンプルを使用し、人体、風景、人物、ランドマークなど多様なシーンを網羅しました。最終的なテストでは検出率が95％以上に達し、システムは継続的に最適化されています。

テキスト検出においても、テンセントの検出システムは大量の正負のサンプルを用いたトレーニングを行い、ニュース、公文書、小説、随筆など多様な文体をカバーしています。検出対象のテキストと大規模言語モデルの予測内容を比較することで、テキストがAIによって生成された確率を推定し、未知のデータに対する検出能力を高めています。今後、テンセントは詩など他の文体にもテキスト検出システムを拡張し、識別精度をさらに向上させる予定です。

この革新的な取り組みを通じて、テンセントはユーザーにより安全で信頼できるオンライン環境を提供し、虚偽情報の拡散を効果的に抑制し、社会の健全な発展に貢献することを目指しています。