研究者らはMITやCohere for AIなどの機関と共同で、AI分野におけるデータの透明性危機に対処することを目的としたData Provenance Platformを発表しました。
彼らは広く使用されている2,000以上のファインチューニング済みデータセットを監査・追跡し、データセットのトレーサビリティと透明性の問題が、データ漏洩、個人情報の暴露、バイアス、法的リスクにつながる可能性を強調しました。
この取り組みは、AI分野におけるデータの透明性を高め、データセットの質と倫理的なコンプライアンスを向上させ、AI技術の持続可能な発展を促進すると期待されています。