MITなど機関が協力し、AIデータの透明性危機を解決

站长之家

公開日AIニュース · 1 分で読めます · Oct 26, 2023

データプロベナンスプラットフォーム

研究者らはMITやCohere for AIなどの機関と共同で、AI分野におけるデータの透明性危機に対処することを目的としたData Provenance Platformを発表しました。

彼らは広く使用されている2,000以上のファインチューニング済みデータセットを監査・追跡し、データセットのトレーサビリティと透明性の問題が、データ漏洩、個人情報の暴露、バイアス、法的リスクにつながる可能性を強調しました。

この取り組みは、AI分野におけるデータの透明性を高め、データセットの質と倫理的なコンプライアンスを向上させ、AI技術の持続可能な発展を促進すると期待されています。

AIトレーニングデータの透明性に関する世界初のテンプレート発表、AI業界の透明化を推進

人工知能（AI）分野における透明性を推進する取り組みの一環として、コンピュータ・通信業界協会（CCIA）はブリュッセルとワシントンD.C.において、画期的な新たな取り組みとして、世界的な業界透明性レポート・テンプレートを発表しました。このテンプレートは、汎用人工知能（GPAI）モデルのトレーニングデータに対する一般の信頼と理解を高めることを目的としています。今回発表された「AIモデルトレーニングデータ透明性テンプレート」は、企業に対し、特定のGPAIモデルのトレーニングに使用されたデータの種類（例：ポッドキャスト、書籍など）を開示することを求めており、データの主要な…

OpenAI、多言語AIデータセットを発表し、世界言語の平等を推進

先日、OpenAIは、アラビア語、ドイツ語、スワヒリ語、ベンガル語、ヨルバ語など14言語におけるAIのパフォーマンスを評価することを目的とした、重要な多言語データセットを発表しました。「多言語大規模多タスク言語理解」（MMMLU）と名付けられたこのデータセットは、オープンデータプラットフォームHugging Faceで公開され、OpenAIによる世界的なAI分野における新たな重要な進歩を示しています。データセットへのアクセス：https://huggingface

LAION、新たなAIデータセットRe-LAION-5Bを発表、児童性的虐待コンテンツへのリンクを完全に削除

LAIONは、CSAM（児童性的虐待素材）へのリンクを包括的に削除した世界初のAIトレーニングデータセットであるRe-LAION-5Bを発表しました。これは、児童性的虐待素材の問題に対処することを目的としています。このデータセットはLAION-5Bを大幅に改良したもので、Re-LAION-5B ResearchとResearch-Safeの2つのバージョンがあり、合計2236個のCSAMリンクが削除されています。そのうち1008個は児童保護団体のリストに掲載されていたものです。このデータセットは、テキストと画像のペアを55億個含んでおり、…

AIニュース

MITなど機関が協力し、AIデータの透明性危機を解決

站长之家

関連AIニュースの推奨

AIトレーニングデータの透明性に関する世界初のテンプレート発表、AI業界の透明化を推進

OpenAI、多言語AIデータセットを発表し、世界言語の平等を推進

LAION、新たなAIデータセットRe-LAION-5Bを発表、児童性的虐待コンテンツへのリンクを完全に削除