Metaは最近、ユネスコ(国連教育科学文化機関)と協力して、多言語の音声録音と文字起こしを収集し、将来のオープンアクセス可能な人工知能(AI)開発を促進するための新しい言語技術パートナーシッププログラムを発表しました。このプログラムは、デジタル環境において見過ごされがちな少数民族言語に特に重点を置いています。

Metaによると、このプログラムは、10時間以上の音声録音とそのトランスクリプト、豊富な書面テキスト、翻訳された文章の集合を提供するパートナーを募集することを目指しています。Metaはパートナーとの共同作業を通じて、これらの言語をAIの音声認識と翻訳モデルに統合し、最終的な成果物をオープンソースで公開することを目指しています。

音声 波形 知能音声

画像出典:AI生成画像、画像ライセンス提供元Midjourney

現在までに、カナダ北部のヌナブト準州政府がパートナーとして確認されています。同地域の一部住民はイヌクティトゥット語と呼ばれる言語を使用しています。Metaのブログには、「私たちの取り組みは、ユネスコとの協力を支援するために、サービスが行き届いていない言語に特に焦点を当てています。最終的には、言語や文化の背景に関係なく、複雑な人間のニーズを理解し、対応できるインテリジェントシステムを作成することを目指しています。」と記されています。

このプログラムに合わせて、Metaは言語翻訳モデルのパフォーマンスを評価するためのオープンソースの機械翻訳ベンチマークも公開します。このベンチマークは言語学者によって設計され、7つの言語をサポートし、AI開発プラットフォームHugging Faceを通じてアクセスおよび貢献できます。

Metaはこれら2つの取り組みを慈善活動と位置付けていますが、音声認識と翻訳モデルのアップグレードにも役立つでしょう。Metaは、AIアシスタントであるMeta AIがサポートする言語数を継続的に拡大しており、Instagram Reelsでの音声翻訳機能などをテストし、クリエイターが音声に吹き替えや自動同期を行うことを可能にしています。

Metaの言語処理への取り組みは注目に値しますが、同社は英語以外のコンテンツの処理に関して多くの批判を受けてきました。報告によると、Facebookはイタリア語とスペイン語のCOVID-19に関する虚偽情報の処理において、約70%のコンテンツが未標識だったのに対し、英語コンテンツの未標識割合は29%にとどまりました。さらに、流出した文書によると、アラビア語のコンテンツはしばしば誤ってヘイトスピーチとして標識されたとされています。Metaは、これらの課題に対処するために、翻訳とコンテンツ審査技術の改善に取り組んでいると述べています。