最近、国家発展改革委員会、国家データ局、工業情報化部が共同で「国家データインフラ建設指針」を発表しました。この指針は、全国各地で積極的に行政サービス大規模言語モデル(LLM)の構築を進め、行政サービスのインテリジェント化を促進し、ひいては政府サービスの効率と質の向上を目指しています。
指針では、データアノテーション産業の重要性が強調されており、各地域におけるデータアノテーションのエコシステム構築、能力向上、そしてシナリオ適用における探求とイノベーションが奨励されています。政府は公共データを連携させ、企業や個人のデータを積極的に公開し、同時に高品質なデータリソースの公開カタログを構築することで、社会全体に統一的なデータリソースを提供し、情報共有を促進します。
データの正確性とモデルの専門性を確保するため、指針では高品質なデータセット構築基準の策定が求められています。データ生成、アノテーション定義から管理に至るまで、各段階において厳格な管理が必須となります。さらに、関連部門は高品質なデータアノテーションとデリバリールールを策定し、トレーニングデータの質を高め、農業、工業、交通、金融など各業界における高品質なデータセットの構築を保証します。
注目すべきは、指針が公共データ運用プラットフォームの集約化と標準化構築を地域の実情に合わせて推進し、公共データの大規模供給を強化し、データリソースの分野横断、階層横断、地域横断の流通と利用を促進すると述べている点です。これは、各地政府がより効率的にデータリソースを活用し、市民により便利なサービスを提供することを意味します。
同時に、指針ではデータ収集、保存、クレンジング、アノテーション、管理、適用などの機能を統合した一体型データ基盤汎用ツールプラットフォームを構築し、データ加工の効率向上とデータ品質の保証を図るよう求めています。この措置は、行政サービスのインテリジェント化のための堅実な基盤を築くことになります。
要約すると、行政サービス大規模言語モデルの構築とインテリジェント化の推進を通じて、政府は行政サービスの質と効率の向上を目指し、デジタル経済の発展に新たな活力を注入することを期待しています。