中文インターネット語料資源プラットフォーム
高品質な中国語語料資源を提供し、人工知能大規模モデルの事前学習を支援します。
プレミアム新製品その他人工知能語料庫
中文インターネット語料資源プラットフォームは、中国インターネット空間安全協会が主催する専門ウェブサイトであり、人工知能大規模モデルの事前学習のために、高品質で安全かつ法令に準拠した中国語語料資源を提供することを目的としています。本プラットフォームは、企業、大学、研究機関の協調的な強みを結集し、「共建-共有」メカニズムに基づき、中文インターネット基礎語料2.0、人民網主流価値データセット、国家版本館明清文献語料など、複数の高品質な語料庫を形成しています。これらの語料庫は、情報源の厳格な選別、フォーマットのクレンジング、言語フィルタリング、データ重複排除、コンテンツフィルタリング、プライバシーフィルタリングなどの処理手順を経ており、データの合法性、真実性、正確性、客観性を確保しています。本プラットフォームの資源は、国家の人工知能技術革新と産業発展に重要な意味を持ち、大規模モデルが中国語コンテンツをより適切に理解し生成することを支援し、その知識能力と価値観の一致性を向上させます。
中文インターネット語料資源プラットフォーム 最新のトラフィック状況
月間総訪問数
3867
直帰率
49.24%
平均ページ/訪問
2.5
平均訪問時間
00:00:43