AI大規模モデル訓練の裏側、データ産業チェーンが形成されつつある

バイトダンスは、最近話題になっている「インターンによる大規模モデル訓練の妨害」について公式に声明を発表しました。同社は、商業化技術チームの研究プロジェクトのモデル訓練タスクにおいて、インターンが不正に干渉したことを認めました。しかし、この行為は同社の正式な商業プロジェクトやオンラインサービスには影響しておらず、バイトダンスの他の大規模モデル事業にも関与していません。また、ネット上で流布している「8000枚以上のGPUカードが関与し、数千万ドルの損失が発生した」という情報は大幅に誇張されていると指摘しています。公開報道によると、このインターンはバイトダンスの商業化技術チームで...
テンセントクラウドは最近、大規模モデルのトレーニング効率を向上させることを目的としたアップグレード版の星脈ネットワーク2.0を発表しました。以前のバージョンでは、大規模モデルの計算結果の同期通信時間が50%以上を占め、効率が低下していました。新バージョンの星脈ネットワーク2.0では、複数の側面でアップグレードが実施されました。
先日、ムーアセラードと全学科教育AI大規模モデル「師者AI」は、大規模モデルの訓練テストを完了したと発表しました。ムーアセラードの夸娥(KUAE)千カード智算クラスターを活用し、師者AIは70億パラメーターの大規模モデルの高強度訓練を1週間で完了し、訓練効率は期待通りでした。これは、国産のフルファンクションGPU千カード、千億訓練プラットフォームの能力を十分に示しています。
中興通訊は、中小規模モデルのトレーニングと推論ニーズに対応した最新のAIサーバーを発表しました。G5シリーズサーバーを発表し、今年中には大規模モデルのトレーニングに対応した最新のAIサーバーを発表する予定です。