百度傘下の深層学習プラットフォームであるPaddlePaddle(飛槳)が、最新世代のPaddlePaddleフレームワーク3.0を正式にリリースしたと発表しました。今回のフレームワーク3.0では、「動静統一自動並列処理」など、5つの主要な技術革新が導入され、大規模モデルの開発とトレーニングのコストを効果的に削減し、大規模モデル時代のインフラ構築を支援することを目指しています。

大規模モデルのトレーニングと推論タスクを支える中核インフラとして、PaddlePaddleフレームワーク3.0は性能最適化において優れたパフォーマンスを発揮します。このフレームワークは、文心4.5、文心X1など、複数の主流大規模モデルを既にサポートしており、最適化されたDeepSeek-R1フルバージョン単一マシン展開により、スループットが最大2倍に向上しました。

百度 (4)

計算速度に関しては、PaddlePaddleフレームワーク3.0は革新的なニューラルネットワークコンパイラCINNを活用することで、パフォーマンスが大幅に向上しました。一部の演算子の実行速度は最大4倍に向上し、モデルのエンドツーエンドのトレーニング速度も27.4%向上し、大規模モデルのトレーニング時間を大幅に短縮しました。

ハードウェアの適合性に関しては、PaddlePaddleフレームワーク3.0は複数のチップに対応する統一された適応ソリューションを導入し、60種類以上の主流チップをサポートしており、トレーニングクラスタ、自動運転、スマート端末など、多様なアプリケーションシナリオを網羅しています。開発者は一度コードを書けば、チップ間でのシームレスな移行を実現でき、ハードウェアの適合コストを最大80%削減できます。

PaddlePaddle 3.0のリリースは、深層学習フレームワークにおける技術革新であり、大規模人工知能モデルの開発と展開により効率的で柔軟なサポートを提供します。