ja
AI製品ランキング
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
ホーム
AIニュース
AIデイリー
マネタイズガイド
AIチュートリアル
AIツールナビ
AI製品ライブラリ
ja
AI製品ランキング
グローバルAI製品の動向を検索
グローバルAI情報を検索して、AIの新しい機会を発見
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
タイプ :
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
2024-08-16 09:26:00
.
AIbase
.
11.1k
NVIDIA、新しいモデルトレーニングの計算能力を1.8倍削減する画期的なオープンソース化を発表
NVIDIAは、2つの新型大規模言語モデル、Nemotron-4-Minitron-4BとNemotron-4-Minitron-8Bをオープンソース化しました。構造化プルーニングと知識蒸留という効率的なトレーニング方法を採用することで、トレーニングに必要なリソースを大幅に削減し、データと計算能力の消費量を削減することに成功しました。従来の方法と比較して、新しいモデルのトレーニングに必要なトークンデータは40分の1に、計算コストは1.8分の1に削減されています。Llama-3.18Bを最適化することで、構造化プルーニングによりモデル構造を簡素化し、知識蒸留により性能を向上させています。Minitron