Meta AIの新しい量子化版Llama 3.2：速度2倍向上、サイズ56％削減、スマートフォンでも実行可能

AIbase基地

公開日AIニュース · 1 分で読めます · Oct 25, 2024

464

最近、Meta AIは、1Bと3Bの2つのバージョンを含む、新しい量子化Llama3.2モデルを発表しました。このモデルは、様々なデバイスで微調整、蒸留、展開が可能です。

従来、Llama3のようなモデルは自然言語の理解と生成において顕著な成果を上げてきましたが、その巨大なサイズと高い計算需要により、多くの組織にとって利用が困難でした。長いトレーニング時間、高いエネルギー消費、そして高価なハードウェアへの依存は、テクノロジー大手と中小企業の間に大きな溝を作っていました。

Llama3.2の特徴の一つは、多言語テキストと画像処理に対応していることです。1Bと3Bのモデルは量子化処理されており、平均で56％のサイズ縮小、メモリ使用量41％の削減、そして2～3倍の速度向上を実現し、モバイルデバイスやエッジコンピューティング環境での動作に最適です。

具体的には、これらのモデルは8ビットと4ビットの量子化戦略を採用し、元の32ビット浮動小数点数の重みと活性化精度を下げることで、メモリ需要と計算能力の要求を大幅に削減しています。これは、量子化されたLlama3.2モデルが一般的な消費者向けGPU、さらにはCPUでも動作し、性能上の損失はほとんどないことを意味します。

想像してみてください。ユーザーは、リアルタイムでの議論内容の要約やカレンダーツールの呼び出しなど、様々なスマートアプリケーションをスマートフォンで利用できるようになります。これらは、これらの軽量モデルのおかげです。

Meta AIは、QualcommやMediaTekなどの業界をリードするパートナーと協力して、これらのモデルをArm CPUベースのシステムオンチップに展開し、幅広いデバイスで効率的に使用できるようにしています。初期テストでは、量子化されたLlama3.2は主要な自然言語処理ベンチマークテストで、Llama3モデルの95％の性能を達成し、メモリ使用量は約60％削減されました。これは、高価なインフラストラクチャに投資することなくAIを実現したい企業や研究者にとって、非常に大きな意味を持ちます。

Meta AIが発表した量子化Llama3.2モデルは、AI技術のアクセシビリティ向上に大きく貢献するだけでなく、コストや環境への影響など、現在の巨大言語モデルのアプリケーションにおけるいくつかの重要な問題を解決しています。この効率的なモデル開発のトレンドは、将来、AIの持続可能で包括的な発展を推進していくでしょう。

モデルへのアクセス:https://www.llama.com/

要点:
🌟 Meta AIが発表した量子化Llama3.2モデルは、1Bと3Bのバージョンがあり、モデルサイズと計算リソースの需要を大幅に削減します。
⚡️ モデルの推論速度は2～4倍向上し、一般的な消費者向けハードウェアに適しており、リアルタイムアプリケーションに最適です。
🌍 量子化Llama3.2は、自然言語処理のパフォーマンスにおいて元のモデルとほぼ同等であり、企業や研究者によるAIアプリケーションの実現を支援します。

Meta AIが新しいビデオ学習モデルV-JEPAを発表：ビデオ理解の新たなブレークスルー

最近、Meta AIチームはビデオ共同埋め込み予測アーキテクチャ（V-JEPA）モデルを発表しました。この革新的な取り組みは、機械知能の発展を促進することを目的としています。人間は視覚信号からの情報を自然に処理し、周囲の物体や動きのパターンを認識することができます。機械学習の重要な目標の一つは、人間が無監督学習を行う根本的な原理を明らかにすることです。研究者たちは、連続する感覚入力の表現が互いに予測可能であるべきだという重要な仮説を提案しました。初期の研究方法は、遅い特徴分析を通じて行われました。

Meta AI、MILSシステムを発表　LLMが専門訓練なしでマルチメディアデータを処理可能に

Meta AIの研究者と学術パートナーは、画像、ビデオ、オーディオを処理するために、大規模言語モデルを専門的に訓練する必要がない革新的なシステム、MILS（マルチモーダル反復型LLMソルバー）を共同開発しました。MILSは大規模なデータトレーニングではなく、言語モデルの自然な問題解決能力に依存しており、独自の利点を示しています。MILSは、2つのAIモデルをペアにしてタスク解決を行うことで機能します。1つはタスク解決策を提案する「ジェネレーター」、もう1つは「評価者」です。

成都華微：AI演算能力16TOPSの人工知能チップが少量試用開始

成都華微は先日、自社のインタラクティブプラットフォームで、エッジコンピューティング分野向けの人工知能チップを開発したと発表しました。このチップのAI演算能力は16TOPSに達し、現在、特定業界の複数の顧客で少量試用されています。この新型チップは高い演算能力に加え、ビデオコーデックにおいても優れた性能を発揮し、最大8Kのビデオ処理能力をサポートします。これは、ビデオ監視、スマートホームなどのアプリケーションシーンにとって重要な技術進歩です。成都華微は、さらに…

科大訊飛がリード投資、雲錦微：「1万元級」エッジコンピューティングソリューションを構築

インテリジェント・サージェンスの情報によると、具象知能体オペレーティングシステム開発企業の雲錦微は最近、数百万元規模のエンジェルラウンドの資金調達を完了したと発表しました。リード投資家は科大訊飛です。今回の資金調達は、コアテクノロジー製品の研究開発と市場エコシステムの構築に使用されます。雲錦微は2021年6月に設立され、具象知能体オペレーティングシステムの研究開発に特化しています。同社は、元依図科技ハードウェア事業部ゼネラルマネージャーの王文藝博士によって設立され、共同設立者の周昌博士はアリババ達摩院都市脳ビジョン大規模モデル開発責任者を務めました。チームは寧波市の姚江英才計画と甬江人材計画の支援を受けました。

AIニュース