スマホで大型言語モデルの速度が5倍速！マイクロソフトアジア研究院が新技術をオープンソース化 CPUでも高速体験が可能に

AIbase基地

公開日AIニュース · 1 分で読めます · Aug 9, 2024

170

スマートデバイスが普及した現代において、私たちはスマートフォン、タブレット、さらにはスマートホームデバイスに、より強力なインテリジェント処理能力を持たせたいと願っています。しかし、これらのエッジデバイスはハードウェアリソース、特にメモリと計算能力が限られているため、大規模言語モデル（LLM）の展開と実行が制限されています。これらのデバイスが自然言語を理解し、質問に答え、さらには創作を行うことができる強力なモデルを搭載したら、私たちの生活はどのように変わるでしょうか？

これがT-MAC技術誕生の背景です。T-MAC（Table-Lookup-based MACの略）は、ルックアップテーブルベースの方法であり、低ビットの大規模言語モデルをCPU上で効率的に実行することで、エッジデバイス上のインテリジェントなアップグレードを実現します。

大規模言語モデルは通常、数十億から数百億ものパラメーターを含んでおり、これらのパラメーターを保存するには大量のメモリが必要です。これらのモデルをエッジデバイスに展開するには、モデルの重みを量子化し、より少ないビットで重みを表現することで、モデルのメモリ使用量を削減する必要があります。しかし、量子化されたモデルは演算時に混合精度行列乗算（mpGEMM）を行う必要があり、これは既存のハードウェアおよびソフトウェアシステムでは一般的ではなく、効率的なサポートも不足しています。

T-MACの中核となる考え方は、従来のデータ型に基づく乗算演算を、ビットベースのルックアップテーブル（LUT）検索に変換することです。この方法では、乗算演算が排除されるだけでなく、加算演算も削減されるため、演算効率が大幅に向上します。

具体的には、T-MACは以下の手順で実現されます。

重み行列を複数の一ビット行列に分解する。

活性化ベクトルとすべての一ビットパターンの積を事前に計算し、その結果をルックアップテーブルに保存する。

推論時に、ルックアップテーブルのインデックスと累算操作によって、最終的な行列乗算の結果を迅速に取得する。

様々なエッジデバイスでのテストにより、T-MACは顕著な性能向上を示しました。既存のllama.cpp実装と比較して、T-MACはスループットが4倍向上し、消費電力は70％削減されました。これにより、Raspberry Pi 5のようなローエンドデバイスでも、成人の平均読書速度を超える速度でトークンを生成できます。

T-MACは理論的な利点だけでなく、実用的な可能性も秘めています。スマートフォンでのリアルタイム音声認識や自然言語処理、スマートホームデバイスでのよりインテリジェントなインタラクション体験など、T-MACは重要な役割を果たします。

T-MAC技術は、低ビット大規模言語モデルのエッジデバイスへの展開のための、効率的で省エネルギーなソリューションを提供します。デバイスのインテリジェンスレベルを向上させるだけでなく、ユーザーにより豊かで便利なインテリジェントな体験をもたらします。技術の進歩と最適化に伴い、T-MACはエッジインテリジェンス分野でますます重要な役割を果たすと確信しています。

オープンソースアドレス：https://github.com/microsoft/T-MAC

論文アドレス：https://www.arxiv.org/pdf/2407.00088

スマートデバイス大規模言語モデル T-MAC技術エッジコンピューティング

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

商湯科技、新たなマルチモーダル大規模言語モデルを発表未来のインタラクション時代に向けた布石

4月10日に行われた商湯テクノロジー交流会において、商湯科技は最新のマルチモーダル融合大規模言語モデル「商湯日日新SenseNova V6」と「商湯大装置SenseCore2.0」システムを発表しました。この新型大規模言語モデルは、テキスト、画像、ビデオなど様々な情報形式を統合し、より自然で豊かなインタラクション体験を提供することを目指しています。今回発表されたSenseNova V6シリーズには4つのバージョンが含まれており、中でもSenseNova V6Proが注目を集めています。

Apr 10, 2025

宜人智科の智語大規模言語モデルが备案成功：コンプライアンスにおいて重要な一歩を踏み出し、AIが金融の未来を拓く

先日、宜人智科（米国株コード：YRD）は、独自開発の智語大規模言語モデルが、『生成式人工知能サービス管理暫行辦法』の規定に従い、正式に备案を完了したことを発表しました。このニュースは、宜人智科がAI技術のコンプライアンスにおいて重要な一歩を踏み出したことを示しており、金融分野におけるインテリジェントなアプリケーションの基盤を固めるものです。中国を代表するAI駆動型金融サービスプロバイダーとして、宜人智科は技術革新を通じて業界の変革を推進しています。画像出典：AI生成画像、画像ライセンス提供元Midjour

Apr 10, 2025

バイトダンスがMulti-SWE-benchを発表、多言語コードの自動修正に新基準を確立

プログラム開発の世界において、バグ修正は常に悩みの種です。この度、バイトダンスのDoubao大規模言語モデルチームは朗報をもたらしました。同チームは、初の多言語ソフトウェアエンジニアリング（SWE）データセットであるMulti-SWE-benchを正式に発表しました。この新しいデータセットは、大規模言語モデルによるコードバグの自動修正能力を評価・向上させることを目的としています。Multi-SWE-benchは従来の単一言語データセットと比較して、適用範囲を大幅に拡大しています。このデータセットはPythonだけでなく、

Apr 10, 2025

バイトダンス、大規模言語モデルコードインテリジェントアップグレード推進のためMulti-SWE-benchをオープンソース化

Apr 10, 2025

アップルiOS 19のAI機能が明らかに：サマリー機能強化、通知管理のスマート化

最近、アップル社の人工知能分野における新たな動きが注目を集めています。ブルームバーグのマーク・ガーマン記者による最新の報道によると、アップルは間もなくリリースされるiOS 19システムにおいて、同社の「Apple Intelligence」人工知能技術の適用範囲を大幅に拡大する計画です。このニュースは、アップルの将来のAI戦略に対し、業界関係者の期待を高めています。情報によると、アップルはサードパーティの開発者に対し、サマリー生成APIインターフェースを公開する予定です。これは、ユーザーが複数の場面でAIによる恩恵を受けられることを意味します。

Apr 10, 2025

京東零售、初の自社開発10億規模の時系列大規模言語モデルTimeHFを発表商品販売量の予測が可能に

京東零售の技術チームは、自社開発による初の10億規模の販売予測時系列大規模言語モデルTimeHFを発表しました。このモデルは、人間のフィードバックによる強化学習技術（RLHF）に基づいており、販売予測分野への応用は初めてです。予測精度は10％以上向上し、需要予測における不確実性を大幅に削減しました。この成果は、京東内部の2万種類の商品における自動補充のシナリオで優れた成果を上げています。

Apr 10, 2025

ユナイテッド・イメージング、医療大規模言語モデル「元智」を発表　画像診断とスマート医療サービスを支援

医療技術の進歩を続ける中、ユナイテッド・イメージングは4月9日、最新の医療大規模言語モデル「元智」を発表しました。この大規模言語モデルの発表は、医療業界に新たな機会をもたらすだけでなく、医師と患者によりスマートなサービスを提供します。ユナイテッド・イメージングの「元智」は、数千万件の医療画像データと数十万件の正確なアノテーションデータに基づいており、画像診断の効率と精度を向上させることを目的としています。「元智」は10種類以上の画像モダリティをサポートし、300種類以上の画像処理タスクを処理できます。これは、

Apr 9, 2025

推論性能が飛躍的に向上！DeepSeekが革新的技術SPCTを発表、大規模モデルがより人間を理解

中国の注目を集める人工知能研究機関DeepSeek AIは、強力なオープンソース言語モデルDeepSeek-R1に続き、大規模言語モデル(LLM)分野で再び大きな進歩を遂げました。最近、DeepSeek AIは、より汎用的で拡張性の高いAI報酬モデル(Reward Models)を構築することを目的とした、自己主導原則の批判的調整(Self-Principled Critique Tuning、略してSPCT)という革新的な技術を発表しました。

Apr 9, 2025

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表 - Llama 4 Behemothを凌駕する性能

Apr 9, 2025

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表：AI性能の王者、業界の新たなベンチマークを定義

先日、世界的なチップおよびAI技術大手NVIDIA（エヌビディア）が、新たなオープンソースの大規模言語モデルであるLlama 3.1 Nemotron Ultra 253Bを発表し、人工知能分野で大きな反響を呼びました。このモデルはMetaのLlama-3.1-405Bをベースに、革新的な技術で最適化されており、Llama 4 BehemothやMaverickなどの強力な競合製品を性能面で凌駕するだけでなく、効率的なリソース利用率と卓越したマルチタスク能力により、A…

Apr 9, 2025

AIニュース

AIデイリー

AIタイムライン

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

スマホで大型言語モデルの速度が5倍速！マイクロソフトアジア研究院が新技術をオープンソース化 CPUでも高速体験が可能に

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

商湯科技、新たなマルチモーダル大規模言語モデルを発表 未来のインタラクション時代に向けた布石

宜人智科の智語大規模言語モデルが备案成功：コンプライアンスにおいて重要な一歩を踏み出し、AIが金融の未来を拓く

バイトダンスがMulti-SWE-benchを発表、多言語コードの自動修正に新基準を確立

バイトダンス、大規模言語モデルコードインテリジェントアップグレード推進のためMulti-SWE-benchをオープンソース化

アップルiOS 19のAI機能が明らかに：サマリー機能強化、通知管理のスマート化

京東零售、初の自社開発10億規模の時系列大規模言語モデルTimeHFを発表 商品販売量の予測が可能に

ユナイテッド・イメージング、医療大規模言語モデル「元智」を発表 画像診断とスマート医療サービスを支援

推論性能が飛躍的に向上！DeepSeekが革新的技術SPCTを発表、大規模モデルがより人間を理解

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表 - Llama 4 Behemothを凌駕する性能

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表：AI性能の王者、業界の新たなベンチマークを定義

商湯科技、新たなマルチモーダル大規模言語モデルを発表未来のインタラクション時代に向けた布石

京東零售、初の自社開発10億規模の時系列大規模言語モデルTimeHFを発表商品販売量の予測が可能に

ユナイテッド・イメージング、医療大規模言語モデル「元智」を発表　画像診断とスマート医療サービスを支援