有名なベンチマークツールであるGeekbenchが、AI集約型ワークロード下でのデバイスのパフォーマンスを評価するための、全く新しいクロスプラットフォームツールをリリースしました。Geekbench AIと名付けられたこのツールは、デバイスのCPU、GPU、NPU(ニューラルネットワークプロセッサ)のパフォーマンスをテストすることで、機械学習アプリケーションの処理能力を判断します。

Geekbenchの開発元であるPrimate Labsは、以前からGeekbench MLという名称でこのソフトウェアを開発しており、2021年にはプレビュー版をリリースしていました。今回、Geekbench AIに名称変更されたことは、現在のAI技術ブームを反映していると言えるでしょう。様々なAI関連タスクにおける様々なハードウェアのパフォーマンスを包括的に調査するため、Geekbench AIは速度と正確性の2つの側面からパフォーマンスを評価し、ONNX、CoreML、TensorFlow Lite、OpenVINOなど、複数のフレームワークをサポートしています。

image.png

Geekbench AIのテスト結果は、全精度、半精度、量子化精度の3つのスコアで構成されています。Primate Labsによると、これらのスコアには正確性の測定値も含まれており、ワークロードの出力と真の結果の近さを評価します。つまり、「モデルが期待されるタスクを実行する正確性」です。

現在、Geekbench AIはWindows、macOS、Linux、Android、iOSプラットフォームで公開されており、ユーザーはダウンロードして試用できます。しかし、これらのテストスコアと実際のタスクのパフォーマンスの関係を完全に理解するには、Copilot Plus PCや様々な新型スマートフォンなど、ローカルAI機能を搭載したデバイスをさらにテストする必要があります。

従来のフレームレートやロード時間テストとは異なり、Geekbench AIの登場は、テキスト予測の正確性や、生成AI画像エディタのパフォーマンスなど、新しい指標に注目し始める必要があることを意味します。これは、AI技術がデバイスのパフォーマンス評価方法を根本的に変えつつあることを反映しています。

Geekbench AIのリリースは、デバイスのAI能力評価に新たな基準を提供すると言えるでしょう。ますます多くのデバイスがAI機能を搭載するにつれて、このようなテストツールの重要性はますます高まるでしょう。これは、消費者が異なるデバイスのAIパフォーマンスをより良く理解し比較するのに役立つだけでなく、ハードウェアメーカーにとってもAIパフォーマンスを最適化する際の指標となります。

しかし、AIパフォーマンステストはまだ初期段階にあることを認識しておく必要があります。Geekbench AIのテスト結果が実際のユーザーエクスペリエンスとどのように関連しているか、そして様々なAIアプリケーションシナリオにおけるデバイスのパフォーマンスをどの程度正確に反映しているかは、さらなる観察と検証が必要です。

将来、デバイスのAI能力を様々な角度から評価する、同様のAIパフォーマンステストツールがさらに登場するでしょう。この傾向は、AI技術が従来のCPU、GPUのパフォーマンスと同様に、デバイスのパフォーマンスを評価する上で重要な要素になりつつあることを示しています。