知名基准测试工具Geekbench推出了一款全新的跨平台工具,旨在评估设备在AI密集型工作负载下的性能表现。这款名为Geekbench AI的工具通过测试设备的CPU、GPU和NPU(神经网络处理器)性能,来判断其处理机器学习应用的能力。

Geekbench的开发商Primate Labs此前一直在以Geekbench ML的名义开发这款软件,并于2021年推出了预览版。如今,他们将其更名为Geekbench AI,这一改变似乎顺应了当前AI技术的热潮。为了全面探索不同硬件在各种AI相关任务中的表现,Geekbench AI从速度和准确性两个维度评估性能,并支持多种框架,包括ONNX、CoreML、TensorFlow Lite和OpenVINO。

image.png

Geekbench AI的测试结果包含三个分数:全精度、半精度和量化精度。Primate Labs表示,这些分数还包含了准确性测量,用于评估工作负载输出与真实结果的接近程度,即"模型执行预期任务的准确性"。

目前,Geekbench AI已经在Windows、macOS、Linux、Android和iOS平台上发布,用户可以下载试用。然而,要全面了解这些测试分数与实际任务性能的关联,我们还需要更多时间来测试搭载本地AI功能的设备,如Copilot Plus PC和各种新型智能手机。

与传统的帧率或加载时间测试不同,Geekbench AI的出现意味着我们可能需要开始关注预测文本的准确性,或者生成式AI图像编辑器的表现等新指标。这反映了AI技术正在深刻改变我们评估设备性能的方式。

Geekbench AI的推出无疑为设备AI能力的评估提供了一个新的标准。随着越来越多的设备集成AI功能,这类测试工具的重要性将日益凸显。它不仅能帮助消费者更好地了解和比较不同设备的AI性能,也为硬件厂商提供了优化AI性能的参考指标。

然而,我们也应该认识到,AI性能测试仍处于早期阶段。Geekbench AI的测试结果如何与实际用户体验相关联,以及如何准确反映不同AI应用场景下的设备表现,都还需要进一步观察和验证。

未来,我们可能会看到更多类似的AI性能测试工具出现,它们将从不同角度评估设备的AI能力。这种趋势也反映了AI技术正在成为评判设备性能的一个重要维度,与传统的CPU、GPU性能同等重要。