最近、Inflection AIは最新のエンタープライズプラットフォームにおいて、NvidiaのGPUからIntelのGaudi3アクセラレーターへの移行という注目すべき決定を下しました。この変更は、同社のAI分野における戦略転換を示しており、以前は「Pi」顧客アプリケーションはNvidiaのGPUを基盤として稼働していました。現在、Inflection3.0はGaudi3を基盤とし、ユーザーはオンプレミスまたはTiber AI Cloud上で実行できます。

チップ AIイラスト (1)

出典注記:画像はAIによって生成され、画像ライセンスサービスプロバイダーMidjourneyによるものです。

Inflection AIは2022年に設立され、当初はPiと呼ばれる会話型パーソナルアシスタントの開発に注力していました。しかし、共同設立者のMustafa Suleyman氏とKarén Simonyan氏が春に退社しMicrosoftに移籍したことで、同社は企業向けのカスタム微調整モデルの構築に重点を移し、顧客データを利用してサービス品質を向上させています。

Inflection3.0はこのプラットフォームの最新バージョンであり、独自のデータセットを使用してモデルを微調整することで、企業向けの専用AIアプリケーションを提供することを目指しています。注目すべきは、Intelが最初の顧客の1社になることであり、Inflectionがこれらのアクセラレーターに対して全額支払うかどうかは疑問視されています。

InflectionはGaudi3アクセラレーター上でサービスを実行する予定ですが、すぐにシステムを構築するわけではありません。以前のInflection2.5と同様に、最新バージョンもIntelのTiber AI Cloudサービス上で稼働します。しかし、Inflectionは一部の顧客がデータをオンプレミスに保持したいと考えていることを認識しており、2025年第1四半期からIntel AIアクセラレーターベースの物理システムを提供する予定です。

Gaudi3アクセラレーターを使用する利点の1つは、Inflectionが価格性能を大幅に向上させたことです。Inflection AIのCEOであるSean White氏はブログで、Intelの技術を使用することで、現在の競合製品と比較して最大2倍の価格性能向上を実現したと述べています。Gaudi3は、トレーニングと推論速度においてもNvidiaのH100よりも高速で、コストも低いとされています。

Gaudi3の技術仕様も非常に強力で、128GBのHBM2eメモリ、最大3.7Tbpsの帯域幅、1,835テラFLOPSの密集型FP8またはBF16性能を備えています。16ビット精度では、Gaudi3の浮動小数点性能はH100のほぼ2倍であり、Inflectionが重視するトレーニングと微調整のワークロードにとって非常に重要です。

さらに、Intelは最近、IBMが自社のクラウドプラットフォームにGaudi3アクセラレーターを導入し、2025年初頭に導入する予定であると発表しました。これは、Gaudi3アクセラレーターが市場で徐々に認知されつつあることを意味します。

要点:

🌟 Inflection AIはNvidia GPUの使用を中止し、IntelのGaudi3アクセラレーターに移行しました。

🚀 Inflection3.0はGaudi3を基盤として、企業向けのカスタムAIアプリケーションを提供します。

💰 Gaudi3を使用することで、Inflection AIは最大2倍の価格性能向上を実現しました。