マスク氏率いるxAI社は、同社のAIモデルGrokに画像認識機能を追加しました。Xプラットフォームの有料ユーザーは、AIアシスタントに画像をアップロードして質問できるようになりました。このアップデートは、xAIの従業員とGrokの公式スポークスパーソンによってXプラットフォーム上で正式に確認されています。

マスク氏はプラットフォーム上でGrokの新しい能力を披露し、画像の内容を理解するだけでなく、画像に含まれるユーモアの要素も解釈できると述べました。しかし、彼は現在この機能はまだ初期段階であり、チームは継続的に改善していくと述べています。

QQ20241029-104045.png

注目すべきは、今年8月に上級ユーザー向けにGrok-2モデルがリリースされて以来、xAIは積極的に機能範囲を拡大していることです。Black Forest LabsのFLUX.1モデルとの連携により、Grokは画像生成能力も備えています。今回のマルチモーダル理解機能の追加は、Xプラットフォームのユーザーエクスペリエンスと開発者向けAPIの更なる改善となります。

image.png

ユーザーからの文書処理に関する要望について、マスク氏は、この機能もすぐに実現すると述べています。彼はxAIチームの開発効率の高さを強調し、「数ヶ月で他社が数年かけて行う作業を完了した」と述べています。

Xプラットフォームのユーザーエンゲージメント向上策の一つとして、今月初めには「レーダー」と呼ばれる新しいツールも導入され、Premium+ユーザーにリアルタイムのトレンド監視と会話分析サービスを提供しています。これらの機能強化は、XプラットフォームがAI技術を通じて製品競争力を継続的に強化していることを示しています。