最近、OpenAIが「Operator」というAIツールを間もなくリリースするという情報があります。このツールは、個人用パソコンを制御し、代わりにタスクを実行できる能力を備えています。ソフトウェアエンジニアのTibor Blaho氏がソーシャルメディアでこの情報を明らかにし、このツールに関する最新の情報を発見したと述べています。以前からブルームバーグを始めとする複数のメディアが「Operator」に関する噂を報道しており、コード作成や旅行予約など、複数のタスクを自律的に実行できるとされています。

image.png

Blaho氏によると、OpenAIは2025年1月に「Operator」をリリースする計画です。彼は、OpenAIのChatGPT macOSクライアントに「Operatorの切り替え」と「Operatorの強制終了」のショートカットキーを定義できる隠れたオプションが追加されていることを発見しました。さらに、OpenAIのウェブサイトにも「Operator」に関する情報が掲載されていますが、現時点では非公開です。

Blaho氏はまた、OpenAIのウェブサイトには「Operator」と他のコンピューター使用AIシステムのパフォーマンスを比較した表があり、それらはプレースホルダーの可能性があると述べています。表のデータが正確であれば、「Operator」のパフォーマンスは常に信頼できるわけではなく、実行するタスクに依存することが示唆されています。

image.png

OSWorldのベンチマークテストでは、「OpenAIコンピューター使用エージェント(CUA)」のスコアは38.1%でした。Anthropicのコンピューター制御モデルを上回っていますが、人間の72.4%には遠く及びません。WebVoyagerのテストではOperatorは人間の能力を上回りましたが、WebArenaのテストでは人間の能力を下回りました。クラウドサービスプロバイダーへの登録や仮想マシンの起動などの単純なタスクでは、Operatorの成功率はわずか60%でした。一方、ビットコインウォレットの作成タスクでは、成功率はわずか10%でした。

OpenAIがAIエージェント市場に参入する時期は、AnthropicやGoogleなどの競合他社も同様の技術を開発・リリースしている時期と重なります。AIエージェントはまだ初期段階ですが、市場調査会社Markets and Marketsは、2030年までにAIエージェント市場の価値は471億ドルに達すると予測しています。

現在のAIエージェント技術はまだ発展途上ですが、一部の専門家は潜在的な安全上のリスクを懸念しています。Blaho氏が明らかにしたデータによると、Operatorはいくつかのセキュリティ評価で良好な成績を収めており、「違法行為」の実行や「機密個人データ」の検索を試みるテストに効果的に対応しています。セキュリティテストは、Operatorの開発期間が長くなった理由の一つと考えられています。

OpenAIの共同創設者Wojciech Zaremba氏は、ソーシャルメディアでAnthropicがリリースしたエージェントのセキュリティ対策の不足を批判し、OpenAIが同様の製品をリリースした場合、ネガティブな反響を招く可能性があると述べています。

要点:

🔍 OpenAIが間もなくリリースする「Operator」ツールは、コード作成や旅行予約など、パソコンを自律的に制御してタスクを実行できます。

🛠️ 漏洩情報によると、Operatorは一部のタスクでの成功率が比較的低く、人間の能力を下回ります。

⚠️ Operatorはセキュリティ評価で良好な成績を収めていますが、専門家は潜在的な安全上のリスクを懸念しています。