OpenAIは、最新のAIエージェント「Operator」を発表しました。このツールは、ユーザーがオンラインで様々なタスクを実行するのを支援することを目的としています。OpenAIのブログによると、Operatorは現在「リサーチプレビュー」段階にあり、まずはアメリカのChatGPT Proサブスクライバー(月額200ドル)を対象としています。
Operatorは、「コンピューター使用エージェント」と呼ばれるモデルを採用しており、GPT-4oのビジュアル能力と強化学習による高度な推論を組み合わせることで、グラフィカルユーザーインターフェース(GUI)と対話できます。OpenAIの説明によると、Operatorは内蔵ブラウザでウェブページを表示し、入力、クリック、スクロールなどの方法でページとやり取りできます。この技術の利点は、カスタムAPI統合を必要とせずに、ウェブ上で自律的に行動できることです。
使用中、Operatorは推論能力を利用して「自己修正」を行うだけでなく、困難に遭遇した場合はユーザーに制御を返します。ウェブサイトがログイン情報などの機密情報を要求する場合、Operatorはユーザーに操作を引き継ぐかどうかを尋ねます。さらに、メールの送信などの処理を行う際にも、ユーザーの確認を求めます。OpenAIは、Operatorは安全性を特に重視して設計されており、有害な要求を拒否し、許可されていないコンテンツをブロックすることを目指していると強調しています。
OpenAIはまた、OperatorがDoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uberなど、複数の有名企業と連携して、現実世界のニーズを満たし、確立された業界標準に従っていることを明らかにしました。ただし、OpenAIは、現在このツールは、スライドの作成やカレンダーの管理など、複雑なインターフェースの処理に苦労する可能性があると警告しています。
OpenAIは、OperatorをPlus、Team、Enterpriseユーザーに拡大し、これらの機能をChatGPTに統合する計画です。これは、より多くのユーザーが、この最先端技術がもたらす利便性を体験できるようになることを意味します。
公式ブログ:https://openai.com/index/introducing-operator/
要点:
🌐 OpenAIが「Operator」AIエージェントを発表。ユーザーがオンラインタスクを実行するのを支援し、まずはChatGPT Proユーザー向け。
🖱️ Operatorはブラウザを通じてウェブとインタラクトし、自己修正とユーザー制御機能を備え、安全性を確保。
🤝 OpenAIは複数の有名企業と連携し、現実世界のニーズへの対応を目指し、将来的にはより多くのユーザーへの展開を計画。