アマゾンは月曜日に、ウェブブラウザを制御し、簡単な操作を独立して実行できる汎用AIエージェント「Nova Act」を発表しました。同時に、開発者がNova Actを使用してエージェントのプロトタイプを構築できるNova Act SDKも発表されました。

Nova Actは、アマゾンがサンフランシスコに新設したAGIラボで開発され、同社の近日発表予定のAlexa+(アマゾンの音声アシスタントの生成AI強化版)にも重要な機能を提供します。ただし、現在公開されているNova Actのバージョンは「研究プレビュー版」として位置付けられており、開発者はnova.amazon.comでNova Actツールキットにアクセスできます。

AWS、アマゾン、クラウドサービス、Amazon、クラウドコンピューティング、サーバー

この製品は、OpenAIのOperatorやAnthropicのComputer Useと競合するアマゾンの明確な取り組みです。多くのテクノロジー大手は、ユーザーがウェブをナビゲートできるAIエージェントが、現在のAIチャットボットの実用性を大幅に向上させると考えています。アマゾンが業界の先駆者ではないものの、Alexa+を通じて、その普及範囲は最も広範なものになる可能性があります。

アマゾンによると、開発者はNova Act SDKを使用して、オンラインでの食事の注文や予約などの基本的な操作をユーザーに代わって自動化できます。このツールキットは、複数の機能を統合し、AIエージェントがウェブページを閲覧したり、フォームに入力したり、カレンダーで日付を選択したりすることを可能にします。

アマゾンは、Nova Actが内部テストで競合他社を上回ったと主張しています。ScreenSpot Web Text評価において、Nova Actは94点で、OpenAIのCUA(88%)やAnthropicのClaude3.7Sonnet(90%)を上回りました。ただし、アマゾンは、WebVoyagerなどのより一般的なエージェント評価でNova Actのベンチマークテストを実施していません。

Nova Actは、元OpenAI研究員のDavid Luan氏とPieter Abbeel氏が共同で率いるAGIラボの最初の公開製品です。両氏はそれぞれAIスタートアップ企業を設立しています。Luan氏はAdeptを、Abbeel氏はCovariant(昨年アマゾンに買収)を共同設立し、昨年アマゾンに招聘され、AIエージェントの開発をリードしています。

Luan氏はTechCrunchに対し、エージェントは超知能AIシステムを作成するための重要なステップであり、AGIを「コンピューター上で人間が行うあらゆる作業を支援できるAIシステム」と定義していると述べています。彼は、チームがNova Act SDKを設計した目的は、短いタスクを確実に自動化し、開発者がワークフローに人手を介入させる必要がある時点を正確に定義できるようにすることだと述べています。

初期のAIエージェントが直面する主な課題は、分野を横断した信頼性です。テストでは、既存のシステムは一般的に速度が遅く、長時間独立して動作することが難しく、人間が犯さないようなミスを犯しやすいことが示されています。アマゾンがこれらの制限を打破したのか、それとも競合他社を悩ませているのと同じ問題を抱えているのか、市場はすぐに分かるでしょう。