Patronus AI、AIハルシネーションの呪縛を解く初のセルフサービスAI検出APIを発表

人工知能の急速な発展に伴い、AIによる「幻覚」現象がますます頻繁に発生し、多くの企業に大きな悩みの種となっています。顧客サービス用チャットボットが実際には存在しない製品を自信満々に説明したり、金融AIが市場データをでっち上げたり、医療用ロボットが危険な医療アドバイスを提供したりするといった問題です。これらの問題はもはや単なる面白い話ではなく、企業の評判と利益に影響を与える重大なリスクとなっています。

この課題に対処するため、サンフランシスコに拠点を置くスタートアップ企業Patronus AIは、AIシステムの故障をリアルタイムで検知し、防止することを目的とした、世界初のセルフサービスプラットフォームを発表しました。このプラットフォームはAIシステムの「スペルチェッカー」のようなもので、問題が発生する前にそれを捕捉することができます。

Patronus AIの最高経営責任者（CEO）であるAnand Kannappan氏はインタビューで、多くの企業が本番環境でAIの故障に直面しており、その問題には幻覚、セキュリティの脆弱性、予測不可能な動作などが含まれると述べています。同社の調査によると、GPT-4などの主要なAIモデルは、プロンプトに対して44％の確率で著作権で保護されたコンテンツを繰り返す可能性があり、高度なモデルであっても、基本的なセキュリティテストで20％以上の確率で安全でない応答を生成する可能性があります。

企業がAIシステムの安全性を向上させるために、Patronus AIは一連の革新的な機能を提供しています。その中で最も注目すべき「評価者」機能は、企業が簡単な英語でカスタマイズされた評価ルールを作成することを可能にします。この柔軟性により、金融サービス企業であればコンプライアンスに、医療機関であれば患者のプライバシーと医療の正確性に焦点を当てるなど、あらゆる業界の企業がそれぞれのニーズに合わせて調整できます。

プラットフォームの中核は、Lynxという画期的な幻覚検出モデルであり、医療上の不正確さの識別においてGPT-4よりも8.3％高い精度を誇ります。さらに、このプラットフォームには、リアルタイム監視と詳細な分析の2つの運用モードがあります。従来のエラーチェックに加えて、CopyrightCatcher（著作権検出ツール）やFinanceBench（金融パフォーマンス評価基準）などの専用ツールも開発されており、企業に包括的なAI故障保護を提供しています。

より多くの企業がこれらのセキュリティツールを利用できるようにするため、Patronus AIは従量課金制の価格モデルを採用しており、価格はAPIコール1000回につき10ドルからとなっています。HP、AngelList、Pearsonなどの大企業が既に早期導入者となっており、AIセキュリティへの投資の重要性を示しています。

AIが急速に発展している現代において、Patronus AIのようなプラットフォームは、企業のリスク軽減に役立つだけでなく、間近に迫る法的規制への準拠にも役立ちます。AIシステムが進化し続ける中、これらの「幻覚」を正確に捉え、修正する方法が、企業が直面する重要な課題となるでしょう。

製品入口:https://www.patronus.ai/

要点:
🌟 Patronus AIは、AIの幻覚現象をリアルタイムで検知し、予防することを目的とした世界初のセルフサービスAPIを発表しました。
🛡️ このプラットフォームでは、企業が簡単な英語でカスタム評価ルールを作成でき、柔軟なソリューションを提供します。
💰 従量課金制を採用することで、より多くの企業がAIセキュリティツールを利用できるようになりました。

AIニュース

Patronus AI、AIハルシネーションの呪縛を解く初のセルフサービスAI検出APIを発表

AIbase基地