AutoDAN-Turbo
大規模言語モデルの制限を突破する自動化フレームワーク
一般製品プログラミング自動化脱獄
AutoDAN-Turboは、人的介入なしで自動的に様々な戦略を発見・実行し、大規模言語モデル(LLM)の制限を突破することを目的とした自動化フレームワークです。本フレームワークは、多様な攻撃戦略を自動的に開発し、攻撃成功率を大幅に向上させます。また、既存の人工設計による脱獄戦略を統合できる統一的なフレームワークとしても機能します。AutoDAN-Turboの重要性は、敵対的環境下におけるLLMの安全性と信頼性を向上させ、レッドチーム評価ツールに新たな自動化手法を提供することにあります。
AutoDAN-Turbo 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34