Anthropicは本日、Claude 3.5シリーズの最初の製品であるClaude 3.5 Sonnetを発表しました。このモデルは、複数の評価において競合製品やその前身であるClaude 3 Opusを上回り、中規模モデルと同等の速度とコストを維持しながら、業界の新しい基準を確立しています。
Claude 3.5 Sonnetは、Claude.aiとClaude iOSアプリで一般公開され、Anthropic API、Amazon Bedrock、Google CloudのVertex AIを通じて商用サービスとして提供されています。このモデルは、入力トークン100万トークンあたり3ドル、出力トークン100万トークンあたり15ドルの料金で、200Kトークンのコンテキストウィンドウを備えています。
大幅に強化された性能
Claude 3.5 Sonnetは、大学院レベルの推論、学部レベルの知識、コーディング能力などで、新たな業界基準を打ち立てています。微妙なニュアンス、ユーモア、複雑な指示の理解において著しい進歩を遂げ、自然で親しみやすい口調で高品質なコンテンツを作成できます。
注目すべきは、Claude 3.5 Sonnetの動作速度がClaude 3 Opusの2倍であることです。内部エージェントコーディング評価では、Claude 3.5 Sonnetは問題の64%を解決し、Claude 3 Opusの38%を大きく上回りました。このため、コンテキスト関連の顧客サポートや複数ステップのワークフロー調整などの複雑なタスクの処理に特に適しています。
大幅に向上した視覚能力
Claude 3.5 Sonnetは、視覚処理においても大きな進歩を遂げ、標準的な視覚ベンチマークテストでClaude 3 Opusを上回りました。視覚的推論を必要とするグラフや図表の解釈などのタスクで特に優れた性能を発揮し、不完全な画像からのテキスト転写も正確に行うことができます。これは、小売、物流、金融サービスなどの業界にとって重要な意味を持ちます。
新機能:Artifacts
Anthropicは同時に、Claude.aiでArtifacts機能を発表し、ユーザーとClaudeのインタラクション方法を拡張しました。ユーザーは、コードスニペット、テキストドキュメント、ウェブサイトデザインなどをClaudeに生成するように要求できます。これらのコンテンツは、専用のウィンドウで会話と共に表示され、動的なワークスペースが作成されます。
安全とプライバシーへの取り組み
Claude 3.5 Sonnetの知能レベルが飛躍的に向上したにもかかわらず、Anthropicは依然としてASL-2の安全レベルを維持していると述べています。同社は、英国人工知能安全研究所(UK AISI)を含む外部の専門家と協力して、モデルの厳格な安全テストを実施しました。Anthropicは、ユーザーが明示的に許可しない限り、ユーザーが提出したデータは生成モデルのトレーニングに使用しないと強調しています。
今後の展望
Anthropicは、今年後半にClaude 3.5 HaikuとClaude 3.5 Opusをリリースし、Claude 3.5シリーズを完成させる予定です。同社は、企業アプリケーションとの統合やパーソナライズされたメモリ機能など、より多くの企業ユースケースをサポートするための新しいモデルと機能の開発にも取り組んでいます。
Anthropicは、ユーザーが製品内で直接フィードバックを送信し、Claude 3.5 Sonnetの改善と将来の開発の方向性を示すよう求めています。