Anthropic、次世代AIモデルClaude 3.5 Sonnetを発表 GPT-4を上回る性能

AIbase

公開日AIニュース · 1 分で読めます · Jun 21, 2024

214

Anthropicは本日、Claude 3.5シリーズの最初の製品であるClaude 3.5 Sonnetを発表しました。このモデルは、複数の評価において競合製品やその前身であるClaude 3 Opusを上回り、中規模モデルと同等の速度とコストを維持しながら、業界の新しい基準を確立しています。

Claude 3.5 Sonnetは、Claude.aiとClaude iOSアプリで一般公開され、Anthropic API、Amazon Bedrock、Google CloudのVertex AIを通じて商用サービスとして提供されています。このモデルは、入力トークン100万トークンあたり3ドル、出力トークン100万トークンあたり15ドルの料金で、200Kトークンのコンテキストウィンドウを備えています。

大幅に強化された性能

Claude 3.5 Sonnetは、大学院レベルの推論、学部レベルの知識、コーディング能力などで、新たな業界基準を打ち立てています。微妙なニュアンス、ユーモア、複雑な指示の理解において著しい進歩を遂げ、自然で親しみやすい口調で高品質なコンテンツを作成できます。

注目すべきは、Claude 3.5 Sonnetの動作速度がClaude 3 Opusの2倍であることです。内部エージェントコーディング評価では、Claude 3.5 Sonnetは問題の64％を解決し、Claude 3 Opusの38％を大きく上回りました。このため、コンテキスト関連の顧客サポートや複数ステップのワークフロー調整などの複雑なタスクの処理に特に適しています。

大幅に向上した視覚能力

Claude 3.5 Sonnetは、視覚処理においても大きな進歩を遂げ、標準的な視覚ベンチマークテストでClaude 3 Opusを上回りました。視覚的推論を必要とするグラフや図表の解釈などのタスクで特に優れた性能を発揮し、不完全な画像からのテキスト転写も正確に行うことができます。これは、小売、物流、金融サービスなどの業界にとって重要な意味を持ちます。

新機能：Artifacts

Anthropicは同時に、Claude.aiでArtifacts機能を発表し、ユーザーとClaudeのインタラクション方法を拡張しました。ユーザーは、コードスニペット、テキストドキュメント、ウェブサイトデザインなどをClaudeに生成するように要求できます。これらのコンテンツは、専用のウィンドウで会話と共に表示され、動的なワークスペースが作成されます。

安全とプライバシーへの取り組み

Claude 3.5 Sonnetの知能レベルが飛躍的に向上したにもかかわらず、Anthropicは依然としてASL-2の安全レベルを維持していると述べています。同社は、英国人工知能安全研究所（UK AISI）を含む外部の専門家と協力して、モデルの厳格な安全テストを実施しました。Anthropicは、ユーザーが明示的に許可しない限り、ユーザーが提出したデータは生成モデルのトレーニングに使用しないと強調しています。

今後の展望

Anthropicは、今年後半にClaude 3.5 HaikuとClaude 3.5 Opusをリリースし、Claude 3.5シリーズを完成させる予定です。同社は、企業アプリケーションとの統合やパーソナライズされたメモリ機能など、より多くの企業ユースケースをサポートするための新しいモデルと機能の開発にも取り組んでいます。

Anthropicは、ユーザーが製品内で直接フィードバックを送信し、Claude 3.5 Sonnetの改善と将来の開発の方向性を示すよう求めています。

アップルのAIニュース要約機能が虚偽情報拡散で物議を醸す

アップル社が最近発表したAIニュース要約機能が、速報ニュースの要約において重大な誤りを繰り返し、ユーザーに大量の虚偽情報が伝わる事態を引き起こしている。この機能の発表以来、多くの報道機関やユーザーから、アップルの技術が未成熟であり、正確な情報を効果的に提供できないとして強い反発を受けている。ワシントンポスト紙のテクノロジーコラムニスト、ジェフリー・ファウラー氏がソーシャルメディアで、アップルのAIがニュース要約において事実を歪めたと投稿したと報じられている。

元Twitter幹部が開発したAIニュースアシスタントParticle：AIでニュース閲覧体験を刷新、1530万ドルの資金調達

現在のメディア業界がAIに対して慎重な姿勢をとる中、ParticleというAIニュース閲覧アプリがその状況を変えようとしています。元Twitterのエンジニアが開発したこのアプリは、ユーザーがニュースをより深く理解するのを支援するとともに、従来のメディア機関とのウィンウィン関係を模索しています。Particleは、元Twitterプロダクトマネジメント上級ディレクターのSara Beykpour氏と、元Twitterおよびテスラの上級エンジニアであるMarcel Molina氏によって共同設立されました。同社は、

日本のスーパー、AIで従業員の笑顔を監視　ネット上で「大げさだ」と批判の声

日本のイオン系のスーパーマーケットが、AIシステム「Smile-Kun」を使って従業員の笑顔を監視していることが明らかになった。従業員の笑顔や声の分析を通じて接客スキル向上を目指しているという。システムは特定のあいさつ方法を要求し、450個の微表情のポイントで100点満点で採点、リアルタイムでフィードバックする。さらに、音量や滑らかさ、トーンについても分析し、改善点を提案する。従業員の反応では笑顔の割合が大幅に増加したという。しかし、この取り組みは物議を醸しており、一部のネットユーザーからは従業員の個性や感情を過度に数値化しており、真心のこもったサービスとは程遠いとの批判が出ている。批判意見では、上下関係や

マイクロソフト研究所、AIフレームワークE5-Vを発表：テキストペアの単一モーダル学習でマルチモーダル学習を簡素化、コスト削減

マイクロソフト研究所と北京航空航天大学の研究チームは、マルチモーダル大規模言語モデル（MLM）開発における課題解決を目指し、高効率なマルチモーダル埋め込みフレームワークE5-Vを発表しました。この革新的なフレームワークは、単一モーダル学習によってマルチモーダル学習プロセスを簡素化し、従来のモデルに見られた独立したエンコーダーへの依存と、それに伴う入力統合の非効率性を克服します。E5-Vはテキストと画像情報を統合することでトレーニングコストを削減し、テキスト-画像検索、画像検索など、複数の複雑なタスクにおいて優れた性能を示しました。特にゼロショット学習において…

AIニュース