Anthropic、次世代AIベンチマーク開発を支援する新たな取り組みを発表

AIbase

公開日AIニュース · 1 分で読めます · Jul 2, 2024

Anthropicは、自社のClaudeなどの生成モデルを含むAIモデルの性能と影響を評価するための新しいタイプのベンチマーク開発を支援する計画を発表しました。

月曜日に発表されたこの計画では、同社がブログ記事で述べているように、「AIモデルの高度な能力を効果的に測定できる」第三者組織に資金を提供します。関心のある組織は随時応募できます。

Claude2、Anthropic、人工知能、チャットボット

「これらの評価への投資は、AIセキュリティ分野全体の向上を目指し、エコシステム全体に利益をもたらす貴重なツールを提供することを目的としています」とAnthropicは公式ブログで述べています。「安全関連の高品質な評価の開発は依然として困難であり、需要は供給を上回っています。」

これまでにも強調してきたように、AIにはベンチマークの問題があります。現在、AIで最も頻繁に引用されるベンチマークは、一般の人が実際にテスト対象システムを使用する方法をうまく捉えられないことがよくあります。さらに、特に現代の生成AIが登場する前に公開された一部のベンチマークは、時代遅れであるため、測定しようとしている内容を測定できていない可能性すらあります。

Anthropicが提案する非常に高レベルで、やや困難に聞こえる解決策は、新しいツール、インフラストラクチャ、方法を通じて、AIの安全性と社会への影響に重点を置いた、挑戦的なベンチマークを作成することです。

同社は特に、サイバー攻撃の実行、「強化」された大量破壊兵器（核兵器など）、および人々の操作や欺瞞（ディープフェイクや偽情報など）といったタスクの実行能力を評価するテストを呼びかけています。国家安全保障と防衛に関するAIのリスクについては、Anthropicは、リスクを特定および評価するための「早期警戒システム」の開発に尽力していると述べていますが、ブログ記事ではそのシステムの内容については明らかにされていません。

Anthropicはまた、科学研究、多言語コミュニケーション、根深い偏見の軽減、自己検閲による毒性の削減におけるAIの可能性を探る、ベンチマークと「エンドツーエンド」タスクの研究を、この新しい計画で支援する意向であると述べています。

この目標を達成するために、Anthropicは、専門家が独自の評価を開発し、「数千」人のユーザーによる大規模なモデル実験を行うことを可能にする新しいプラットフォームを構想しています。同社は、この計画のために専任のコーディネーターを雇用しており、可能性のあるプロジェクトを購入または拡大する可能性があると述べています。

Anthropicによる新しいAIベンチマークの取り組みは称賛に値します。もちろん、十分な資金と人材による支援が前提となります。しかし、AI競争における同社の商業的な野心を考えると、完全に信頼するのは難しいかもしれません。

Anthropicはまた、この計画が「進歩を促進し、包括的なAI評価が業界標準となる未来を実現するための触媒となる」ことを期待していると述べています。これは、多くのオープンで、企業に属さない取り組みが共有できる使命です。しかし、これらの取り組みが、最終的に株主に忠誠を負うAIベンダーと協力する意思があるかどうかは、まだ分かりません。

要点：
- 📌Anthropicが、AIモデルの性能と影響を評価するための新しいタイプのベンチマークを支援する計画を発表。
- 📌AIの安全性と社会への影響に重点を置いた、挑戦的なベンチマークの作成を目指す。
- 📌Anthropicは、この計画が「進歩を促進し、包括的なAI評価が業界標準となる未来を実現するための触媒となる」ことを期待。

Figma、AI革命を起こす：インテリジェントなアプリビルダーとウェブサイト作成ツールを開発

最近、デザイン業界の巨人であるFigmaは、人工知能分野に密かに進出しており、画期的なAIアプリケーションビルダーを発売する計画を発表しました。同時に、Figma Sitesと呼ばれるウェブサイト作成ツールも開発中です。このニュースは、著名なセキュリティ研究者であるJane Manchun Wong氏によって最初に公開され、業界で大きな注目を集めています。AIアプリケーションビルダー：デザインと開発のインテリジェントな融合。このツールは、テキストプロンプト、Figmaデザインファイルなど、さまざまな入力形式を受け入れることができることがわかっています。

Blender-MCPオープンソースリリース！ClaudeとBlenderのシームレスな統合で、自然言語による3D創作を実現

この度、Blender-MCP（Model Context Protocol）が正式にオープンソースとしてリリースされました。AnthropicのClaude AIとBlenderをシームレスに統合することで、自然言語のプロンプトを用いて複雑な3Dシーンを作成するという画期的な成果を実現しました。AIbaseが知る限り、このツールを使えば、テキストによる記述だけで精巧な3Dモデルを生成できます。例えば、「低ポリゴンのドラゴンが宝を守る」といったシーンも簡単に作成でき、3Dモデリングの技術的ハードルを大幅に下げます。Blender-MCP

FastAPI-MCPリリース：ゼロコンフィグでFastAPIアプリをMCPサーバーに変換

最近、オープンソースコミュニティで強力なツール「FastAPI-MCP」が登場しました。このほぼゼロコンフィグのツールは、FastAPIアプリケーションのインターフェースをModel Context Protocol（MCP）ツールに自動的に変換し、AIモデルとバックエンドサービスのシームレスな相互運用のための新しい道を切り開きます。AIbaseの情報によると、FastAPI-MCPはシンプルで使いやすく、柔軟性が高いことから開発者の間で話題となり、AI駆動の自動化シーンで広く利用されています。プロジェクトは現在オープンソースとして公開されており、ソースコードも公開されています。

Anthropic、Claude AI音声アシスタントをリリースしChatGPTに対抗へ

ブルームバーグの報道によると、人工知能企業Anthropicは、チャットボットClaudeの新たな機能である音声アシスタントを開発中で、今月中にも正式リリース予定とのことです。この新機能により、Claude AIはOpenAIのChatGPTと対抗し、ユーザーとAIのインタラクション体験を豊かにします。OpenAIが同様の機能をリリースしてから約1年が経過しており、Claudeの音声モードは市場ニーズへのタイムリーな対応と言えるでしょう。

OpenAIがContext.aiチームを買収 AIモデル評価技術の向上を目指す

この度、テクノロジー大手OpenAIは新興企業Context.aiチームの買収を発表しました。この買収は、同社のAIモデルの評価と分析能力を向上させることを目的としています。Context.aiは2023年に設立され、元Google社員のHenry Scott-Green氏とAlex Gamble氏が共同で創業しました。開発者向けにAIモデルのパフォーマンスに関する詳細な分析と視覚化ツールを提供することに注力しています。この動きは、OpenAIがAI技術の向上に尽力していることを示しています。

Anthropic、Claudeの新しいリサーチ機能を発表、ユーザーの情報の取得体験を向上

近年、人工知能スタートアップ企業のAnthropicは、Claudeモデルの新しい機能である「リサーチ」機能を発表しました。この機能は、社内および社外のオンラインリソースを含む複数の情報源から検索を行い、包括的な回答を提供します。Anthropicはブログで、「このアプローチにより、検証しやすい参照情報付きの包括的な回答が提供され、ユーザーはClaudeの発見を信頼できます」と述べています。さらに、この機能はユーザーの問い合わせを多角的に検証します。

Anthropic、音声AIアシスタントClaudeを発表へ　3種類の音声モードを提供

ブルームバーグの報道によると、人工知能企業Anthropicは、AIチャットボットClaudeに統合される新しい音声AIアシスタントのリリースを準備中で、今月中にも正式発表される見込みです。この新機能により、ユーザーは音声でClaudeと対話することが可能になり、人間と機械のコミュニケーションの利便性と自然さが向上します。Anthropicは、Airy、Mellow、Buttという3種類の異なる英語音声モードを導入する計画です。

ClaudeがGoogle Workspaceと統合！AIチャットボットがGmail、カレンダー、ドキュメントに直接接続

Anthropicは火曜日に、AIチャットボットのClaudeがGoogle Workspaceと統合されたと発表しました。ユーザーはClaudeを使用して、Gmailのメール、Googleカレンダーの予定されているイベント、Googleドキュメントのドキュメントを直接検索および参照できるようになりました。ClaudeがGoogleエコシステムに初めて深く接続されたこの統合機能は、ベータ版としてAnthr向けに最初に提供されます。