清華大学チームが主導、初のAIエージェントの体系的ベンチマークテストが登場

学生头条

公開日AIニュース · 1 分で読めます · Aug 9, 2023

AIエージェントシステムのベンチマークテスト結果

清華大学などの研究チームが、AIエージェントの包括的なベンチマークテストであるAgentBenchを発表し、25種類の異なる言語モデルを包括的に評価しました。

研究結果によると、GPT-4は複雑な環境下で優れた性能を示し、最先端の商用言語モデルはオープンソースモデルに比べて顕著な優位性を有することが明らかになりました。

研究チームは、オープンソースモデルの学習能力の更なる向上を推奨しています。

Manus創業者季逸超氏：Manus製品は阿里ババの千問大規模言語モデルに基づき開発

中国のスタートアップ企業Monicaが発表したAIエージェント製品Manusが、Xプラットフォームで最近話題になっています。その創業者である季逸超（Ji Yichao）氏は本日、ソーシャルメディアを通じて製品の技術詳細をさらに明らかにしました。季氏によると、Manusは阿里巴巴の千問(Qwen)大規模言語モデルに基づいて開発されており、複数の微調整モデルを用いて独自の機能を実現しています。この発表は、Manusの技術ソースに関する議論を引き起こしただけでなく、世界中のAIコミュニティにおけるその潜在力への関心をさらに高めています。季氏

AI搭載ブラウザ？オープンソースツールBrowser Useがテック界を席巻　開発者「YYDS！」と絶賛！

最近、テック界と開発者コミュニティは、Browser Useというオープンソースプロジェクトで沸騰しています！このツールは、まるでAIに羽が生えたかのよう。人間のように自由にブラウザを操作し、自然言語でAIに様々なウェブタスクを自動実行させることができます。その強力な自動化能力と柔軟な展開方法は、瞬く間に世界中のテクノロジー愛好家の心を掴み、X（旧Twitter）では大きな話題を呼んでいます。Browser Useは、まさに燎原の火のごとく、AIによるブラウザ自動化分野を牽引しています。

Manus公式Xアカウントの凍結解除、クールなユースケースの共有を継続

中国の新興企業Monicaが開発した汎用AIエージェントManus AIは、短期間のソーシャルメディア危機の後、正常な運用を再開しました。世界初の自律型AIエージェントと位置付けられているこの製品は、ウェブサイトの作成、株式市場トレンドの分析、旅行行程の計画など、複雑な現実世界のタスクを処理でき、2025年初頭の業界におけるパフォーマンスは中国AIの誇りとメディアから称賛され、DeepSeekなどのモデルと並んで挙げられました。3月7日、Manus AIの公式Xアカウントが突然停止されました。その原因は、サードパーティとの言及に関連している可能性が高いとされています。

海外メディア：Manusは中国の第二のDeepSeekモーメントではない可能性

最近、Manusという中国のAIエージェントプラットフォームがオンラインで大きな注目を集めています。先週プレビュー版がリリースされて以来、急速に多くのユーザーを獲得しており、Hugging Faceのプロダクト責任者は「私が見た中で最も印象的なAIツール」と評しています。同時に、AI政策研究者のDean Ball氏も、Manusは「最も複雑なコンピューターAI」だと述べています。Manusの公式Discordサーバーはわずか数日で会員数を増やし…

AIニュース