AI製品ランキング

AI製品ランキング

グローバルAI製品の動向を検索

グローバルAI情報を検索して、AIの新しい機会を発見

ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル

タイプ :

ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル

2025-03-14 10:07:07.AIbase

360智脳チーム、Deepseek強化学習効果の再現に成功、オープンソースモデルLight-R1-14B-DSを発表

先日、360智脳チームはDeepseekの強化学習効果の再現に成功し、オープンソースの推論モデルLight-R1-14B-DSを正式に発表しました。このモデルは、DeepSeek-R1-Distill-Llama-70BおよびDeepSeek-R1-Distill-Qwen-32Bを上回る性能を示し、14Bパラメーター規模で強化学習効果を実現した業界初のモデルとなりました。数学的推論能力が大幅に向上し、多くの32B級モデルを上回る成果を達成しています。

360智脳チーム、Deepseek強化学習効果の再現に成功、オープンソースモデルLight-R1-14B-DSを発表

2025-01-16 10:42:26.AIbase

アリババQwenチーム、新型プロセス報酬モデルを発表、数学的推論が進化

アリババのQwenチームは先日、「数学的推論におけるプロセス報酬モデルの開発経験と教訓」と題する論文を発表し、7Bと72Bパラメーターを持つ2つの新しいモデル、Qwen2.5-Math-PRMシリーズを発表しました。これらのモデルは、数学的推論において既存のPRMフレームワークの限界を突破し、革新的な技術によって推論モデルの精度と汎化能力を大幅に向上させました。数学的推論は、特に中間推論ステップにおいて、大規模言語モデル（LLM）にとって大きな課題であり、特に中間推論ステップにおける誤りが...

アリババQwenチーム、新型プロセス報酬モデルを発表、数学的推論が進化

2024-12-15 10:23:35.AIbase

アリババ、AIベンチマーク「PROCESSBENCH」を発表、数学的推論における誤り認識能力を評価

先日、アリババのQwenチームの研究者らが、「PROCESSBENCH」という新しいベンチマークを発表しました。これは、言語モデルが数学的推論における過程の誤りを識別する能力を測定することを目的としています。言語モデルが複雑な推論タスクで顕著な進歩を遂げる中、研究者らは、モデルは優れたパフォーマンスを示すものの、一部の難しい問題では依然として課題に直面していることを発見しました。そのため、効果的な監督方法の開発が非常に重要になります。現在、言語モデルの評価ベンチマークにはいくつかの欠点があります。一つは…

アリババ、AIベンチマーク「PROCESSBENCH」を発表、数学的推論における誤り認識能力を評価

2024-11-29 09:47:51.AIbase

衝撃！Epoch AIが数学の新基準FrontierMathを発表、トップAIモデルの正解率は2％以下

人工知能の広大な宇宙において、数学はこれまで機械知能の最後の砦とされてきました。今、FrontierMathという全く新しいベンチマークが登場し、AIの数学的推論能力をかつてないレベルに引き上げています。Epoch AIは60名以上の数学界のトップレベルの専門家と協力して、数学オリンピックさながらのAIチャレンジフィールドを構築しました。これは単なる技術テストではなく、人工知能の数学的知性の究極の試金石です。世界最高の数学者たちが集う研究所を想像してみてください。彼らは綿密に設計された数…

衝撃！Epoch AIが数学の新基準FrontierMathを発表、トップAIモデルの正解率は2％以下

2024-10-14 14:51:30.AIbase

アップル研究チーム、新たなベンチマークGSM-Symbolicを発表：大規模言語モデルの数学的推論能力の欠点を明らかに！

最近、アップルの研究者らは大規模言語モデル（LLM）の数学的推論能力に関する詳細な研究を行い、GSM-Symbolicという新たなベンチマークテストを発表しました。この新たなベンチマークテストは、主に基本的な数学的能力を評価するために用いられるGSM8Kを基に開発されました。多くのLLMがGSM8Kにおいて性能向上を見せているものの、これらのモデルの推論能力については依然として疑問が残っており、既存の評価指標では真の能力を完全に反映できていない可能性があると科学界では考えられています。研究は…

アップル研究チーム、新たなベンチマークGSM-Symbolicを発表：大規模言語モデルの数学的推論能力の欠点を明らかに！

2024-10-12 14:59:01.AIbase

アップルのAI研究チーム、大規模言語モデルの推論における弱点発見　簡潔な指摘でOpenAIのモデルを凌駕

人工知能の世界において、機械学習モデル、特に大規模言語モデル（LLM）の推論能力は、科学者たちの関心の的となっています。最近、アップルのAI研究チームは「大規模言語モデルにおける数学的推論の限界に関する理解」と題する論文を発表し、これらのモデルが論理的問題を処理する際の限界を明らかにしました。論文では、研究者たちは簡単な数学の問題を用いてこの点を示しています。まず、オリバーがキーウィフルーツを摘む問題を提示しています。以下に示す通りです。オリバーは金曜日に44個…

アップルのAI研究チーム、大規模言語モデルの推論における弱点発見　簡潔な指摘でOpenAIのモデルを凌駕