ja
AI製品ランキング
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
ホーム
AIニュース
AIデイリー
マネタイズガイド
AIチュートリアル
AIツールナビ
AI製品ライブラリ
ja
AI製品ランキング
グローバルAI製品の動向を検索
グローバルAI情報を検索して、AIの新しい機会を発見
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
タイプ :
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
2025-01-16 10:42:26
.
AIbase
.
14.8k
アリババQwenチーム、新型プロセス報酬モデルを発表、数学的推論が進化
アリババのQwenチームは先日、「数学的推論におけるプロセス報酬モデルの開発経験と教訓」と題する論文を発表し、7Bと72Bパラメーターを持つ2つの新しいモデル、Qwen2.5-Math-PRMシリーズを発表しました。これらのモデルは、数学的推論において既存のPRMフレームワークの限界を突破し、革新的な技術によって推論モデルの精度と汎化能力を大幅に向上させました。数学的推論は、特に中間推論ステップにおいて、大規模言語モデル(LLM)にとって大きな課題であり、特に中間推論ステップにおける誤りが...
2024-09-13 08:35:31
.
AIbase
.
11.7k
昆仑万維が新しい巨大言語モデル報酬モデルSkywork-Rewardを発表
昆侖万維科技股份有限公司は先日、同社が開発した2つの新しい報酬モデル、Skywork-Reward-Gemma-2-27BとSkywork-Reward-Llama-3.1-8Bが、国際的に権威のある報酬モデル評価ベンチマークRewardBenchで卓越した性能を示したと発表しました。特にSkywork-Reward-Gemma-2-27Bモデルはトップの座を獲得し、RewardBench公式から高い評価を得ています。
2024-09-03 16:09:28
.
AIbase
.
11.5k
Google DeepMindの新手法GenRM、AI推論能力を大幅向上、精度が劇的に上昇
Google DeepMindチームと大学との共同研究により、生成AIの推論タスクにおける正確性と信頼性を向上させることを目的とした、生成報酬モデル(GenRM)と呼ばれる革新的な手法が開発されました。GenRMは検証プロセスをテキスト生成タスクに統合し、モデルが潜在的な解決策を生成および評価することを同時に可能にし、チェーンオブソースト(CoT)もサポートすることで、検証プロセスの包括性を強化します。従来の手法と比較して、GenRMは複数のテストにおいて顕著な優位性を示し、精度は16%~64%向上しました。特に、