SFR-Judge
加速模型评估和微调的智能评估工具
普通产品生产力评估工具模型微调
SFR-Judge 是 Salesforce AI Research 推出的一系列评估模型,旨在通过人工智能技术加速大型语言模型(LLMs)的评估和微调过程。这些模型能够执行多种评估任务,包括成对比较、单项评分和二元分类,同时提供解释,避免黑箱问题。SFR-Judge 在多个基准测试中表现优异,证明了其在评估模型输出和指导微调方面的有效性。
SFR-Judge 最新流量情况
月总访问量
8724
跳出率
53.42%
平均页面访问数
1.4
平均访问时长
00:02:06
SFR-Judge 访问量趋势
SFR-Judge 访问地理位置分布
暂无地理位置分布数据