2024-12-05 14:45:53.AIbase.
字节开源全新代码大模型评估基准“FullStack Bench”
2024-09-29 15:33:05.AIbase.
Salesforce AI 推全新大语言模型评估家族SFR-Judge 基于Llama3构建
2024-08-07 14:14:43.AIbase.
Meta推“自学评估器”: 无需人工注释NLP模型评估,优于 GPT-4 等常用的LLM
2024-03-07 03:52:56.AIbase.
人工智能模型评估公司指出GPT-4侵权问题严重 微软工程师担忧图像生成功能
2023-11-30 09:52:30.AIbase.
亚马逊AWS推出人类基准测试团队,改进人工智能模型评估
2023-08-18 10:04:45.AIbase.