2025-02-24 11:26:35.AIbase.
OpenAIの社員がxAIに公開で疑問を呈する:Grok 3のベンチマークテスト結果が誤解を招く
2024-12-25 09:22:05.AIbase.
驚異的成果!OpenAIの新モデルo3がARC-AGIベンチマークテストで記録を更新
2024-12-20 16:10:44.AIbase.
智源と騰訊が長テキスト理解ベンチマークモデルLongBench v2を発表
2024-11-01 10:48:10.AIbase.
AI画像生成モデルの新たな寵児!Recraft v3がベンチマークテストでFlux、Ideogramを制しトップに
2024-09-14 15:53:53.AIbase.
マイクロソフト、Windows Agent Arenaを発表。AIアシスタントのWindows環境におけるパフォーマンスをテスト
2024-08-07 16:35:17.AIbase.
北大・通研院、超難基基準LooGLEを発表 長文理解テストで巨大言語モデルは全滅!
2024-06-17 14:58:57.AIbase.
清華大学と北京大学が共同で長尺動画理解ベンチマークテストLVBenchを発表
2023-12-25 10:10:48.AIbase.
グーグル、AIシステムGeminiを発表、AI分野での影響力拡大を目指す
2023-08-09 14:07:10.AIbase.