zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-11-15 09:55:02
.
AIbase
.
13.3k
谷歌Gemini Exp 1114横空出世!首战碾压GPT-4,多项能力评测登顶引业界震动
谷歌DeepMind最新推出的Gemini实验版本(Exp1114)在Chatbot Arena平台上取得了令人瞩目的成绩。经过一周多的社区测试,累计超过6000票的数据显示,这款新模型以显著优势超越竞品,在多个关键领域展现出惊人实力。在总体评分上,Gemini-Exp-1114以超出40分的优异成绩与GPT-4-latest并列第一,超越了此前领先的GPT-4-preview版本。更令人惊叹的是,该模型在数学、复杂提示和创意写作等核心领域全面登顶,展现出极强的综合实力。具体来看,Gemini-Exp-1114的进步令人印象深刻:在总排名中从第3名一举跃升至
2024-09-20 10:40:49
.
AIbase
.
11.9k
OpenAI 的新 AI 模型 o1-preview 和 o1-mini 在聊天机器人排名中取得最高分
OpenAI 的新系统在最近的评估中取得了出色的成绩,夺得了聊天机器人排名的第一名。但是,由于评分数量较低,这可能会扭曲评估结果。根据发布的概述,这些新系统在所有评估类别中都表现出色,包括整体性能、安全性和技术能力。其中一款专门用于STEM任务的系统与9月初发布的GPT-4o版本一起短暂排名第二,并在技术领域占据领先地位。Chatbot Arena是一个用于比较不同系统的平台,使用超过6,000个社区评分对新系统进行了评估。结果表明,这些新系统在数学任务、复杂提示和编程方面表