近日,作者选取了2023年上半年教师资格证考试的真题,测试了科大讯飞的讯飞星火、百度的文心一言和阿里的通义千问三款国产大模型的作答能力。结果显示,这三个大模型在学科常识、逻辑推理等方面的表现较好,但在考查法规条例和综合素质的题目上,答题质量参差不齐,尤其是涉及到开放式问答时,表现仍然不太理想。其中,文心一言的回答较为规范,显示出了一定的答题技巧。总体来说,大模型或可用于教师资格考试的准备,但仍需要人工进行二次审核。大模型能否替代教师职业素质方面的考核,还有待观察。
近日,作者选取了2023年上半年教师资格证考试的真题,测试了科大讯飞的讯飞星火、百度的文心一言和阿里的通义千问三款国产大模型的作答能力。结果显示,这三个大模型在学科常识、逻辑推理等方面的表现较好,但在考查法规条例和综合素质的题目上,答题质量参差不齐,尤其是涉及到开放式问答时,表现仍然不太理想。其中,文心一言的回答较为规范,显示出了一定的答题技巧。总体来说,大模型或可用于教师资格考试的准备,但仍需要人工进行二次审核。大模型能否替代教师职业素质方面的考核,还有待观察。
近日,国内知名医疗大模型评测平台 MedBench 公布了最新榜单,其中,蚂蚁医疗团队研发的蚂蚁医疗大模型凭借卓越表现,一举夺得了评测榜单和自测榜单的双料冠军,分别以97.5和98.2的高分引发了业界的广泛关注。蚂蚁医疗大模型的成功离不开其团队在医疗推理模型研发上的不断努力。该团队近期采用了基于强化学习的技术,打造了新一代的医疗推理模型。这一创新使得该模型不仅具备了较强的 “医学思维” 推理能力,还能实现多模态交互,支持图像、文本、音频和视频等多种形式的输
今日,豆包大模型团队正式发布文生图技术报告,首次公开Seedream2.0图像生成模型的技术细节,涵盖数据构建、预训练框架、后训练RLHF全流程,在文生图领域投下一颗“重磅炸弹”。Seedream2.0自2024年12月初在豆包APP和即梦上线后,已服务上亿C端用户,深受专业设计师青睐。与Ideogram2.0、Midjourney V6.1等主流模型相比,它解决了文本渲染不佳、对中国文化理解不足等问题,在中英文双语理解、美感和指令遵循等方面实现全面提升。通过Bench-240评测基准测试,其英文提示词生成内容的结构合理性
超聚变公司与视联动力联合推出了一款名为 FusionOne 的 AI 政法大模型一体机,旨在为政法单位提供更加高效和安全的办公解决方案。这款一体机通过集成 DeepSeek 技术,支持快速部署和操作,大大简化了用户的使用过程。FusionOne AI 政法大模型一体机的推出,标志着超聚变在智能政法领域的重要一步。该设备的设计理念是通过将推理引擎、模型、应用及加速算子进行一站式打包,用户在收到设备后,无需经过复杂的部署、配置和模型调优,就可以迅速投入使用。这一特点尤其适合需要快速响
在人工智能快速发展的背景下,AI 大模型的研究与应用正处于热潮之中。最近,多家企业和机构在这一领域的最新动态引发了广泛关注。首先,英伟达的市盈率在 ChatGPT 问世前的表现引起了华尔街的高度关注,专家们认为,这一现象或许预示着将复制2008年苹果公司的辉煌神话。与此同时,国泰君安的首席信息官俞枫表示,AI 大模型的崛起将推动证券行业进入 “智能认知” 时代,提升行业效率。图源备注:图片由AI生成,图片授权服务商Midjourney不仅如此,广州算力中心近日接入了阿里通义