快手开始研发超千亿规模大模型和多模态大模型

Ovis2 是阿里巴巴国际化团队提出的Ovis系列模型的最新版本。与前序1. 6 版本相比,Ovis2 在数据构造和训练方法上都有显著改进。它不仅强化了小规模模型的能力密度,还通过指令微调和偏好学习大幅提升了思维链(CoT)推理能力。此外,Ovis2 引入了视频和多图像处理能力,并增强了多语言能力和复杂场景下的OCR能力,显著提升了模型的实用性。
全球开发者目光再次聚焦中国!在备受瞩目的全球开发者大会(GDC)上,阿里云魔搭社区重磅宣布,首发上线阶跃星辰最新开源的两款多模态模型,包括 全球参数量最大的开源视频生成模型 Step-Video-T2V,以及 业界首款产品级开源语音交互模型 Step-Audio。 这一消息瞬间引爆全球AI开源社区,再次彰显中国在人工智能领域的强劲创新实力。作为中国最大的AI模型社区,阿里云魔搭社区此次发布的这两款重磅模型,无疑是近期全球多模态领域最受瞩目的开源成果。 Step-Video-T2V 以其巨大的参数规模
在刚刚发布48小时后,Grok3的推出引发了用户们的强烈反应,尤其是刚刚花费40美元订阅 X 平台 Premium + 服务的用户。在他们满怀期待地准备体验这一最新 AI 大模型时,却发现马斯克在社交媒体 X 上的宣布:Grok3将 “短期内免费提供给所有人”,令他们感到心寒。XAI 官方账号甚至声称,免费将持续 “直到服务器崩溃”。在 Grok3发布后不久,马斯克在社交平台上晒出 Grok 应用在苹果应用商店的免费生产力工具榜单,显示其首次超过了 ChatGPT。用户们在评论区对此感到困惑,有人感叹:“我花钱升
据了解,腾讯元宝此次升级的核心在于“混元+DeepSeek”双模聚合技术的应用。过去,DeepSeek主要扮演的是信息提取的角色,类似于“扫描仪”。但在腾讯混元多模态技术的加持下,如今的DeepSeek已经能够真正理解图片中的细节、氛围,甚至是隐藏的含义。这一转变使得腾讯元宝能够“看懂”图片,并给出自己的分析和解读。