Mistral发布全新模型Mistral Large，性能超越其他所有模型，与微软达成合作，Gemini即将上线

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · 2024年2月27号 10:18

Mistral最近发布了Mistral Large，该模型在基准测试中仅次于GPT-4，性能超越其他所有模型。Mistral Large具备母语般流利的能力，覆盖多种语言，并支持精确的指令跟随功能以及函数调用和受限输出模式。此外，MistralAI与微软达成技术合作，加速模型训练和开发。另外，Gemini Ultra即将上线，Google聊天机器人Bard将更名为Gemini。

DeepSeek 开源周首日：发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek 开源周首日正式开源其最新技术成果FlashMLA，这是一款专为英伟达Hopper架构GPU打造的高效多层注意力（Multi-Layer Attention）解码内核。该技术特别针对变长序列场景进行优化，可显著提升大模型推理性能。FlashMLA的核心技术特性包括对BF16精度的全面支持，以及采用块大小为64的页式键值缓存（Paged KV Cache）系统，实现更精确的内存管理。在性能表现方面，基于CUDA12.6平台，FlashMLA在H800SXM5GPU上创下了显著成绩:在内存受限场景下达到3000GB/s的处理速度，在计算受限场景下则实现580TFLOPS的算力

Meta AI 发布新型视频学习模型V-JEPA ：视频理解新突破

近日，Meta AI 团队推出了视频联合嵌入预测架构（V-JEPA）模型，这一创新举措旨在推动机器智能的发展。人类能够自然而然地处理来自视觉信号的信息，进而识别周围的物体和运动模式。机器学习的一个重要目标是揭示促使人类进行无监督学习的基本原理。研究人员提出了一个关键假设 —— 预测特征原则，认为连续感官输入的表示应该能够相互预测。早期的研究方法通过慢特征分析和谱技术来保持时间一致性，防止表示崩溃。而现在的许多新方法则结合了对比学习和掩蔽建模，确保表示能

腾讯混元视频模型（Hunyuan Video）测试招募中，开源在望

近日，腾讯混元视频模型（Hunyuan Video）在 X 平台上正式公开招募测试伙伴，标志着这一前沿 AI 视频生成技术迈入关键测试阶段。根据官方透露，测试结束后，该模型有很大概率会开源，为全球 AI 社区贡献其技术成果。混元视频模型是腾讯在 AI 视频生成领域的重要创新，拥有超过13B 的参数量，是目前开源模型中规模最大的视频生成模型之一。其核心技术包括高效的时空上下文建模能力以及对复杂物理规律的精准模拟，能够生成高质量且符合真实世界逻辑的视频内容。此前，腾讯混元团队

黄仁勋怒怼市场 “你们都搞错了！”：DeepSeek R1 不是来砸场子，反而是 Nvidia 的 “神助攻”

“你们都搞错了!” 近日，英伟达掌门人罕见 “ 动怒 ” ，公开回应了市场对中国 AI 创企 DeepSeek 发布 R1模型的 “ 过度 ” 反应。在黄仁勋看来， DeepSeek R1的横空出世非但不是对 Nvidia 的 “ 饭碗 ” 构成威胁，反而是加速AI发展的重大利好，对英伟达而言更是 “ 神助攻 ” 一般的存在。事情起因于今年1月 DeepSeek 发布 R1模型后，市场普遍认为 R1的高效性意味着未来AI发展将不再需要如此庞大的算力资源，这直接导致Nvidia股价单日暴跌16.9%，市值瞬间蒸发数百亿美元。市场的恐慌情

AI新闻资讯