开源GPT-4 Vision的替代方案即将到来

VentureBeat

发布于AI新闻资讯 · 1 分钟阅读 · 2023年10月12号 14:03

本文介绍了开源社区正在研发的多模态语言模型LLaVA 1.5,它整合了多个生成AI组件,经调优后计算效率很高,可以在多项任务上达到很高的准确率。LLaVA 1.5使用CLIP作为视觉编码器,使用开源LLaMA语言模型,通过MLP连接器进行连接。只需要大约600,000个训练样本和1天的时间,就可以在多模态基准测试中击败其他开源模型。尽管LLaVA 1.5存在使用限制,但它代表了开源社区正在创新的方向,有望推动开源大模型的发展,为用户提供更便捷高效的生成AI工具。

腾讯健康接入DeepSeek+腾讯混元双模型升级就医体验

2月24日，腾讯健康宣布通过腾讯云全面接入DeepSeek大模型，并与腾讯自研的混元大模型“双核组队”，全面升级医疗服务，涵盖智能导诊、预问诊、健康问答、智能用药、症状自查、影像报告解读及质控等多个场景。这一升级旨在帮助全国超过1000家医院快速提升智能应用水平，并为医疗机构、体检中心、药械企业和基因测序企业提供多模型部署及应用方案。

DeepSeek 开源周首日：发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek 开源周首日正式开源其最新技术成果FlashMLA，这是一款专为英伟达Hopper架构GPU打造的高效多层注意力（Multi-Layer Attention）解码内核。该技术特别针对变长序列场景进行优化，可显著提升大模型推理性能。FlashMLA的核心技术特性包括对BF16精度的全面支持，以及采用块大小为64的页式键值缓存（Paged KV Cache）系统，实现更精确的内存管理。在性能表现方面，基于CUDA12.6平台，FlashMLA在H800SXM5GPU上创下了显著成绩:在内存受限场景下达到3000GB/s的处理速度，在计算受限场景下则实现580TFLOPS的算力

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型

今日凌晨，全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布，DeepSeek-R1在 Hugging Face 上获得了超过10000个赞，成为该平台近150万个模型中最受欢迎的大模型。这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。DeepSeek-R1的崛起速度令人瞩目。在其发布仅数周后，Clement Delangue 就曾发文表示，该模型已成为 Hugging Face 上最受欢迎的模型之一。如今，其受欢迎程度进一步攀升，以超过10000个赞的亮眼成绩，力压平台上近150万个模型，成功登顶