InternViT-6B-448px-V2_5
基于InternViT-6B-448px-V1-5的增强版视觉模型
普通产品图像视觉模型特征提取
InternViT-6B-448px-V2_5是一个基于InternViT-6B-448px-V1-5的视觉模型,通过使用ViT增量学习与NTP损失(阶段1.5),提升了视觉编码器提取视觉特征的能力,尤其是在大规模网络数据集中代表性不足的领域,如多语言OCR数据和数学图表等。该模型是InternVL 2.5系列的一部分,保留了与前代相同的“ViT-MLP-LLM”模型架构,并集成了新增量预训练的InternViT与各种预训练的LLMs,包括InternLM 2.5和Qwen 2.5,使用随机初始化的MLP投影器。
InternViT-6B-448px-V2_5 最新流量情况
月总访问量
21315886
跳出率
45.50%
平均页面访问数
5.2
平均访问时长
00:05:02