InternViT-6B-448px-V2_5

基于InternViT-6B-448px-V1-5的增强版视觉模型

普通产品图像视觉模型特征提取
InternViT-6B-448px-V2_5是一个基于InternViT-6B-448px-V1-5的视觉模型,通过使用ViT增量学习与NTP损失(阶段1.5),提升了视觉编码器提取视觉特征的能力,尤其是在大规模网络数据集中代表性不足的领域,如多语言OCR数据和数学图表等。该模型是InternVL 2.5系列的一部分,保留了与前代相同的“ViT-MLP-LLM”模型架构,并集成了新增量预训练的InternViT与各种预训练的LLMs,包括InternLM 2.5和Qwen 2.5,使用随机初始化的MLP投影器。
打开网站

InternViT-6B-448px-V2_5 最新流量情况

月总访问量

21315886

跳出率

45.50%

平均页面访问数

5.2

平均访问时长

00:05:02

InternViT-6B-448px-V2_5 访问量趋势

InternViT-6B-448px-V2_5 访问地理位置分布

InternViT-6B-448px-V2_5 流量来源

InternViT-6B-448px-V2_5 替代品