InternViT-300M-448px-V2_5

基于InternViT-300M-448px的增强版本,提升视觉特征提取能力。

普通产品图像视觉特征提取多模态学习
InternViT-300M-448px-V2_5是一个基于InternViT-300M-448px的增强版本,通过采用ViT增量学习与NTP损失(Stage 1.5),提升了视觉编码器提取视觉特征的能力,尤其是在大规模网络数据集中代表性不足的领域,如多语言OCR数据和数学图表等。该模型是InternViT 2.5系列的一部分,保留了与前代相同的“ViT-MLP-LLM”模型架构,并集成了新的增量预训练的InternViT与各种预训练的LLMs,如InternLM 2.5和Qwen 2.5,使用随机初始化的MLP投影器。
打开网站

InternViT-300M-448px-V2_5 最新流量情况

月总访问量

20899836

跳出率

46.04%

平均页面访问数

5.2

平均访问时长

00:04:57

InternViT-300M-448px-V2_5 访问量趋势

InternViT-300M-448px-V2_5 访问地理位置分布

InternViT-300M-448px-V2_5 流量来源

InternViT-300M-448px-V2_5 替代品