AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

Florence-2-base

先进的视觉基础模型，支持多种视觉和视觉-语言任务。

普通产品图像视觉模型多任务学习

Florence-2是由微软开发的高级视觉基础模型，采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示，执行如描述、目标检测和分割等任务。它利用包含54亿个注释的5.4亿张图像的FLD-5B数据集，精通多任务学习。模型的序列到序列架构使其在零样本和微调设置中都表现出色，证明其为有竞争力的视觉基础模型。

Florence-2-base

Florence-2-base 最新流量情况

月总访问量

27175375

跳出率

44.30%

平均页面访问数

5.8

平均访问时长

00:04:57

Florence-2-base 访问量趋势

Florence-2-base 访问地理位置分布

Florence-2-base 流量来源

Florence-2-base 替代品

Florence-2-base — 先进的视觉基础模型，支持多种视觉和视觉-语言任务。

•视觉模型•多任务学习

Gemma-2-9b-it — 轻量级、先进的文本生成模型

•文本生成•自然语言处理

Florence-2-large — 先进的视觉基础模型，支持多种视觉和视觉-语言任务

•视觉模型•多任务学习

Florence-2 — 一种统一的视觉任务基础模型。

•视觉模型•多任务学习

llama3v — 基于llama3 8B的SOTA视觉模型

•视觉模型•多模态学习

Liquid — 一个集成视觉理解和生成的多模态生成模型。

•多模态•生成模型

GLM-4-32B — 强大的语言模型，支持多种自然语言处理任务。

•自然语言处理•深度学习

Dream 7B — Dream 7B 是最强大的开放扩散大语言模型。

•扩散模型•大语言模型

MeshifAI — 将文本即时转换为令人惊叹的 3D 模型。

•3D 模型•AI 技术

DeepSeek-V3-0324 — 一个强大的文本生成模型，适用于多种对话应用。

•文本生成•对话系统

Reka Flash 3 — 一款 21B 通用推理模型，适合低延迟应用。

•自然语言处理•开源

o1-pro — o1-pro 模型通过强化学习提升复杂推理能力，提供更优答案。

•自然语言处理•文本生成

Venice — 私密且无审查的人工智能平台，提供文本、图像和代码生成等功能。

•隐私保护•文本生成

SmolVLM2 — SmolVLM2 是一个专注于视频内容分析和生成的轻量化语言模型。

•视频分析•文本生成

Firecrawl LLMs.txt generator — 为LLM训练和推理生成网站整合文本文件的工具

•LLM•文本生成

Aya Vision

Aya Vision — Aya Vision 是 Cohere 推出的多语言多模态视觉模型，旨在提升多语言场景下的视觉和文本理解能力。

•多语言•多模态

QwQ-32B — QwQ-32B 是一款强大的推理模型，专为复杂问题解决和文本生成设计，性能卓越。

•推理•文本生成

olmOCR-7B-0225-preview — olmOCR-7B-0225-preview 是一个基于 Qwen2-VL-7B-Instruct 微调的文档图像识别模型，用于高效转换文档为纯文本。

•文档识别•文本生成

Magma-8B — Magma-8B 是微软推出的一款多模态 AI 模型，能够处理图像和文本输入并生成文本输出。

•多模态•图像

s1-32B — s1是一个基于Qwen2.5-32B-Instruct微调的推理模型，仅用1000个样本进行训练。

•文本生成•推理模型

Xwen-Chat — Xwen-Chat是专注中文对话的大语言模型集合，提供多版本模型及语言生成服务

•语言模型•中文对话

SmolVLM-256M-Instruct — SmolVLM-256M 是世界上最小的多模态模型，可高效处理图像和文本输入并生成文本输出。

•多模态•图像处理

DeepSeek-R1-Distill-Qwen-14B — DeepSeek-R1-Distill-Qwen-14B 是一款高性能的文本生成模型，适用于多种推理和生成任务。

•自然语言处理•文本生成

DeepSeek-R1-Distill-Qwen-32B — DeepSeek-R1-Distill-Qwen-32B 是一款高性能的开源语言模型，适用于多种文本生成任务。

•文本生成•强化学习

AI ContentCraft — AI ContentCraft 是一个多功能内容创作工具，集成了文本生成、语音合成和图像生成能力。

•内容创作•文本生成

Textoon — Textoon 是一款基于文本描述生成生动 2D 卡通角色的创新工具。

•文本生成•2D 卡通

InternLM3 — InternLM3 是一个专注于文本生成的模型集合，提供多种优化版本以满足不同需求。

•自然语言处理•文本生成

MiniMax-Text-01 — MiniMax-Text-01是一个强大的语言模型，具有4560亿总参数，能够处理长达400万token的上下文。

•语言模型•文本生成

Dria-Agent-a-7B — 一个基于Qwen2.5-Coder系列训练的大型语言模型，专注于代理应用。

•大型语言模型•编程辅助

Llama-3-Patronus-Lynx-8B-Instruct-Q4_K_M-GGUF — 基于特定模型的量化大型语言模型，适用于自然语言处理等任务。

•大型语言模型•量化模型