Florence-2-large-ft

Modelo básico de visão avançado, compatível com diversas tarefas de visão e visão-linguagem.

Produto ComumImagemProcessamento de imagensProcessamento de linguagem natural

Florence-2-large-ft é um modelo básico de visão avançado desenvolvido pela Microsoft, que utiliza um método baseado em prompts para lidar com uma ampla gama de tarefas de visão e visão-linguagem. O modelo consegue executar tarefas como descrição de imagens, detecção e segmentação de objetos por meio de prompts de texto simples. Ele utiliza o conjunto de dados FLD-5B, contendo 5,4 bilhões de anotações cobrindo 126 milhões de imagens, para aprendizagem multitarefa. Sua arquitetura sequencial permite excelente desempenho em cenários de zero-shot e fine-tuning, demonstrando ser um modelo básico de visão competitivo.

Best AI Websites & Tools

Florence-2-large-ft

Florence-2-large-ft Situação do Tráfego Mais Recente

Florence-2-large-ft Tendência de Visitas

Florence-2-large-ft Distribuição Geográfica das Visitas

Florence-2-large-ft Fontes de Tráfego

Florence-2-large-ft Alternativas

Florence-2-large-ft — Modelo básico de visão avançado, compatível com diversas tarefas de visão e visão-linguagem.

InternVL2_5-8B-MPO — Modelo de linguagem grande multimodais, demonstrando desempenho geral excepcional.

pixtral-12b-240910 — Modelo de linguagem grande multimodal, suporta compreensão de imagens e texto.

Plataforma Aberta Lingyun — Plataforma Aberta

olmOCR — O olmOCR é um pacote de ferramentas para linearizar PDFs para treinamento de conjuntos de dados de LLMs.

Finbar — Oferece dados financeiros globais básicos, integrando-se rapidamente a modelos e auxiliando analistas financeiros modernos em seu trabalho eficiente.

Imitar Antes de Detectar — Um método avançado para detectar textos revisados por máquinas, melhorando a precisão da detecção através da imitação do estilo de máquina.

Sonus-1 — Sonus-1: Inaugurando uma nova era para modelos de linguagem de grande porte (LLMs)

Interface Texto-para-CAD — Cria arquivos CAD B-Rep e malhas a partir de prompts de linguagem natural

Llama-3.1-70B-Instruct-AWQ-INT4 — Modelo de geração de texto com 70 bilhões de parâmetros

ModernBERT — O ModernBERT é um modelo de codificador de nova geração com desempenho excepcional.

InternVL2_5-4B-MPO — Modelo de linguagem grande multi-modal, demonstrando desempenho geral excelente.

Smolagents — Biblioteca leve para construir agentes inteligentes de alto desempenho.

InternVL2_5-2B-MPO — Modelo de linguagem grande multimodal avançado

Llama-lynx-70b-4bitAWQ — Modelo de geração de texto com 7 bilhões de parâmetros

Gemini 2.0 Flash Experimental — Modelo de IA de alto desempenho desenvolvido pelo Google DeepMind

Q-RWKV-6 32B Instruct Preview — Variante mais poderosa do modelo RWKV, superando vários benchmarks em inglês.

Modelo de Geração de Voz CosyVoice 2.0-0.5B — Modelo de síntese de voz eficiente e multilíngue

tulu-3-sft-olmo-2-mixture — Conjunto de dados de texto multilíngue em larga escala

OLMo-2-1124-7B-RM — Modelo de linguagem grande, usado para geração e classificação de texto

ChatGPT Pro — Acesso em escala a modelos de IA de ponta

PaliGemma 2 — O PaliGemma 2 é um poderoso modelo de linguagem visual, fácil de otimizar.

OLMo 2 1124 7B Mixture de Preferências — Conjunto de dados de texto em larga escala para pesquisa de mistura de preferências

OLMo-2-1124-7B-SFT — Modelo de geração de texto em inglês de alto desempenho

OLMo-2-1124-7B-DPO — Modelo avançado de geração de texto, que suporta o processamento de diversas tarefas.

OLMo-2-1124-13B-DPO — Modelo de linguagem inglês de alto desempenho, adequado para diversas tarefas.

ProactiveAgent — Agente proativo baseado em modelos de linguagem grandes, que prevê as necessidades do usuário e oferece ajuda de forma proativa.

OpenScholar — Modelo de linguagem aprimorado por recuperação para síntese de literatura científica

dolmino-mix-1124 — Conjunto de dados de alta qualidade, usado na segunda etapa do treinamento do OLMo2.

OLMo-2-1124-13B-Instruct — Modelo de linguagem grande otimizado, especializado em geração de texto e diálogo.