Florence-2-large-ft

Modèle de base visuel avancé prenant en charge plusieurs tâches de vision et de vision-langage.

Produit OrdinaireImageTraitement d'imageTraitement du langage naturel

Florence-2-large-ft est un modèle de base visuel avancé développé par Microsoft, utilisant une approche basée sur des invites pour traiter un large éventail de tâches de vision et de vision-langage. Ce modèle est capable d'exécuter des tâches telles que la description d'image, la détection d'objets et la segmentation via de simples invites textuelles. Il exploite l'ensemble de données FLD-5B, comprenant 5,4 milliards d'annotations couvrant 126 millions d'images, pour réaliser un apprentissage multitâche. L'architecture séquence-à-séquence du modèle lui permet d'obtenir d'excellents résultats, aussi bien en zéro-shot qu'en réglage fin, prouvant ainsi qu'il s'agit d'un modèle de base visuel compétitif.

Best AI Websites & Tools

Florence-2-large-ft

Florence-2-large-ft Dernière situation du trafic

Florence-2-large-ft Tendance des visites

Florence-2-large-ft Distribution géographique des visites

Florence-2-large-ft Sources de trafic

Florence-2-large-ft Alternatives

Florence-2-large-ft — Modèle de base visuel avancé prenant en charge plusieurs tâches de vision et de vision-langage.

Finbar — Fournit des données financières de base mondiales, intégrables rapidement à vos modèles, pour une efficacité accrue des analystes financiers modernes.

Sonus-1 — Sonus-1 : une nouvelle ère pour les grands modèles de langage (LLM)

InternVL2_5-8B-MPO — Modèle linguistique large multi-modal, affichant des performances globales exceptionnelles.

Llama-3.1-70B-Instruct-AWQ-INT4 — Modèle de génération de texte de 70 milliards de paramètres

ModernBERT — ModernBERT est un modèle d'encodeur nouvelle génération aux performances exceptionnelles.

InternVL2_5-2B-MPO — Modèle linguistique large multimodal avancé

Gemini 2.0 Flash Expérimental — Modèle d'IA haute performance développé par Google DeepMind

Q-RWKV-6 32B Instruct - Aperçu — Variante de modèle RWKV la plus puissante, surpassant plusieurs benchmarks en anglais.

CosyVoice Générateur de Voix 2.0 - 0.5B — Modèle de synthèse vocale performant et multilingue

PaliGemma 2 — PaliGemma 2 est un puissant modèle linguistique visuel, simple à optimiser.

OLMo 2 1124 7B Preference Mixture — Ensemble de données textuelles à grande échelle pour la recherche sur les mélanges de préférences

OLMo-2-1124-7B-DPO — Modèle de génération de texte avancé, prenant en charge le traitement de tâches diversifiées.

OLMo-2-1124-13B-DPO — Modèle linguistique performant pour l'anglais, adapté à diverses tâches.

OpenScholar — Modèle linguistique amélioré par la recherche pour la synthèse de littérature scientifique

dolmino-mix-1124 — Ensemble de données de haute qualité, utilisé pour la deuxième phase d'entraînement d'OLMo2.

ZipPy — Outil de détection rapide de texte généré par l'IA utilisant le taux de compression

LazyGraphRAG — Un modèle de génération augmentée par la recherche et enrichi par un graphe (RAG) qui établit de nouvelles normes en matière de qualité et de coût.

Llama-3.1-Tulu-3-8B-DPO — Modèle de génération de texte avancé, prenant en charge diverses tâches

Llama-3.1-Tulu-3-70B — Famille de modèles de pointe suivant les instructions, fournissant des données, du code et des guides open source.

Démo Qwen Turbo 1M — La démo Qwen Turbo 1M est un espace Hugging Face fourni par Qwen.

Qwen2.5-Coder-0.5B — Modèle de génération de code de 0,5B de paramètres de la série Qwen2.5-Coder

OuteTTS — Un modèle expérimental de texte à la parole

API xAI — API de modèles de base de la série Grok pour les développeurs

Flux.1 Lite — Modèle d'auto-encodeur variationnel à 8 milliards de paramètres, conçu pour une génération texte-image efficace.

aya-101 — Modèle linguistique génératif multilingue

Modèles IBM Granite 3.0 — Modèles linguistiques IA haute performance IBM Granite 3.0

Long-LRM — Modèle de reconstruction gaussienne 3D haute efficacité pour une reconstruction rapide de grandes scènes.

Ingénierie des Prompts — Un référentiel complet de ressources techniques sur l'ingénierie des prompts

SLM_Survey — Étude, mesure et analyse des petits modèles linguistiques