LongVA

Modèle de transformation à long contexte, de la langue à la vision

Produit OrdinaireImageLong contexteModèle visuel

LongVA est un modèle de transformation à long contexte capable de traiter plus de 2000 images ou plus de 200 000 marqueurs visuels. Il affiche des performances de pointe parmi les modèles de 7 milliards de paramètres sur Video-MME. Le modèle a été testé avec CUDA 11.8 et A100-SXM-80G, et peut être rapidement mis en œuvre via la plateforme Hugging Face.

Best AI Websites & Tools

LongVA

LongVA Dernière situation du trafic

LongVA Tendance des visites

LongVA Distribution géographique des visites

LongVA Sources de trafic

LongVA Alternatives

LongVA — Modèle de transformation à long contexte, de la langue à la vision

Samba — Implémentation officielle d'un modèle linguistique efficace à contexte illimité.

Modèle d'intégration de texte Gemini Embedding — Gemini Embedding est un modèle d'intégration de texte avancé qui fournit des capacités puissantes de compréhension du langage via l'API Gemini.

NeoBase — NeoBase est un assistant de base de données IA open source qui vous permet d'interagir avec votre base de données en langage naturel.

Instella — Instella est un modèle linguistique open source haute performance développé par AMD, conçu pour accélérer le développement des modèles linguistiques open source.

Clone — Clone est un robot humanoïde doté de la technologie révolutionnaire des muscles artificiels Myofiber, capable de marcher naturellement.

ViDoRAG — ViDoRAG est un framework d'agents d'inférence itérative dynamique qui combine la recherche de documents visuels et l'amélioration de la génération.

Microsoft Dragon Copilot — Microsoft Dragon Copilot est un espace de travail IA pour le secteur médical qui simplifie les flux de travail de documentation clinique et améliore l'efficacité.

Migician — Migician est un grand modèle linguistique multimodale axé sur la localisation multi-images, capable de réaliser une localisation précise multi-images de forme libre.

IndexTTS — Système texte-parole zéro-shot industriel, contrôlable et efficace

olmOCR — olmOCR est une boîte à outils permettant de linéariser des PDF pour l'entraînement d'ensembles de données de LLM.

Extensions Raycast IA — Raycast lance les Extensions IA, permettant d'interagir avec les applications de votre ordinateur et d'exécuter des tâches via des commandes en langage naturel.

MLGym — MLGym est un nouveau framework et une nouvelle référence pour faire progresser les agents de recherche en IA.

tablegpt-agent — Agent pré-construit de TableGPT2 pour les tâches de Q&R basées sur des tableaux.

bRAG-langchain — Un projet open source pour la construction d'applications de génération augmentée par la recherche (RAG).

Qwen — Qwen Chat est un outil de chat d'intelligence artificielle basé sur un modèle linguistique avancé, offrant des conversations intelligentes et de multiples fonctionnalités.

FlexHeadFA — Mécanisme d'attention précis, rapide et économe en mémoire

FlashMLA — FlashMLA est un noyau de décodage MLA hautement efficace optimisé pour les GPU Hopper, adapté aux services de séquences de longueur variable.

VLM-R1 — VLM-R1 est un modèle linguistique visuel renforcé stable et polyvalent, axé sur les tâches de compréhension visuelle.

Moonlight-16B-A3B — Moonlight-16B-A3B est un modèle d'expert mixte de 16 milliards de paramètres, entraîné avec l'optimiseur Muon, conçu pour une génération de langage efficace.

Moonlight — Moonlight est un modèle d'expert mixte de 16 milliards de paramètres, entraîné avec l'optimiseur Muon, et offrant des performances exceptionnelles.

kg-gen — Outil d'intelligence artificielle pour extraire les graphes de connaissances de n'importe quel texte.

Kie.ai — Kie.ai intègre les API DeepSeek R1 et V3 pour fournir des solutions IA sécurisées et évolutives.

hallucination-leaderboard — Un classement comparant les performances de grands modèles de langage (LLM) en matière d'hallucinations lors de la synthèse de courts documents.

KET-RAG — KET-RAG est un framework de génération enrichie par la recherche et intégrant un graphe de connaissances, conçu pour l'indexation efficace de documents et la génération de réponses.

Proxy — Proxy est un assistant IA entièrement automatisé conçu pour effectuer des tâches quotidiennes.

Détection de compatibilité des modèles DeepSeek — Détermine si un appareil peut exécuter des modèles DeepSeek de différentes tailles et fournit une prédiction de compatibilité.

pré-entraînement de modèles linguistiques récurrents — Code de pré-entraînement pour des modèles linguistiques récurrents profonds à grande échelle, capable de fonctionner sur 4096 GPU AMD.

Concierge IA — Interagissez naturellement avec vos applications pour améliorer votre productivité et votre efficacité.

Zyphra — Zyphra est une entreprise spécialisée dans l'intelligence artificielle, offrant des modèles de conversation et des services associés.