Infini-attention

Étend les modèles de langage Transformer pour traiter des entrées de longueur infinie.

Produit OrdinaireAutreTransformerGrands modèles linguistiques

La technologie « Infini-attention » développée par Google vise à étendre les grands modèles linguistiques basés sur les Transformer pour traiter des entrées de longueur infinie. Elle utilise un mécanisme de compression de la mémoire pour gérer les entrées infiniment longues et obtient d'excellents résultats sur plusieurs tâches de longues séquences. Les méthodes techniques incluent un mécanisme de compression de la mémoire, la combinaison de l'attention locale et à long terme, et la capacité de traitement en flux continu. Les résultats expérimentaux montrent un avantage en termes de performances sur des tâches de modélisation linguistique de longs contextes, de recherche de blocs de contexte clés et de résumé de livres.

Best AI Websites & Tools

Infini-attention

Infini-attention Dernière situation du trafic

Infini-attention Tendance des visites

Infini-attention Distribution géographique des visites

Infini-attention Sources de trafic

Infini-attention Alternatives

Infini-attention — Étend les modèles de langage Transformer pour traiter des entrées de longueur infinie.

QwQ-32B — QwQ-32B est un puissant modèle d'inférence, conçu pour la résolution de problèmes complexes et la génération de texte, avec des performances exceptionnelles.

ART — Une technique de transformateur de zone anonyme pour la génération d'images transparentes multicouches variables.

M2RAG — Bibliothèque de code de référence pour la génération améliorée par la recherche dans un contexte multimodal.

MoBA — MoBA est un mécanisme d'attention par blocs mixtes pour les contextes de longs textes, visant à améliorer l'efficacité des grands modèles de langage.

OmniParser-v2.0 — OmniParser est un outil d'analyse d'écran universel capable de convertir des captures d'écran d'interface utilisateur en un format structuré, améliorant ainsi les performances des agents d'interface utilisateur basés sur les grands modèles linguistiques (LLM).

Application Android MNN pour grands modèles linguistiques — Application Android polyvalente pour grands modèles linguistiques prenant en charge les fonctionnalités multimodales.

Janus-Pro-1B — Janus-Pro-1B est un framework autorégressif unifié de compréhension et de génération multimodale.

PaSa — PaSa est un agent de recherche d'articles scientifiques avancé, piloté par un grand modèle linguistique, capable de prendre des décisions autonomes et d'obtenir des résultats précis.

ViTPose — Ensemble de modèles ViTPose basés sur l'architecture Transformer

AnyParser Pro — AnyParser Pro est un grand modèle linguistique capable d'extraire rapidement et précisément du contenu à partir de PDF, de PPT et d'images.

ModernBERT-large — Modèle Transformer d'encodage bidirectionnel haute performance

ModernBERT — ModernBERT est un modèle d'encodeur nouvelle génération aux performances exceptionnelles.

ExploreToM — Cadre de génération à grande échelle de données sur la théorie de l'esprit, diversifiées et stimulantes.

Sandbox Fusion — Bac à sable de code polyvalent, adapté aux grands modèles linguistiques.

OLMo 2 13B — Modèle linguistique performant spécialisé dans les benchmarks académiques anglais

Star-Attention — Technique d'inférence efficace pour les grands modèles de langage sur des séquences longues

Serveurs de protocoles de contexte de modèle — Ensemble de serveurs de référence et contributions communautaires pour le protocole de contexte de modèle.

5ire — Simple et facile à utiliser, libérez la puissance de l'IA

MobileLLM-600M — Modèle linguistique de 600M de paramètres, hautement optimisé et conçu pour les applications embarquées.

MobileLLM-350M — Modèle linguistique optimisé de moins d'un milliard de paramètres, conçu pour les applications embarquées.

Analyseur d'URL en ligne — Analyseur d'URL en ligne : convertit les URL en un format d'entrée adapté aux grands modèles linguistiques.

Oasis — Modèle IA d'open world en temps réel basé sur Transformer

LongVU — Modèle de compression spatio-temporelle adaptative pour la compréhension du langage vidéo long

awesome-LLM-resourses — Agrégation des ressources mondiales sur les grands modèles linguistiques

Tilores Identity RAG — Plateforme d'unification et de recherche de données clients

Llama-3.2-1B — Modèle linguistique de grande taille multilingue

RD-Agent — Outil d'automatisation de la recherche et du développement, améliorant l'efficacité et la qualité de la R&D.

NVLM — Modèle linguistique multimodal de pointe, offrant des performances de pointe pour les tâches visuelles et linguistiques.

Shire — Langage d'agent de programmation IA, permettant la communication entre les LLM et les IDE pour automatiser la programmation.