StreamingLLM

Modèle linguistique performant en streaming avec mécanisme d'attention décroissante

Produit OrdinaireProductivitéModèle linguistiqueTraitement du Langage Naturel

StreamingLLM est un modèle linguistique performant capable de traiter des entrées de longueur infinie sans compromettre l'efficacité ni les performances. Il conserve les jetons et le pool d'attention les plus récents, en supprimant les jetons intermédiaires. Cela permet au modèle de générer du texte cohérent à partir des jetons les plus récents, sans nécessiter de réinitialisation du cache. L'avantage de StreamingLLM réside dans sa capacité à générer des réponses à partir du contexte de conversation le plus récent sans avoir besoin de rafraîchir le cache ou de dépendre des données passées.

Best AI Websites & Tools

StreamingLLM

StreamingLLM Dernière situation du trafic

StreamingLLM Tendance des visites

StreamingLLM Distribution géographique des visites

StreamingLLM Sources de trafic

StreamingLLM Alternatives

StreamingLLM — Modèle linguistique performant en streaming avec mécanisme d'attention décroissante

Instella — Instella est un modèle linguistique open source haute performance développé par AMD, conçu pour accélérer le développement des modèles linguistiques open source.

Moonlight-16B-A3B — Moonlight-16B-A3B est un modèle d'expert mixte de 16 milliards de paramètres, entraîné avec l'optimiseur Muon, conçu pour une génération de langage efficace.

Xwen-Chat — Xwen-Chat est un ensemble de modèles linguistiques de grande taille spécialisé dans les dialogues en chinois, offrant plusieurs versions de modèles et des services de génération de langage.

MiniMax-01 — Modèle linguistique puissant disposant de 456 milliards de paramètres au total, capable de traiter un contexte jusqu'à 4 millions de jetons.

YuLan-Mini — Un modèle linguistique léger et performant de 240 millions de paramètres

OLMo-2-1124-13B-DPO — Modèle linguistique performant pour l'anglais, adapté à diverses tâches.

OpenScholar — Modèle linguistique amélioré par la recherche pour la synthèse de littérature scientifique

OLMo 2 13B — Modèle linguistique performant spécialisé dans les benchmarks académiques anglais

OLMo 2 — Modèle linguistique entièrement ouvert de pointe

MobileLLM-1B — Modèle linguistique de Meta comportant moins d'un milliard de paramètres, adapté aux applications embarquées.

MobileLLM-350M — Modèle linguistique optimisé de moins d'un milliard de paramètres, conçu pour les applications embarquées.

Zamba2-7B — Modèle linguistique compact haute performance

Échantillonnage basé sur l'entropie — Technique d'échantillonnage basée sur l'entropie, optimisant la diversité et la précision des sorties du modèle.

Discutez avec vos documents — Application Python permettant une conversation en langage naturel avec vos documents.

Meta Llama 3.1-405B — Grand modèle linguistique préentraîné multilingue

DCLM-baseline — Jeu de données de référence pour les modèles linguistiques performants

Arcee Spark — Modèle linguistique performant et compact de 7 milliards de paramètres

Prédiction multi-jetons — Modèle de prédiction multi-jetons améliorant l'efficacité et les performances des modèles linguistiques.

Samba — Implémentation officielle d'un modèle linguistique efficace à contexte illimité.

MAP-NEO — Un grand modèle linguistique entièrement open source, offrant des capacités avancées de traitement du langage naturel.

Modèle linguistique fiable (MLF) — Essayez le Modèle linguistique fiable (MLF) de Cleanlab dans votre navigateur.

LLaVA++ — Extension du modèle LLaVA intégrant Phi-3 et LLaMA-3 pour améliorer l'interaction entre la vision et le langage.

OpenELM — OpenELM est une famille de modèles linguistiques performants, dotée d'un framework open source pour l'entraînement et l'inférence.

Cappy — Un petit évaluateur pour améliorer les performances des grands modèles linguistiques multitâches.

H2O-Danube-1.8B — Modèle linguistique de 1,8 milliard de paramètres, open source et gratuit

LLMs-from-scratch — Comprendre en profondeur le fonctionnement interne des grands modèles de langage

Baichuan 3 — Modèle linguistique de grande taille avec plus de mille milliards de paramètres

Recherche Lepton — Lepton est une plateforme de recherche de modèles linguistiques open source.

MaLA-500 — Modèle linguistique de grande taille couvrant 534 langues