Extenseur de Contexte LLM
Étend la fenêtre de contexte des grands modèles linguistiques (LLM).
Produit OrdinaireProductivitéLLMModèle linguistique
Extenseur de Contexte LLM est un outil conçu pour étendre la fenêtre de contexte des grands modèles linguistiques (LLM). Il permet aux LLM de s'adapter efficacement à des fenêtres de contexte plus larges en ajustant la fréquence de base de RoPE et en mettant à l'échelle les logits d'attention. L'outil a validé la supériorité de sa méthode en termes de performances et de robustesse lors de réglages fins, démontrant une efficacité remarquable en étendant la fenêtre de contexte de LLaMA-2-7B-Chat à 16 384 avec seulement 100 échantillons et 6 étapes d'entraînement. De plus, l'étude explore l'influence de la composition des données et du programme d'entraînement sur l'extension de la fenêtre de contexte pour des tâches spécifiques, suggérant l'ajustement fin des LLM avec de longues conversations comme bon point de départ.
Extenseur de Contexte LLM Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44