ModernBERT-base

Modèle d'encodeur bidirectionnel hautement performant pour le traitement de longs textes

Produit OrdinaireProgrammationBERTTraitement de longs textes
ModernBERT-base est un modèle Transformer d'encodeur bidirectionnel moderne, pré-entraîné sur 2 000 milliards de données textuelles anglaises et de code. Il supporte nativement des contextes jusqu'à 8192 tokens. Ce modèle intègre les dernières améliorations architecturales, telles que les Rotary Positional Embeddings (RoPE), l'attention alternée locale-globale et la suppression des éléments de remplissage (Unpadding), ce qui lui permet d'exceler dans les tâches de traitement de longs textes. ModernBERT-base convient aux tâches nécessitant le traitement de longs documents, telles que la recherche, la classification et la recherche sémantique dans de grands corpus. Les données d'entraînement étant principalement en anglais et constituées de code, ses performances pourraient être réduites sur d'autres langues.
Ouvrir le site Web

ModernBERT-base Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

ModernBERT-base Tendance des visites

ModernBERT-base Distribution géographique des visites

ModernBERT-base Sources de trafic

ModernBERT-base Alternatives