SpacTor-T5
Modèle T5 pré-entraîné, utilisant la perturbation de paragraphe et la détection de jetons de remplacement.
Produit OrdinaireProgrammationPNLModèle pré-entraîné
SpacTor est une nouvelle procédure d'entraînement intégrant (1) un objectif mixte combinant la perturbation de paragraphe (SC) et la détection de remplacement de jetons (RTD), et (2) un programme en deux phases qui optimise l'objectif mixte pendant les τ premières itérations, puis passe à la perte SC standard. Nous avons mené des expériences sur plusieurs tâches de PNL, en utilisant une architecture encodeur-décodeur (T5). SpacTor-T5 obtient des performances en aval comparables à celles du pré-entraînement SC standard, tout en réduisant de 50 % le nombre d'itérations de pré-entraînement et de 40 % le nombre total de FLOPs. De plus, avec le même budget de calcul, nous avons constaté que SpacTor permettait d'améliorer significativement les performances des benchmarks en aval.
SpacTor-T5 Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44