Des chercheurs de l'UC Berkeley ont récemment présenté le Modèle Linguistique Mondial (LWM), dont les capacités de traitement de longues vidéos et de séquences linguistiques sont comparables à celles de Gemini 1.5 Pro de Google. Le LWM est entraîné grâce à la technologie RingAttention, lui permettant de traiter des textes et des vidéos extrêmement longs avec d'excellents résultats.
Bien que des modèles comme Gemini 1.5 et Sora aient suscité un vif intérêt, ils présentent encore des limites et nécessitent davantage de recherches et d'explorations.