Recientemente, investigadores de UC Berkeley presentaron el Modelo de Mundo Grande (LWM), el cual demuestra una capacidad comparable a la de Gemini 1.5 Pro de Google en el procesamiento de videos largos y secuencias de lenguaje.
LWM se entrenó utilizando la tecnología RingAttention, lo que le permite procesar textos y videos extremadamente largos con un rendimiento excepcional.
Si bien modelos como Gemini 1.5 y Sora han generado mucho interés, aún presentan limitaciones y requieren más investigación y exploración.