Reader-LM es un modelo de lenguaje pequeño desarrollado por Jina AI, diseñado para convertir contenido HTML sin procesar y desordenado de la web en un formato Markdown limpio. Estos modelos están optimizados especialmente para el procesamiento de textos largos, admiten múltiples idiomas y pueden manejar contextos de hasta 256K tokens. El modelo Reader-LM reduce la dependencia de expresiones regulares y reglas heurísticas mediante la conversión directa de HTML a Markdown, lo que aumenta la precisión y la eficiencia de la conversión.