KPU (Unidad de Procesamiento de Conocimiento) es un marco enriquecido y propietario que aprovecha la potencia de los modelos lingüísticos grandes, separando la inferencia y el procesamiento de datos en un sistema abierto capaz de resolver tareas complejas. Se compone de tres componentes principales: el motor de inferencia, el motor de ejecución y la ventana de contexto virtual. El motor de inferencia se encarga de diseñar un plan paso a paso para resolver las tareas del usuario, utilizando modelos lingüísticos grandes intercambiables (actualmente se está probando ampliamente GPT-4 Turbo). El motor de ejecución recibe las órdenes del motor de inferencia y las ejecuta, enviando los resultados como retroalimentación al motor de inferencia para su replanificación. La ventana de contexto virtual gestiona la entrada y salida de datos e información entre el motor de inferencia y el motor de ejecución. Esta arquitectura de separación de inferencia y ejecución permite que los modelos lingüísticos grandes se centren en la inferencia, evitando deficiencias como las falsedades, el procesamiento de datos o la recuperación de información actualizada. KPU está diseñado para mejorar la calidad y el rendimiento de las tareas, abordando desafíos como el gran volumen de datos, el contenido multimodal, la resolución de problemas abiertos y la interactividad.