MiniCPM-o 2.6 es el modelo más reciente y potente de la serie MiniCPM-o. Este modelo, construido con SigLip-400M, Whisper-medium-300M, ChatTTS-200M y Qwen2.5-7B, cuenta con 8B parámetros. Destaca en la comprensión visual, la interacción de voz y la transmisión en vivo multimodal, admite conversaciones de voz en tiempo real y funciones de transmisión en vivo multimodal. El modelo ha demostrado un rendimiento excelente en la comunidad de código abierto, superando a varios modelos conocidos. Sus ventajas radican en su velocidad de inferencia eficiente, baja latencia, bajo consumo de memoria y energía, permitiendo una transmisión en vivo multimodal eficiente en dispositivos como iPads. Además, MiniCPM-o 2.6 es fácil de usar y admite varios métodos de uso, incluyendo inferencia de CPU con llama.cpp, modelos cuantizados en formato int4 y GGUF, e inferencia de alto rendimiento con vLLM.