Omost est un projet visant à transformer les capacités de codage des grands modèles linguistiques (LLM) en capacités de génération d'images (plus précisément, de composition d'images). Il fournit des modèles LLM pré-entraînés basés sur les variantes Llama3 et Phi3, capables d'écrire du code pour composer du contenu visuel d'images à l'aide de l'agent Canvas virtuel d'Omost. Le Canvas peut être implémenté par un générateur d'images spécifique pour générer réellement des images. La technologie derrière le projet Omost inclut l'optimisation directe des préférences (DPO) et les capacités multimodales d'OpenAI GPT4o.