Mercury Coder est le premier modèle de langage large de diffusion (dLLM) de niveau commercial lancé par Inception Labs, optimisé pour la génération de code. Ce modèle utilise la technologie des modèles de diffusion, par une approche de génération « grossier à précis », améliorant considérablement la vitesse et la qualité de la génération. Sa vitesse est 5 à 10 fois supérieure à celle des modèles linguistiques autorégressifs traditionnels ; il peut atteindre une vitesse de génération de plus de 1000 jetons par seconde sur le matériel NVIDIA H100, tout en maintenant une capacité de génération de code de haute qualité. Le contexte de cette technologie est le goulot d'étranglement actuel des modèles linguistiques autorégressifs en termes de vitesse de génération et de coût d'inférence. Mercury Coder surmonte cette limitation grâce à l'optimisation des algorithmes, offrant ainsi aux applications d'entreprise des solutions plus efficaces et économiques.