Llama-3.2-90B-Vision Meta द्वारा जारी किया गया एक बहु-मोडल बड़ा भाषा मॉडल (LLM) है, जो दृश्य पहचान, छवि तर्क, छवि विवरण और छवियों से संबंधित सामान्य प्रश्नों के उत्तर देने पर केंद्रित है। यह मॉडल सामान्य उद्योग बेंचमार्क में कई मौजूदा ओपन-सोर्स और बंद बहु-मोडल मॉडलों को पार कर गया है।