शो-ओ एक बहु-मोडल समझ और उत्पादन के लिए एकल ट्रांसफ़ॉर्मर मॉडल है जो छवि कैप्शनिंग, दृश्य प्रश्नोत्तर, टेक्स्ट-टू-इमेज जेनरेशन, टेक्स्ट-गाइडेड रिपेयर और एक्सटेंशन, और मिश्रित मोडल जेनरेशन को संभाल सकता है। यह मॉडल सिंगापुर नेशनल यूनिवर्सिटी की शो लैब और बाइटडांस द्वारा संयुक्त रूप से विकसित किया गया है, जो नवीनतम डीप लर्निंग तकनीक का उपयोग करता है, और विभिन्न मोडल डेटा को समझ और उत्पन्न कर सकता है, जो कृत्रिम बुद्धिमत्ता के क्षेत्र में एक बड़ी सफलता है।