डौबाओ बड़े मॉडल टीम की आधिकारिक सार्वजनिक खाता जानकारी के अनुसार, बीजिंग जियाओटॉन्ग विश्वविद्यालय और चीन विज्ञान और प्रौद्योगिकी विश्वविद्यालय के संयुक्त अनुसंधान में, डौबाओ बड़े मॉडल टीम द्वारा पेश किया गया “VideoWorld” वीडियो जनरेशन प्रयोगात्मक मॉडल हाल ही में औपचारिक रूप से ओपन-सोर्स किया गया है। इस मॉडल की सबसे बड़ी विशेषता यह है कि यह पारंपरिक भाषा मॉडल पर निर्भर नहीं करता है, बल्कि केवल दृश्य जानकारी के माध्यम से दुनिया को पहचान और समझ सकता है। यह ब्रेकथ्रू अनुसंधान प्रेरणा प्रोफेसर ली फेई फेई के TED व्याख्यान में उल्लेखित “बच्चे बिना भाषा के असली दुनिया को समझ सकते हैं” के सिद्धांत से मिली है।