शांघाई एआई प्रयोगशाला और कॉर्पस डेटा संघ ने "शुशेन्ग・वानजुआन" 1.0 मल्टी-मोडल प्री-ट्रेनिंग कॉर्पस जारी किया है, जिसमें टेक्स्ट, टेक्स्ट-इमेज और वीडियो डेटा सेट शामिल हैं। यह ओपन-सोर्स कॉर्पस कुल 2TB से अधिक है, जिसे बारीकी से साफ किया गया है और डुप्लिकेट हटाए गए हैं, जिसमें विविध समामेलन, सूक्ष्म प्रसंस्करण और उपयोग में आसान और कुशल विशेषताएँ हैं। इस कॉर्पस के जारी होने से बड़े मॉडल के उपयोग और नवाचार को बढ़ावा देने में मदद मिलेगी, और बड़े मॉडल प्रौद्योगिकी की बाधाओं को कम किया जाएगा।