Colossal-AI ने पूर्ण Sora पुनरुत्पादन ढांचे का समाधान Open-Sora ओपन-सोर्स किया है, जो पुनरुत्पादन लागत को 46% तक कम करने का दावा करता है और मॉडल प्रशिक्षण के इनपुट अनुक्रम की लंबाई को 819K पैच तक बढ़ाता है। Sora एल्गोरिदम पुनरुत्पादन योजना Sora की तकनीकी रिपोर्ट में है, जहां Sora ने विभिन्न आकारों के वीडियो को एक छिपे हुए स्थान के समय-स्थान खंड अनुक्रम में संकुचित करने के लिए एक वीडियो संकुचन नेटवर्क का उपयोग किया है, फिर डिफ्यूजन ट्रांसफार्मर का उपयोग करके शोर हटाया गया, और अंततः वीडियो उत्पन्न करने के लिए डिकोड किया गया। Open-Sora ने Sora द्वारा उपयोग किए जाने वाले प्रशिक्षण पाइपलाइन को एक संपूर्ण Sora पुनरुत्पादन ढांचे के समाधान के रूप में संक्षिप्त किया है, जिसमें डेटा प्रसंस्करण से लेकर प्रशिक्षण और अनुमान तक की पूरी प्रक्रिया शामिल है। वर्तमान में, Open-Sora ने डेटा प्रसंस्करण से लेकर प्रशिक्षण और अनुमान तक की पूरी प्रक्रिया को कवर किया है, जिसमें गतिशील रिज़ॉल्यूशन का समर्थन, विभिन्न मॉडल संरचनाओं का समर्थन, विभिन्न वीडियो संकुचन विधियों का समर्थन, और विभिन्न समांतर प्रशिक्षण अनुकूलन का समर्थन शामिल है। प्रदर्शन के मामले में, एकल H800 SXM 8*80GB GPU पर DiT-XL/2 मॉडल के प्रदर्शन परीक्षण के उदाहरण के रूप में, 600K अनुक्रम लंबाई पर, Open-Sora की योजना बुनियादी योजना की तुलना में 40% से अधिक प्रदर्शन में सुधार और लागत में कमी दिखाती है। Open-Sora का ओपन-सोर्स पता: https://github.com/hpcaitech/Open-Sora।