पीक लाब्स, स्टैनफोर्ड और पीक लाब्स ने मिलकर एक नया ओपन-सोर्स टेक्स्ट-टू-इमेज फ्रेमवर्क RPG लॉन्च किया है, जो मल्टी-मोडल LLM की क्षमताओं का उपयोग करके टेक्स्ट-टू-इमेज की दो बड़ी चुनौतियों को सफलतापूर्वक हल करता है। यह फ्रेमवर्क टेक्स्ट प्रॉम्प्ट को विभाजित करने, इमेज स्पेस को विभाजित करने, स्वतंत्र रूप से सब-रीजन इमेज बनाने जैसी मुख्य रणनीतियों के माध्यम से महत्वपूर्ण शोध परिणाम प्राप्त करता है, जो टेक्स्ट-टू-इमेज क्षेत्र में एक नया突破 लाता है।
बीजिंग विश्वविद्यालय और स्टैनफोर्ड ने Pika के साथ मिलकर RPG ढांचा लॉन्च किया, चित्र-से-लेख अनुसंधान में नई सफलता का समर्थन किया

新智元
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।