ज़्यूरिख़ फेडरल इंस्टीट्यूट ऑफ़ टेक्नोलॉजी के शोधकर्ताओं ने स्टेबल डिफ्यूज़न ओपन-सोर्स मैरिगोल्ड मॉडल में सुधार करके एकल-नज़र गहराई अनुमान में नवाचार किया है। इस मॉडल ने बिना किसी वास्तविक गहराई छवि प्रशिक्षण डेटा की आवश्यकता के, डीनॉइज़ U-Net मॉड्यूल को फाइन-ट्यून करके उत्कृष्ट प्रदर्शन प्राप्त किया। सिंथेटिक डेटा के माध्यम से प्रशिक्षण के द्वारा, मैरिगोल्ड विभिन्न दृश्यों को सीखने में सक्षम है, जिससे इसे अप्रयुक्त डेटा सेट पर सामान्यीकरण क्षमता में वृद्धि होती है। इसका मुख्य तकनीकी विचार स्टेबल डिफ्यूज़न के पूर्व ज्ञान का उपयोग करना है, जो एफ़ाइन इनवेरिएंट गहराई अनुमान विधि को अपनाता है, जिससे कैमरे के आंतरिक पैरामीटर की अनिश्चितता के कारण होने वाली गहराई अनुमान त्रुटियों को समाप्त किया जा सके।
ओपन-सोर्स Marigold मॉडल: स्टेबल डिफ्यूजन का मॉडिफाइड मोनोस्कोपिक गहराई अनुमान नवाचार

AIGC开放社区
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।