हाल ही में, गूगल ने अपने टेक्स्ट वॉटरमार्क टूल SynthID को ओपन-सोर्स करने की घोषणा की, जिसका उद्देश्य डेवलपर्स को AI द्वारा उत्पन्न टेक्स्ट की पहचान करने में मदद करना है। यह टूल अब गूगल के "जिम्मेदार जनरेटिव AI टूलकिट" के माध्यम से जनता के लिए उपयोग के लिए उपलब्ध है।
गूगल DeepMind के अनुसंधान उपाध्यक्ष Pushmeet Kohli ने कहा कि यह तकनीक अन्य जनरेटिव AI डेवलपर्स को यह पता लगाने में सक्षम बनाएगी कि टेक्स्ट आउटपुट उनके अपने बड़े भाषा मॉडल (LLM) से आया है या नहीं, जिससे वे अधिक जिम्मेदारी से AI एप्लिकेशन का निर्माण कर सकें।
आज के इस तेजी से सूचना प्रसार के युग में, वॉटरमार्क तकनीक बेहद महत्वपूर्ण हो गई है। जैसे-जैसे बड़े भाषा मॉडल का उपयोग राजनीतिक गलत सूचना फैलाने, अनुचित सामग्री उत्पन्न करने आदि के लिए किया जा रहा है, वॉटरमार्क टूल की मांग भी बढ़ रही है। उदाहरण के लिए, कैलिफोर्निया राज्य AI वॉटरमार्क को अनिवार्य आवश्यकता के रूप में विचार कर रहा है, जबकि चीन ने पिछले वर्ष से ही वॉटरमार्क का उपयोग अनिवार्य करना शुरू कर दिया था। इसके बावजूद, संबंधित तकनीक लगातार विकसित हो रही है।
गूगल की SynthID तकनीक पहली बार पिछले अगस्त में घोषित की गई थी। यह उत्पन्न टेक्स्ट, चित्र, ऑडियो और वीडियो में अदृश्य वॉटरमार्क जोड़कर AI द्वारा उत्पन्न आउटपुट की पहचान करना आसान बनाती है।
विशेष रूप से, SynthID टेक्स्ट आउटपुट में प्रत्येक उत्पन्न शब्द की संभावना को समायोजित करता है, जिससे ये संशोधन सॉफ़्टवेयर में पहचाने जा सकते हैं लेकिन मानव द्वारा नहीं देखे जा सकते। उदाहरण के लिए, जब मॉडल उत्पन्न करता है "मेरे पसंदीदा उष्णकटिबंधीय फल हैं__।", तो "आम", "लीची", "पपीता" या "दूरियन" जैसे शब्दों का चयन किया जा सकता है। प्रत्येक शब्द का एक संभावना स्कोर होता है, SynthID इन स्कोर को बिना टेक्स्ट की गुणवत्ता, सटीकता और रचनात्मकता को प्रभावित किए समायोजित करता है।
यह समायोजन पूरे उत्पन्न टेक्स्ट में लगातार किया जाता है, इसलिए एक टेक्स्ट में दस से अधिक समायोजन स्कोर हो सकते हैं, और पूरे पृष्ठ की सामग्री में सैकड़ों हो सकते हैं। अंततः, ये समायोजित संभावना स्कोर पैटर्न वॉटरमार्क का निर्माण करेंगे। गूगल ने कहा कि यह प्रणाली इसके Gemini चैटबॉट में एकीकृत की गई है, और इससे उत्पन्न टेक्स्ट की गुणवत्ता और गति पर कोई प्रभाव नहीं पड़ेगा। हालाँकि, यह छोटे टेक्स्ट, फिर से लिखी गई या अनुवादित सामग्री और तथ्यों पर आधारित प्रश्नों के उत्तर देने में कुछ चुनौतियों का सामना कर रही है।
गूगल ने एक ब्लॉग में कहा: "SynthID AI द्वारा उत्पन्न सामग्री की पहचान के लिए एक सार्वभौमिक कुंजी नहीं है, लेकिन यह अधिक विश्वसनीय AI पहचान उपकरणों के विकास के लिए एक महत्वपूर्ण आधारशिला है, जो लाखों उपयोगकर्ताओं को अधिक सूझ-बूझ से निर्णय लेने में मदद कर सकता है।"
परियोजना का प्रवेश द्वार: https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn
मुख्य बिंदु:
📜 SynthID ओपन-सोर्स है, डेवलपर्स को AI द्वारा उत्पन्न टेक्स्ट की पहचान करने में मदद करता है।
🛠️ वॉटरमार्क तकनीक गलत जानकारी और अनुचित सामग्री से निपटने में और अधिक महत्वपूर्ण हो गई है।
💡 गूगल का SynthID टेक्स्ट उत्पन्न करने की संभावना स्कोर को समायोजित कर सकता है, जिससे वॉटरमार्क का निर्माण होता है।