अमेज़न के मुख्य तकनीकी अधिकारी वर्नर वोगेल्स ने हाल ही में एक व्यक्तिगत परियोजना पेश की है जिसका नाम डिस्टिल CLI है। यह ओपन-सोर्स उपकरण अमेज़न ट्रांसक्राइब और अमेज़न बेडरॉक का उपयोग करते हुए, सीधे कमांड लाइन से रिकॉर्डिंग सारांश उत्पन्न करता है। डिस्टिल CLI को वोगेल्स ने रस्ट में लिखा है, जो मीडिया फ़ाइलों को ट्रांसक्रिप्ट और संक्षिप्त करने का एक स्वचालित तरीका प्रदान करने के लिए डिज़ाइन किया गया है, और इस परियोजना की आधारभूत संरचना को प्रबंधित करने के लिए अमेज़न S3, AWS लैम्ब्डा, अमेज़न ट्रांसक्राइब, अमेज़न बेडरॉक और AWS CDK का उपयोग किया गया है।

QQ截图20240701164308.png

डिस्टिल CLI आउटपुट उदाहरण। स्रोत: ऑल थिंग्स डिस्ट्रिब्यूटेड ब्लॉग

विशेषताएँ और विशेषताएँ

डिस्टिल CLI ओपन-सोर्स उपकरण अमेज़न बेडरॉक ऑडियो समराइज़र पर आधारित है, जो रिकॉर्डिंग को प्रभावी ढंग से संसाधित और सारांश उत्पन्न कर सकता है। उपयोगकर्ता कमांड लाइन इंटरफ़ेस के माध्यम से मीडिया फ़ाइलें अपलोड कर सकते हैं और सारांश प्रक्रिया की निगरानी कर सकते हैं, जिससे बैठक की रिकॉर्डिंग और जानकारी निकालने की प्रक्रिया सरल हो जाती है। वोगेल्स ने "हैकर अटैक, टीम की बैठक को बेहतर बनाना" लेख में इस परियोजना का पहली बार उल्लेख किया, जिसमें नोट्स लेने की प्रक्रिया में सुधार के लिए इसके उपयोग पर जोर दिया।

तकनीकी लाभ

वोगेल्स ने इस परियोजना के प्रारंभिक चरणों में कुछ तकनीकी विकल्पों और अनुकूलन परिणामों को साझा किया। उन्होंने बताया कि रस्ट का उपयोग करके लैम्ब्डा फ़ंक्शंस को फिर से लिखने से ठंडी स्टार्ट गति 12 गुना बढ़ गई और मेमोरी उपयोग 73% कम हो गया। इस अनुकूलन ने पूरे रिकॉर्डिंग सारांश प्रक्रिया को अधिक प्रभावी बना दिया और S3 में लिखने की संख्या को कम कर दिया, ट्रांसक्रिप्ट और सारांश को मेमोरी में रखा गया, जिससे समग्र प्रदर्शन में सुधार हुआ।

डिस्टिल CLI का उपयोगकर्ता इंटरफ़ेस सरल है, स्थिति अपडेट प्रदान करता है और उपयोगकर्ताओं को किसी भी विफलता के बारे में सूचित करता है। यह उपकरण सारांश को टर्मिनल में आउटपुट करने और इसे वर्ड दस्तावेज़, टेक्स्ट फ़ाइल, मार्कडाउन और स्लैक संदेश के रूप में आउटपुट करने का समर्थन करता है, और अमेज़न ट्रांसक्राइब द्वारा समर्थित किसी भी भाषा के ऑडियो फ़ाइलों को संसाधित कर सकता है।

QQ截图20240701164319.png

डिस्टिल का पहला संस्करण। स्रोत: ऑल थिंग्स डिस्ट्रिब्यूटेड ब्लॉग

परियोजना की पृष्ठभूमि और उद्देश्य

वोगेल्स ने कहा कि वह अपनी नोट्स लेने की प्रक्रिया में सुधार के लिए उपकरणों और रणनीतियों की तलाश कर रहे थे। हालाँकि वह आमतौर पर नोट्स लेने के लिए कागज और कलम पसंद करते हैं, लेकिन वह यह भी मानते हैं कि तकनीक जानकारी को एकत्रित करने की क्षमता को बढ़ाने में मदद कर सकती है, विशेष रूप से उन बैठकों में जहां सक्रिय भागीदारी की आवश्यकता होती है।

वोगेल्स ने कहा कि डिस्टिल CLI को मूल रूप से टीम की आवश्यकताओं को पूरा करने के लिए विकसित किया गया था, लेकिन वह खुद को एक नई भाषा सीखने की चुनौती देना चाहते थे। यह परियोजना यह साबित करती है कि व्यावहारिक अनुभव एक प्रभावी सीखने का तरीका है, साथ ही यह तकनीक के प्रति जिज्ञासा को बनाए रखता है।

रिकॉर्डिंग ट्रांसक्रिप्शन और सारांश कार्यक्षमता को एक सरल और प्रभावी उपकरण में एकीकृत करके, डिस्टिल CLI उपयोगकर्ताओं को ऑडियो सामग्री को बेहतर ढंग से प्रबंधित और उपयोग करने के लिए एक शक्तिशाली समाधान प्रदान करता है। जैसे-जैसे परियोजना का अनुकूलन और कार्यक्षमता का विकास होता है, यह उपकरण विभिन्न टीम सहयोग और बैठक रिकॉर्डिंग परिदृश्यों में महत्वपूर्ण भूमिका निभाने की उम्मीद है।

परियोजना का पता: https://github.com/awslabs/distill-cli/