अमेज़न के मुख्य तकनीकी अधिकारी वर्नर वोगेल्स ने हाल ही में एक व्यक्तिगत परियोजना पेश की है जिसका नाम डिस्टिल CLI है। यह ओपन-सोर्स उपकरण अमेज़न ट्रांसक्राइब और अमेज़न बेडरॉक का उपयोग करते हुए, सीधे कमांड लाइन से रिकॉर्डिंग सारांश उत्पन्न करता है। डिस्टिल CLI को वोगेल्स ने रस्ट में लिखा है, जो मीडिया फ़ाइलों को ट्रांसक्रिप्ट और संक्षिप्त करने का एक स्वचालित तरीका प्रदान करने के लिए डिज़ाइन किया गया है, और इस परियोजना की आधारभूत संरचना को प्रबंधित करने के लिए अमेज़न S3, AWS लैम्ब्डा, अमेज़न ट्रांसक्राइब, अमेज़न बेडरॉक और AWS CDK का उपयोग किया गया है।
डिस्टिल CLI आउटपुट उदाहरण। स्रोत: ऑल थिंग्स डिस्ट्रिब्यूटेड ब्लॉग
विशेषताएँ और विशेषताएँ
डिस्टिल CLI ओपन-सोर्स उपकरण अमेज़न बेडरॉक ऑडियो समराइज़र पर आधारित है, जो रिकॉर्डिंग को प्रभावी ढंग से संसाधित और सारांश उत्पन्न कर सकता है। उपयोगकर्ता कमांड लाइन इंटरफ़ेस के माध्यम से मीडिया फ़ाइलें अपलोड कर सकते हैं और सारांश प्रक्रिया की निगरानी कर सकते हैं, जिससे बैठक की रिकॉर्डिंग और जानकारी निकालने की प्रक्रिया सरल हो जाती है। वोगेल्स ने "हैकर अटैक, टीम की बैठक को बेहतर बनाना" लेख में इस परियोजना का पहली बार उल्लेख किया, जिसमें नोट्स लेने की प्रक्रिया में सुधार के लिए इसके उपयोग पर जोर दिया।
तकनीकी लाभ
वोगेल्स ने इस परियोजना के प्रारंभिक चरणों में कुछ तकनीकी विकल्पों और अनुकूलन परिणामों को साझा किया। उन्होंने बताया कि रस्ट का उपयोग करके लैम्ब्डा फ़ंक्शंस को फिर से लिखने से ठंडी स्टार्ट गति 12 गुना बढ़ गई और मेमोरी उपयोग 73% कम हो गया। इस अनुकूलन ने पूरे रिकॉर्डिंग सारांश प्रक्रिया को अधिक प्रभावी बना दिया और S3 में लिखने की संख्या को कम कर दिया, ट्रांसक्रिप्ट और सारांश को मेमोरी में रखा गया, जिससे समग्र प्रदर्शन में सुधार हुआ।
डिस्टिल CLI का उपयोगकर्ता इंटरफ़ेस सरल है, स्थिति अपडेट प्रदान करता है और उपयोगकर्ताओं को किसी भी विफलता के बारे में सूचित करता है। यह उपकरण सारांश को टर्मिनल में आउटपुट करने और इसे वर्ड दस्तावेज़, टेक्स्ट फ़ाइल, मार्कडाउन और स्लैक संदेश के रूप में आउटपुट करने का समर्थन करता है, और अमेज़न ट्रांसक्राइब द्वारा समर्थित किसी भी भाषा के ऑडियो फ़ाइलों को संसाधित कर सकता है।
डिस्टिल का पहला संस्करण। स्रोत: ऑल थिंग्स डिस्ट्रिब्यूटेड ब्लॉग
परियोजना की पृष्ठभूमि और उद्देश्य
वोगेल्स ने कहा कि वह अपनी नोट्स लेने की प्रक्रिया में सुधार के लिए उपकरणों और रणनीतियों की तलाश कर रहे थे। हालाँकि वह आमतौर पर नोट्स लेने के लिए कागज और कलम पसंद करते हैं, लेकिन वह यह भी मानते हैं कि तकनीक जानकारी को एकत्रित करने की क्षमता को बढ़ाने में मदद कर सकती है, विशेष रूप से उन बैठकों में जहां सक्रिय भागीदारी की आवश्यकता होती है।
वोगेल्स ने कहा कि डिस्टिल CLI को मूल रूप से टीम की आवश्यकताओं को पूरा करने के लिए विकसित किया गया था, लेकिन वह खुद को एक नई भाषा सीखने की चुनौती देना चाहते थे। यह परियोजना यह साबित करती है कि व्यावहारिक अनुभव एक प्रभावी सीखने का तरीका है, साथ ही यह तकनीक के प्रति जिज्ञासा को बनाए रखता है।
रिकॉर्डिंग ट्रांसक्रिप्शन और सारांश कार्यक्षमता को एक सरल और प्रभावी उपकरण में एकीकृत करके, डिस्टिल CLI उपयोगकर्ताओं को ऑडियो सामग्री को बेहतर ढंग से प्रबंधित और उपयोग करने के लिए एक शक्तिशाली समाधान प्रदान करता है। जैसे-जैसे परियोजना का अनुकूलन और कार्यक्षमता का विकास होता है, यह उपकरण विभिन्न टीम सहयोग और बैठक रिकॉर्डिंग परिदृश्यों में महत्वपूर्ण भूमिका निभाने की उम्मीद है।
परियोजना का पता: https://github.com/awslabs/distill-cli/