वॉइसक्राफ्ट एक टोकन-भरण आधारित तंत्रिका एन्कोडर-डिकोडर भाषा मॉडल है, जो अग्रणी ध्वनि संपादन और शून्य-नमूना पाठ-से-भाषण (टीटीएस) प्रदर्शन प्रदान करता है। अपरिचित आवाज़ों के लिए, वॉइसक्राफ्ट को उस आवाज़ का क्लोन बनाने या रिकॉर्डिंग को संपादित करने के लिए केवल कुछ सेकंड के ध्वनि नमूने की आवश्यकता होती है। यह मॉडल ऑडियोबुक, ऑनलाइन वीडियो और पॉडकास्ट जैसे वास्तविक दुनिया के डेटा के लिए उपयुक्त है।