Wav2Lip एक ओपन-सोर्स परियोजना है जिसका उद्देश्य गहन शिक्षण तकनीक के माध्यम से वीडियो में पात्रों के होठों और किसी भी लक्षित आवाज के बीच उच्च स्तर का समकालिकरण प्राप्त करना है। यह परियोजना पूर्ण प्रशिक्षण कोड, अनुमान कोड और पूर्व-प्रशिक्षित मॉडल प्रदान करती है, जो किसी भी पहचान, आवाज और भाषा का समर्थन करती है, जिसमें CGI चेहरे और सिंथेटिक आवाजें शामिल हैं। Wav2Lip के पीछे की तकनीक पेपर 'A Lip Sync Expert Is All You Need for Speech to Lip Generation In the Wild' पर आधारित है, जो ACM मल्टीमीडिया 2020 में प्रकाशित हुआ था। यह परियोजना एक इंटरैक्टिव प्रदर्शन और Google Colab नोटबुक भी प्रदान करती है ताकि उपयोगकर्ता जल्दी से उपयोग शुरू कर सकें। इसके अतिरिक्त, यह परियोजना कुछ नए, विश्वसनीय मूल्यांकन मानदंड और मीट्रिक भी प्रदान करती है, साथ ही कैसे इन मीट्रिक की गणना शोध पत्रों में की जाती है, इसका विवरण भी देती है।