ऑडियो2फोटोरियल एक ओपन-सोर्स प्रोजेक्ट है जो ऑडियो से फोटो-स्तरीय यथार्थवादी अवतार उत्पन्न करता है। इसमें पाइथोरच कार्यान्वयन शामिल है जो ऑडियो से बातचीत में मानव छवि को संश्लेषित कर सकता है। इस प्रोजेक्ट में प्रशिक्षण कोड, परीक्षण कोड, पूर्व-प्रशिक्षित गति मॉडल और डेटासेट तक पहुँच प्रदान की गई है। इसके मॉडल में चेहरे का प्रसार मॉडल, शरीर का प्रसार मॉडल, शरीर का VQ VAE मॉडल और शरीर-निर्देशित ट्रांसफार्मर मॉडल शामिल हैं। यह प्रोजेक्ट शोधकर्ताओं और डेवलपर्स को अपने स्वयं के मॉडल को प्रशिक्षित करने और उच्च-गुणवत्ता वाले यथार्थवादी अवतार को संश्लेषित करने के लिए सक्षम बनाता है।