व्हिस्पर-NER एक नवीन मॉडल है जो ध्वनि लिप्यंतरण और इकाई पहचान को एक साथ करने की अनुमति देता है। यह मॉडल खुले प्रकार की नामित इकाई पहचान (NER) का समर्थन करता है, जो विविध और लगातार विकसित हो रही इकाइयों को पहचान सकता है। व्हिस्पर-NER का उद्देश्य स्वचालित भाषण पहचान (ASR) और NER डाउनस्ट्रीम कार्यों के लिए एक शक्तिशाली आधार मॉडल के रूप में कार्य करना है, और प्रदर्शन को बेहतर बनाने के लिए इसे विशिष्ट डेटासेट पर ठीक-ठाक किया जा सकता है।