शोधकर्ताओं ने हाल ही में "FAVOR" नामक एक अभिनव तकनीक जारी की है, जो ऑडियो और दृश्य विवरणों को मिलाकर बड़े भाषा मॉडलों की वीडियो सामग्री को समझने की क्षमता को महत्वपूर्ण रूप से बढ़ाती है। यह मल्टीमोडल समर्थन तकनीक उपयोगकर्ताओं को अधिक सटीक आवश्यकता व्यक्त करने के तरीके प्रदान करती है और पैरामीटर ट्यूनिंग की अनुमति देती है, जो आर्टिफिशियल इंटेलिजेंस वीडियो समझ तकनीक के विकास को बढ़ावा देने की उम्मीद है।