नई दिल्ली- अब आप आर्टिफिशियल इंटेलिजेंस (AI) की मदद से टेक्स्ट लिखकर सीधे वीडियो बना सकेंगे। इसके लिए गूगल ने अपना लेटेस्ट AI मल्टीमॉडल ल्यूमियर लॉन्च किया है। गूगल का नया AI मॉडल एक टेक्स्ट-टू-वीडियो और इमेज-टू-वीडियो मॉडल है। यह रियलिस्टिक और कई तरह के मोशन क्रिएट कर वीडियो बना सकता है। यानी इससे आप टेक्स्ट से सीधे वीडियो तो बना ही सकते हैं, साथ ही इमेज से मोशन वीडियो भी क्रिएट कर सकते हैं।
ल्यूमियर में आपको सिर्फ टेक्स्ट या फोटो का इनपुट डालना है और AI न्यूरल नेटवर्क आपको वीडियो क्रिएट करके दे देगा। यह टूल इमेज को एनिमेट करने और इनपुट इमेज या पेंटिंग के फॉर्मेट में वीडियो बनाने की भी सुविधा देता है। ये मॉडल इमेज और वीडियो में स्पेशल एनिमेशन और पेंटिंग बनाने की भी सुविधा देता है।
कैसे काम करता है लूमियर मॉडल
गूगल का नया ल्यूमियर ट्रेडिशनल वीडियो मॉडल के विपरीत एक स्पेस-टाइम यू-नेट आर्किटेक्चर को अपनाता है, जो एक ही फ्रेम के हिसाब से पूरी वीडियो प्रोड्यूस करता है। इसके विपरीत, मौजूदा AI वीडियो मॉडल एक समय में दूर के मुख्य फ्रेमों को संश्लेषित करते हैं। इनोवेशन की ये टेक्नीक अस्थायी सुपर-रिजॉल्यूशन के बाद दूर के कीफ्रेम को सिंथेसाइज्ड करने की जरुरत को खत्म कर देती है। इससे वीडियो में स्टेब्लिटी आसानी से मिल जाती है।
गूगल के रिसर्चर्स के अनुसार, टेक्स्ट-टू-वीडियो जनरेशन फ्रेमवर्क को प्री-ट्रेंड टेक्स्ट-टू-इमेज डिफ्यूजन का इस्तेमाल करके पेश किया गया है। टीम ने स्पेस-टाइम यू-नेट आर्किटेक्चर को डिप्लॉय कर के फुल फ्रेम वीडियो क्लिप जनरेट की है। इसमें स्पाटिअल और टेंपोरल मॉड्यूल को शामिल किया गया है। इससे इमेज टू वीडियो, वीडियो इनपेंटिंग और स्टाइलिश्ड जनरेशन में बढ़िया रिजल्ट मिल पाया है।