गूगल ने AI मल्टीमॉडल ल्यूमियर लॉन्च किया, इमेज भी वीडियो में कन्वर्ट होगी

नई दिल्ली-  अब आप आर्टिफिशियल इंटेलिजेंस (AI) की मदद से टेक्स्ट लिखकर सीधे वीडियो बना सकेंगे। इसके लिए गूगल ने अपना लेटेस्ट AI मल्टीमॉडल ल्यूमियर लॉन्च किया है। गूगल का नया AI मॉडल एक टेक्स्ट-टू-वीडियो और इमेज-टू-वीडियो मॉडल है। यह रियलिस्टिक और कई तरह के मोशन क्रिएट कर वीडियो बना सकता है। यानी इससे आप टेक्स्ट से सीधे वीडियो तो बना ही सकते हैं, साथ ही इमेज से मोशन वीडियो भी क्रिएट कर सकते हैं।

ल्यूमियर में आपको सिर्फ टेक्स्ट या फोटो का इनपुट डालना है और AI न्यूरल नेटवर्क आपको वीडियो क्रिएट करके दे देगा। यह टूल इमेज को एनिमेट करने और इनपुट इमेज या पेंटिंग के फॉर्मेट में वीडियो बनाने की भी सुविधा देता है। ये मॉडल इमेज और वीडियो में स्पेशल एनिमेशन और पेंटिंग बनाने की भी सुविधा देता है।

कैसे काम करता है लूमियर मॉडल

गूगल का नया ल्यूमियर ट्रेडिशनल वीडियो मॉडल के विपरीत एक स्पेस-टाइम यू-नेट आर्किटेक्चर को अपनाता है, जो एक ही फ्रेम के हिसाब से पूरी वीडियो प्रोड्यूस करता है। इसके विपरीत, मौजूदा AI वीडियो मॉडल एक समय में दूर के मुख्य फ्रेमों को संश्लेषित करते हैं। इनोवेशन की ये टेक्नीक अस्थायी सुपर-रिजॉल्यूशन के बाद दूर के कीफ्रेम को सिंथेसाइज्ड करने की जरुरत को खत्म कर देती है। इससे वीडियो में स्टेब्लिटी आसानी से मिल जाती है।

गूगल के रिसर्चर्स के अनुसार, टेक्स्ट-टू-वीडियो जनरेशन फ्रेमवर्क को प्री-ट्रेंड टेक्स्ट-टू-इमेज डिफ्यूजन का इस्तेमाल करके पेश किया गया है। टीम ने स्पेस-टाइम यू-नेट आर्किटेक्चर को डिप्लॉय कर के फुल फ्रेम वीडियो क्लिप जनरेट की है। इसमें स्पाटिअल और टेंपोरल मॉड्यूल को शामिल किया गया है। इससे इमेज टू वीडियो, वीडियो इनपेंटिंग और स्टाइलिश्ड जनरेशन में बढ़िया रिजल्ट मिल पाया है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here