Google I/O 2026: Gemini Omni ने Veo 4 की जगह ली और हर जगह आ गया
Google I/O आज उस सवाल के जवाब से शुरू हुआ जो सब पूछ रहे थे: हाँ, एक नया वीडियो मॉडल है, नहीं, इसका नाम Veo 4 नहीं है। मॉडल है Gemini Omni, और यह रीब्रैंड ही असली रणनीति है। Google वीडियो, ऑडियो, इमेज और टेक्स्ट जनरेशन को Gemini नाम के नीचे एक ही यूनिफाइड मॉडल में समेट रहा है। Veo और Imagen अलग प्रोडक्ट लाइनों के तौर पर अब इसी में मिला दिए गए हैं।
Demis Hassabis ने I/O 2026 keynote में Gemini Omni पेश किया
Gemini Omni असल में क्या है
Omni टेक्स्ट, इमेज, ऑडियो और वीडियो के किसी भी कॉम्बिनेशन को इनपुट के तौर पर लेता है और Gemini के वर्ल्ड नॉलेज पर आधारित हाई-क्वालिटी वीडियो आउटपुट देता है। यह मॉडल बातचीत के ज़रिए एडिट करता है: एक क्लिप अपलोड करो, फ्रेमिंग घुमाने को कहो, कोई एलिमेंट जोड़ो, लाइटिंग बदलो, एक्टर के कपड़े बदल दो। पाइपलाइन यूनिफाइड है, यानी एक ही मॉडल एक ही पास में जनरेशन, एडिटिंग और कंटिन्यूएशन संभालता है।
डे-वन डिस्ट्रिब्यूशन काफी आक्रामक है। Gemini Omni Flash अभी Gemini ऐप, Google Flow और YouTube Shorts में AI Plus, Pro और Ultra सब्सक्राइबर्स के लिए दुनिया भर में लाइव है। यह Google की किसी भी पिछली AI वीडियो लॉन्च से कहीं बड़ा सरफेस है, और यह तीन हफ्ते पहले हुए Sora शटडाउन का सीधा जवाब है। Google पक्का कर रहा है कि Sora ने जिस ऑडियंस को छोड़ा, उसके पास तुरंत एक Google-ओन्ड ठिकाना मौजूद हो।
तुलना कैसी है
Kling 3.0 के मुकाबले Gemini Omni की सबसे बड़ी खासियत मल्टीमॉडल इनपुट है। Kling की ताकत मल्टी-शॉट कंटिन्युइटी और 4K आउटपुट है, जबकि Omni की ताकत है रेफरेंस को अलग-अलग मॉडैलिटी में आज़ादी से मिलाने की क्षमता (एक वॉइस क्लिप + एक रेफरेंस इमेज + एक prompt + एक गाइड वीडियो, सबको मिलाकर एक आउटपुट)।
यूनिफाइड-मॉडल वाला तरीका एडिटिंग वर्कफ्लो को भी बदल देता है। जहाँ Kling और Runway एडिटिंग को एक अलग मॉडल पास मानते हैं (जो आम तौर पर धीमा और महँगा होता है), वहीं Omni एडिट उसी diffusion पास में करता है जिसमें जनरेशन होता है। व्यवहार में इसका मतलब है कि इटरेशन ट्रेडिशनल वीडियो टूल्स के बजाय टेक्स्ट चैट जैसा महसूस होता है।
keynote स्टेज पर Pro टियर की कीमत की घोषणा नहीं हुई, लेकिन Gemini ऐप के ज़रिए रोल आउट हो रहा Flash वैरिएंट इसका मतलब है कि ज़्यादातर सब्सक्राइबर्स को अपने मौजूदा टियर के ज़रिए मुफ्त एक्सेस मिल जाता है। यह अकेला ही AI वीडियो मार्केट का एक बड़ा हिस्सा Google की तरफ खींच लेगा।
सबसे चौंकाने वाले Gemini Omni डेमो का स्वतंत्र रीकैप
Gemini 3.5 Flash और Google Antigravity
बिल्डर्स के लिए दो और घोषणाएँ मायने रखती हैं। Gemini 3.5 Flash नया मिड-टियर मॉडल है, और बताया जा रहा है कि यह coding और एजेंटिक बेंचमार्क पर Gemini 3.1 Pro से बेहतर परफॉर्म करता है, वो भी Flash-टियर की स्पीड और कीमत पर चलते हुए। आज Gemini को कॉल करने वाली किसी भी ऐप के लिए यह माइग्रेशन सीधा फायदा है।
Google Antigravity Google का एजेंट-फर्स्ट डेवलपमेंट प्लेटफॉर्म है। इसका दावा यह है कि डेवलपर्स को कोड लिखने में मदद करने वाले टूल बनाने के बजाय, Antigravity ऐसे एजेंट देता है जो डेवलपर्स को काम करने में मदद करते हैं, और वो भी Google के प्रोडक्ट सरफेस (Search, Workspace, Cloud और नया Gemini Spark असिस्टेंट) पर। इसे सीधे Anthropic के Claude के computer use और OpenAI के GPT-आधारित एजेंट स्टैक के खिलाफ रखा गया है।
Android XR glasses प्रीव्यू भी था, जो सच में दिलचस्प है लेकिन game और क्रिएटर वर्कफ्लो के लिए मायने रखने में अभी एक साल जल्दी है।
AI वीडियो मार्केट के लिए इसका क्या मतलब है
आज तीन चीज़ें बदलती हैं।
पहली, "कई स्पेशलाइज़्ड मॉडल" वाला पैटर्न जिसने 2024 और 2025 को परिभाषित किया (एक टेक्स्ट के लिए, एक इमेज के लिए, एक वीडियो के लिए, एक ऑडियो के लिए) उसे उन्हीं लैब्स में से एक खुलकर खत्म कर रहा है जिसने उसे गढ़ने में मदद की थी। यह टिकेगा या नहीं, यह इस पर निर्भर करता है कि Omni का यूनिफाइड आउटपुट क्वालिटी सिर्फ डेमो में नहीं बल्कि असल इस्तेमाल में सभी मॉडैलिटी में टिकता है या नहीं।
दूसरी, डिस्ट्रिब्यूशन का खाई और चौड़ी हो गई। Sora इसलिए खत्म हुआ क्योंकि वो तेज़ी से एक अरब यूज़र्स तक नहीं पहुँच पाया। Omni डे वन पर ही Gemini ऐप, Google Flow और YouTube Shorts से शुरू होता है। यहीं अरबों लोग पहले से वीडियो बनाते और देखते हैं।
तीसरी, ओपन-सोर्स और कीमत में मुकाबला करने वाले मॉडल (Kling $0.07-0.14/सेकंड पर, LTX-2 ओपन-वेट्स, Wan2.2) एक दिलचस्प पोज़िशन में आ जाते हैं। अगर Google का बंडल किया ऑफर "आपके $20/महीने वाले Gemini सब्सक्रिप्शन के साथ मुफ्त" है, तो मुकाबला करने की जगहें बस दो रह जाती हैं: या तो ऊपर (गहरे कंट्रोल वाले प्रो टूल) या नीचे (ओपन-सोर्स सेल्फ-होस्टेड)।
हम सबसे पहले क्या टेस्ट करेंगे
क्रिएटर टूल बनाने वालों के लिए तुरंत का सवाल यह है कि क्या Omni API I/O डेवलपर डे पर आता है, कीमत कैसी दिखती है, और रेट लिमिट क्या हैं। मार्केटिंग सरफेस (Gemini ऐप, Flow, Shorts) Google तक सीमित है। API ही Omni को अपने प्रोडक्ट में जोड़ने का इकलौता रास्ता है। ये डिटेल्स आते ही हम इस पोस्ट को अपडेट करेंगे।
खास तौर पर game स्टूडियो के लिए, मल्टी-शॉट कंसिस्टेंसी वाली बात पर नज़र रखने लायक है। अगर Omni किसी किरदार को कट्स के बीच उसी तरह बनाए रख सकता है जैसे Kling 3.0 रख सकता है, लेकिन साथ में बीच-धारा एडिट करने लायक कंट्रोल के साथ, तो वर्टिकल-स्लाइस ट्रेलर के लिए सिनेमैटिक प्रोटोटाइपिंग काफी सस्ती हो जाती है।