Skip to content

जब AI artist को ओवरराइड कर देता है

लिखा Oleg Sidorkin, Cinevva के CTO ने

NVIDIA ने GDC में DLSS 5 को एक वादे के साथ launch किया: generative AI जो real-time में lighting, materials और shadows को फिर से बनाता है, जिससे games performance पर असर डाले बिना photorealistic दिखें। फिर लोगों ने देखा कि इसने character के चेहरों के साथ असल में क्या किया।

इंटरनेट ने इसे "yassifying" कहा। Resident Evil Requiem की Grace Ashcroft एक थकी-हारी, युद्ध में झुलसी survivor से बदलकर एक चिकने, एक-जैसे कर दिए गए चेहरे में बदल गई जो किसी अलग character जैसा दिखता था। Leon के साथ भी वही हुआ। AI ने तय कर लिया कि original art direction काफी अच्छी नहीं थी और उसे "fix" कर दिया।

Resident Evil Requiem के साथ NVIDIA का DLSS 5 reveal। visual बदलावों ने तुरंत backlash खड़ा कर दिया।

NVIDIA ने क्या भेजा और यह असल में क्या करता है

DLSS के version 1 से 4 तक upscaling technologies थीं। वे कम resolution पर render करती थीं और गायब pixels को भरने के लिए AI का इस्तेमाल करती थीं। Artists को ये पसंद थीं क्योंकि ये source image का सम्मान करती थीं। आपकी art direction बरकरार रहती थी। AI बस उसे और sharp बना देता था।

DLSS 5 मूल रूप से अलग है। यह एक video-to-video generative AI system है जो original game assets, geometry या scene data तक पहुंच के बिना काम करता है। यह render किया हुआ 2D frame और motion vectors लेता है, फिर "बेहतर" lighting, materials और detail के साथ एक नया frame बनाता है।

मुख्य शब्द है "बेहतर"। किसके फैसले के हिसाब से बेहतर? AI के। artist के नहीं।

NVIDIA ने शुरू में इसे "3D scene understanding" वाला बताया था। बाद में उन्होंने साफ किया कि यह सिर्फ 2D frame data से काम करता है। यह फर्क मायने रखता है। यह system artists ने जो बनाया उसे बेहतर नहीं कर रहा। यह एक flat image को समझकर वह बना रहा है जो उसके हिसाब से वहां होना चाहिए। जब इसे जानबूझकर रखी गई खामियों वाला कोई चेहरा मिलता है, scars, मैल, तनाव की रेखाएं, asymmetry, तो यह उन्हें चिकना करके हटा देता है क्योंकि इसका training data इन्हें "कम quality" से जोड़ता है।

यह creative control की समस्या है

52% developers जिन्होंने GDC को बताया कि उन्हें लगता है AI industry को नुकसान पहुंचा रहा है, वे सब अपनी नौकरी जाने की चिंता में नहीं हैं। उनमें से कई इस बात को लेकर चिंतित हैं कि उनका काम जब player तक पहुंचेगा तो वह कैसा दिखेगा, इस पर से उनका control खो जाएगा।

DLSS 5 इस डर को ठोस बना देता है। अब आपकी तैयार कला और player की screen के बीच की rendering pipeline में एक AI बैठा है, और वह सक्रिय रूप से आपके creative फैसलों को दोबारा लिख रहा है। जिस थके-हारे चेहरे को परफेक्ट करने में आपने हफ्ते लगाए, वह चिकना कर दिया जाता है। जिस moody lighting को आपने सावधानी से संतुलित किया, उसे ज़्यादा photorealistic बनाने के लिए "ठीक" कर दिया जाता है। आपने जो खास look चुना, उसे model जो "अच्छा" समझता है, उसमें generalize कर दिया जाता है।

Digital Foundry ने पहले एक positive preview छापा, फिर "Why We Should Have Waited With Our Coverage" शीर्षक वाला एक follow-up जारी किया। यहां तक कि वह tech press जो आमतौर पर NVIDIA की सराहना करती है, उसने भी माना कि इस release में कुछ अलग था।

Baldur's Gate 3 बनाने वाली Larian Studios ने कथित तौर पर fan backlash के बाद अपने अगले project के लिए कुछ generative rendering tools छोड़ दिए। जब एक studio जिसने अभी-अभी Game of the Year जीता है, मुफ्त rendering technology से दूर हट जाता है, तो creative control का तर्क सिर्फ theory नहीं रह जाता।

DLSS 5 बहस पर Digital Foundry का follow-up: "हमें और समय लेना चाहिए था।"

पैटर्न वही है

इसी महीने मैंने ओपन सोर्स में AI प्रदूषण पर लिखा था। पैटर्न बिल्कुल वही है। कुछ बनाना सस्ता है। कुछ अच्छा बनाना अब भी उतना ही महंगा है। यह आंकना कि कोई चीज़ अच्छी है या नहीं, अब भी उतना ही महंगा है।

ओपन सोर्स में यह AI से बने pull requests हैं जो ठीक-ठाक लगते हैं लेकिन सूक्ष्म bugs ले आते हैं। rendering में यह AI से बने frames हैं जो "बेहतर" दिखते हैं लेकिन वह नहीं हैं जो artist चाहता था। दोनों मामलों में AI सांख्यिकीय रूप से औसत निकाले गए output से इंसान के फैसले को ओवरराइड कर रहा है। दोनों मामले किसी और का समय और creative control खर्च कराते हैं।

फर्क यह है कि एक maintainer एक खराब PR को रिजेक्ट कर सकता है। एक artist DLSS 5 को रिजेक्ट नहीं कर सकता अगर NVIDIA और publisher इसे enable करने पर सहमत हो गए हों। player का GPU उनके काम को real time में दोबारा लिख रहा है, और उनकी कोई बात नहीं चलती।

मुझे लगता है आगे क्या होगा

NVIDIA fall 2026 में DLSS 5 भेजेगा। Capcom, Bethesda, Ubisoft और Warner Bros. समेत बड़े publishers पहले ही साइन कर चुके हैं। technology बेहतर होती जाएगी और "yassifying" कम साफ दिखने लगेगी। backlash शांत हो जाएगा क्योंकि लोग चीज़ों के आदी हो जाते हैं।

लेकिन नीचे छिपा सवाल नहीं जाएगा: जब आप rendering pipeline में generative AI जोड़ते हैं, तो player जो देखता है उस पर आखिरी फैसला किसका होता है? अभी, जवाब है NVIDIA का training data। यह बात हर उस इंसान को परेशान करनी चाहिए जो games को एक कला रूप के तौर पर अहमियत देता है।

यह फर्क इस बात के लिए मायने रखता है कि हम पूरी industry में AI tools के बारे में कैसे सोचते हैं। जो AI creator के इरादे की सेवा करता है, वह एक tool है। जो AI creator के इरादे को ओवरराइड करता है, वह कुछ बिल्कुल अलग है। DLSS 1 से 4 tools थे। DLSS 5 पहला mainstream उदाहरण है जहां AI hardware स्तर पर, बिना पूछे, किसी और की कला में अपना खुद का सौंदर्य-बोध वाला फैसला घुसा देता है।


संबंधित: