Skip to content

AI के दौर में सहज समझ वाला दिमाग

लिखा है Mariana Muntean ने, Cinevva की CEO

Mariana Muntean with classmates during a 48 hours game jam in Houston 2018ह्यूस्टन में 2018 के एक 48 घंटे के game jam के दौरान सहपाठियों के साथ

AI ने मूल रूप से कच्चे logic और गणना करने की क्षमता को एक commodity बना दिया है। जिन हुनरों की हम पहले पूजा करते थे, mental math, pattern को पहचानना, जटिल algorithms को घिसते हुए हल करना, अब वह सब AI करता है। तेज़। बेहतर। बिना थके। क्या हमें अब भी यह जानना ज़रूरी है? बिलकुल, पर नज़रिया बदल जाता है। अब हर किसी को एक नए दौर के हिसाब से ढलना होगा - सहज interaction और नतीजों का दौर।

NVIDIA के CEO Jensen Huang के मुताबिक, अब जो चीज़ मायने रखती है वह है एक "vibe" को भाँप लेने की और data सामने आने से पहले ही मोड़ के पार देख लेने की क्षमता। technical समझ और गहरी empathy का मेल। वह सहज समझ जिसे silicon छू भी नहीं सकता।

उसकी जैसी साख रखने वाले किसी इंसान को मैंने पहले कभी ऐसी बात कहते नहीं सुना जो मेरी पूरी ज़िंदगी की राह को इतने सीधे तौर पर सही ठहरा दे।

SAT और वह सिस्टम जो मेरे लिए बना ही नहीं था

कुछ साल पहले मैंने SAT दी और फ़ेल हो गई। मुझे इस पर गर्व नहीं है, पर मैंने दोबारा कोशिश भी नहीं की। पूरी बात में कुछ बुनियादी तौर पर गलत लग रहा था, और लोग चाहे जितना कहें कि बस और मेहनत करो और दोबारा दे दो, मैं उस एहसास से पीछा नहीं छुड़ा पाई।

पीछे मुड़कर देखती हूँ तो लगता है मैं सही थी।

SAT अमेरिकी शिक्षा व्यवस्था के लिए बनाई गई है। यह बात ज़ाहिर सी लगती है, पर इसके असर बहुत गहरे हैं। अमेरिकी हाई स्कूल खास तरह के pattern, सवालों के प्रकार, और समस्याओं को रखने के तरीकों के हिसाब से पढ़ाते हैं। बच्चे प्राथमिक स्कूल से ही उसी अंदाज़ की standardized testing में पगे हुए बड़े होते हैं। जब तक वे SAT तक पहुँचते हैं, उन्होंने उस लय को अपने भीतर उतार लिया होता है।

International students के पास यह फ़ायदा नहीं होता। हम अलग शैक्षिक सोच वाली व्यवस्थाओं से आते हैं। यूरोपीय स्कूल अक्सर चौड़ाई से ज़्यादा गहराई पर, multiple choice से ज़्यादा निबंध-आधारित परीक्षा पर, bubble sheets से ज़्यादा मौखिक परीक्षा पर ज़ोर देते हैं। एशियाई व्यवस्थाओं की अपनी standardized tests हैं, पर वे अलग चीज़ों को अलग तरीकों से मापती हैं। दक्षिण अमेरिकी, अफ़्रीकी, मध्य पूर्वी शैक्षिक परंपराओं की हर एक की अपनी समझ है।

जब आप एक international student को SAT में डालते हैं, तो आप सिर्फ़ उसका ज्ञान नहीं जाँच रहे होते। आप यह जाँच रहे होते हैं कि वह एक पराई testing संस्कृति के साथ कितनी तेज़ी से ढल सकता है, और साथ-साथ विषय पर अपनी पकड़ भी दिखा सकता है। आप शैक्षिक क्षमता जितनी ही सांस्कृतिक रवानगी भी जाँच रहे होते हैं।

मुझसे उम्मीद की गई कि मैं एक गर्मी की छुट्टियों में इसकी तैयारी करूँ और इसमें छा जाऊँ। एक पूरी testing संस्कृति सीखूँ, अपनी ही शैक्षिक सहज समझ को भुला दूँ, और उस स्तर पर performance दूँ जो अमेरिकी admissions अधिकारियों को प्रभावित कर दे। और यह सब बस कुछ महीनों में।

मैंने ऐसा न करना चुना।

जब आप जवान होते हैं, तो आप अलग तरीकों से होशियार होते हैं। सहज तरीकों से। मैं अपने लिए एक राह बना रही थी, भले उस समय मैं ठीक-ठीक यह न बता पाती कि क्यों। मेरे भीतर कुछ जानता था कि यह सिस्टम मेरा नहीं है।

इसके बजाय रचनात्मक धागे का पीछा करना

मैंने game development और design पढ़ा क्योंकि मुझे यह विचार पसंद था कि creativity और visual effects का इस्तेमाल करके ऐसी virtual दुनियाएँ बनाई जाएँ जिनमें लोग खेल सकें और घुलमिल सकें। मुझे art और technology का, कहानी कहने और interactivity का मेल बहुत भाता था।

जो मैंने पाया उसने मुझे चौंका दिया।

Games के लिए गंभीर technical गहराई चाहिए। Physics simulations, collision detection, vector math, lighting calculations, optimization। यह मैं पहले से जानती थी। math और engineering game development में रुकावट नहीं हैं। वे उसी का हिस्सा हैं जो games को चलाती है।

समस्या रचनात्मक vision और उसे असल में बनाने के बीच की खाई थी। industry पर हावी engines और tools engineers ने engineers के लिए डिज़ाइन किए थे। सब कुछ "ifs" और "thens" और node-based blueprints पर चलता था। आपको एक vortex effect चाहिए? shader programming सीखो। कोई खास lighting वाला माहौल? material graphs में घुसो। ऐसी character movement जो सही महसूस हो? character controller या physics parameters को घंटों debug करो।

अगर आप एक visual इंसान हैं, अगर आप चटख रंगों और चलती तस्वीरों में सोचते हैं, अगर विचार आपके पास आवाज़, बनावट और भावनात्मक वज़न के साथ पूरे-पूरे दृश्यों की तरह आते हैं, तो उनमें से कुछ भी बनाने से पहले आपको यह सब technical भाषा में अनुवाद करना पड़ता था। आप अपने दिमाग में एक दुनिया देखते हैं, lighting और माहौल और किरदारों के अंतरिक्ष में चलने के तरीके समेत मुकम्मल। फिर आप अपने computer पर बैठते हैं और अगले छह घंटे यह debug करने में बिताते हैं कि आपका किरदार फ़र्श के पार नीचे क्यों गिर जाता है।

technical बुनियाद मायने रखती है। पर tools ने creators को उस जटिलता को अलग करने के बजाय implementation की बारीकियों में जीने पर मजबूर कर दिया। game बनाना एक कहानी कहने या ऐसी फ़िल्म डायरेक्ट करने जैसा लगना चाहिए जिसमें लोग हिस्सा ले सकें। यही इस माध्यम का जादू है। इसके बजाय यह ऐसा लगता था जैसे शुरुआत करने से पहले ही आपको एक engineering परीक्षा देनी हो।

फ़िल्म डायरेक्टर अपना vision व्यक्त करने से पहले बरसों physics engines सीखने में नहीं बिताते। उन्हें एक budget और एक टीम मिलती है जो technical अमल को संभालती है। पर indie game development में आपके पास शायद ही कभी budget होता है। आपके पास होता है वक़्त और tools तक पहुँच। और अगर आप technical इंसान हैं, तो आप एक ज़बरदस्त game बना सकते हैं। पर तभी अगर।

इसी तरह हमें Limbo जैसे titles मिले, जो एक छोटी टीम ने एक अकेले कलात्मक vision और उसे अमल में लाने की technical काबिलियत के साथ बनाया। या Undertale, जो काफ़ी हद तक एक ही इंसान ने बनाया जिसके पास संयोग से रचनात्मक सहज समझ और programming क्षमता का सही मेल था। या Stardew Valley, जहाँ Eric Barone ने pixel art से लेकर music composition और C# programming तक सब कुछ खुद को सिखाने में बरसों लगाए।

ये games भारी मुश्किलों के बावजूद कामयाब हुए। पर हर एक Limbo के बदले ऐसे लाखों रचनात्मक vision मरे जिन्हें इसलिए दम तोड़ना पड़ा क्योंकि tools ने ऐसी technical रवानगी माँगी जो उनके creators दे नहीं सकते थे। 3% से भी कम indie game developers कभी सार्थक कामयाबी हासिल कर पाते हैं। न जाने कितने शानदार games कभी बने ही नहीं क्योंकि उनके creators "ifs" और "thens" की दीवार से टकराए और हार मान गए।

प्रवेश की रुकावट creativity नहीं थी। वह tools के भीतर ही बना हुआ technical gatekeeping था।

जो होना चाहिए था, उसे बनाना

तो 5 साल पहले मैंने कुछ अलग बनाना शुरू किया।

बात सीधी सी थी: game development किसी भी रचनात्मक vision रखने वाले इंसान के लिए सुलभ होना चाहिए। interactive media के ज़रिए खुद को व्यक्त करने के लिए आपको computer science की डिग्री की ज़रूरत नहीं होनी चाहिए। tools को इस हिसाब से ढलना चाहिए कि रचनात्मक लोग असल में कैसे सोचते हैं, न कि इसका उल्टा।

Sequoia, Pear, Draper और दर्जनों दूसरी firms के VCs ने मुझसे कहा कि यह काम नहीं करेगा। यह B2C है। बाज़ार है ही नहीं। Indies किसी चीज़ के पैसे नहीं देते। आप काबिलियत की कुर्बानी दिए बिना game development को आसान नहीं बना सकते। Gamers जटिल games चाहते हैं, और जटिल games के लिए जटिल tools चाहिए। बाज़ार के विश्लेषण के लिबास में लिपटे लाखों बहाने।

लोगों ने मुझसे कहा कि मैं पागल हूँ। शायद थी भी। पर मैं बार-बार उसी सवाल पर लौट आती: रचनात्मक अभिव्यक्ति के लिए करोड़ों डॉलर के budget एक ज़रूरी शर्त क्यों हों? फ़िल्म डायरेक्टर और मशहूर game producer के पास टीमें और संसाधन होते हैं। बाक़ी सबको एक code editor और एक दुआ मिलती है। मैं वह चीज़ बनाना चाहती थी जो उस खाई को पाट दे। आप बताते हैं कि आप क्या चाहते हैं, और वह आपकी आँखों के सामने हो जाता है। मेरा कण-कण जानता था कि यह सही है। मैं इसे अपने शरीर की हर कोशिका में महसूस कर सकती थी।

आज हज़ारों लोग रोज़ Cinevva का इस्तेमाल 3D game assets, games, music, levels और experiences के लिए करते हैं। अब तक बने projects पर लाखों views। हर एक दिन के साथ बढ़ता हुआ। Sand Hill Road को दी जाने वाली दो मिनट की pitch ठीक "मैं SAT में फ़ेल हो गई पर मेरी सहज समझ पर भरोसा करो" का format तो नहीं है।

सहज समझ का असल में क्या मतलब है

Huang सिर्फ़ कोई दार्शनिक बात नहीं कह रहे थे। वे एक असली बदलाव की बात कर रहे थे कि किसे कीमती intelligence माना जाए।

दशकों तक हमने गलत चीज़ों के लिए optimize किया। हमने ऐसी शिक्षा व्यवस्थाएँ बनाईं जो रटने और गणना करने को इनाम देती थीं। हमने ऐसी standardized tests डिज़ाइन कीं जो पहले देखी हुई समस्याओं से pattern-matching को मापती थीं। हमने लोगों को ऐसी credentials के आधार पर भर्ती किया जो साबित करती थीं कि वे चार साल के शैक्षिक gatekeeping में टिक सकते हैं। AI ने बस यह सब कम खास बना दिया।

AI जो नहीं कर सकता, कम से कम अभी तक, वह है यह भाँपना कि क्या कमी है। यह महसूस करना कि कुछ गड़बड़ है। यह सहज समझ लेना कि लोगों को क्या चाहिए, इससे पहले कि वे खुद उसे बता पाएँ। माहौल को पढ़ लेना। ऐसे संदर्भ को समझना जो किसी dataset में दर्ज नहीं है।

मैंने अपना वक़्त, अपना international जीवन का अनुभव, पैसा, और सहज समझ Cinevva बनाने में उँडेल दी। यह ऐसा मेल है जो college में पाना मुश्किल है। SAT में जिसे जाँचना मुश्किल है। किसी भी ऐसे credential सिस्टम में जिसे पकड़ना मुश्किल है जो AI के कच्ची cognitive ताकत को आम बनाने से पहले डिज़ाइन हुआ था।

सोलह या बीस साल पहले, computer scientists ने तय किया कि tools कैसे दिखने और कैसे काम करने चाहिए। उन्होंने अपने लिए बनाया, उन लोगों के लिए जो उनकी तरह सोचते थे। हम बाक़ी सबसे उम्मीद की गई कि हम ढल जाएँ। वह दौर खत्म हो रहा है। आगे जो आने वाला है उसे वही लोग गढ़ेंगे जो समझते हैं कि इंसान असल में क्या चाहते हैं। जो महसूस कर सकते हैं कि कब कुछ गलत है और कब कुछ सही। जो technical सुंदरता के बजाय लोगों के लिए बनाते हैं।

मैंने अपने भीतर की एक चीज़ पर भरोसा किया जिसे सिस्टम ने बेकार बताया था। और मैं सही थी।


इससे जुड़ा हुआ: