Pika Agents ने चेहरा, आवाज़ और याददाश्त वाला रियल-टाइम वीडियो चैट लॉन्च किया
Sora के बंद होने के दो दिन बाद, Pika Labs ने आज Pika Agents जारी किया। यह प्रोडक्ट "एक क्लिप generate करो" से "एक मौजूदगी generate करो" की तरफ एक तीखा मोड़ है। हर agent का अपना चेहरा, आवाज़, व्यक्तित्व और टिकाऊ याददाश्त होती है जो Slack, Telegram, Discord, X, Notion, Figma और Google Meet के बीच बनी रहती है। एक बार आप किसी को आकार दे देते हैं, तो वह आपके साथ रहता है और सीखता है कि आपको आइडिया किस तरह पेश किए जाना पसंद है।
पहले ही दिन Pika Agents क्या कर सकते हैं, इसका एक वॉकथ्रू
PikaStream 1.0: हुड के नीचे का engine
रियल-टाइम वीडियो चैट को PikaStream 1.0 से ताकत मिलती है, जिसे Pika ने पहली बार 2 अप्रैल को दिखाया था। यह एक ही H100 पर 480p में पर्सनलाइज़्ड 24 FPS वीडियो generate करता है, और स्पीच-टू-वीडियो एंड-टू-एंड latency करीब 1.5 सेकंड रहती है। agent सिंक्रनाइज़्ड लिप-सिंक, चेहरे के भाव और जिसे Pika "भावनात्मक रूप से उपयुक्त" कहता है, उस बॉडी लैंग्वेज के साथ प्रतिक्रिया देता है। कीमत स्ट्रीम किए गए वीडियो के प्रति मिनट $0.20 है।
दिलचस्प हिस्सा इंटीग्रेशन का तरीका है। Pika कोई Pika ऐप बनाने के बजाय skills भेजता है। Google Meet skill आपको अपने "AI Self" को एक मीटिंग में एक भागीदार के तौर पर बुलाने देती है। agent कॉल में शामिल होता है, सुनता है और वीडियो में जवाब देता है। Zoom और FaceTime को अगले के तौर पर सूचीबद्ध किया गया है।
याददाश्त जो हर जगह बनी रहती है
Pika agents को एक ही इकाई के तौर पर बेच रहा है जो हर टूल में आपके साथ चलती है। Discord में आपने जिस agent को ट्रेन किया है, वह Notion में कुछ पूछने पर आपका context याद रखता है। उसे कल का चलता हुआ मज़ाक भी याद रहता है और पिछले हफ़्ते दिया गया brief भी। बार-बार होने वाले क्रिएटिव काम के लिए (एक साप्ताहिक न्यूज़लेटर कवर, बार-बार बनने वाला ब्रांड वीडियो, ऐसा एजेंसी क्लाइंट जिसकी आवाज़ आप बार-बार गलत पकड़ते हैं) यह टिकाऊपन ही असली प्रोडक्ट है।
शुरुआती यूज़र्स खास तौर पर बार-बार होने वाले कामों पर agents को ट्रेन कर रहे हैं: स्टोरीबोर्ड-से-एनिमेशन, brief-से-ad-कट, एपिसोडिक कंटेंट में किरदार की लगातार एकरूपता। लय agent संभालता है। दिशा आप देते हैं।
Agents और PikaStream समेत Pika 2026 के फीचर्स का ब्रेकडाउन
लॉन्च कैंपेन अपने आप में एक चीज़ है
Pika ने प्रोडक्शन कंपनी Ceiling Train और डायरेक्टर Josh Cohen के साथ एक लॉन्च फ़िल्म बनवाई। यह फ़िल्म "Black Mirror" वाले फ़्रेमिंग पर खूब ज़ोर देती है, जहाँ यूज़र्स अपने AI Selves को "जन्म" देते हैं और उन्हें खुला छोड़ देते हैं। यह लगातार दो दिन X पर ट्रेंड करती रही। यह एक फीचर है या एक चेतावनी, यह इस बात पर निर्भर करता है कि आप AI agent की बहस के किस तरफ़ खड़े हैं।
game और creator वर्कफ़्लो के लिए यह क्यों मायने रखता है
game स्टूडियो के लिए, टिकाऊ वीडियो agents NPC प्रोटोटाइपिंग, वॉइस डायरेक्शन और टेबल-रीड सेशन के लिए साफ़ तौर पर फ़िट बैठते हैं। राइटिंग टीम के Discord चैनल में agent को डाल दीजिए और उसे ऐसे किरदार की इन-कैनन आवाज़ की तरह बरतिए जिसे आप डेवलप कर रहे हैं। creator वर्कफ़्लो के लिए, एक-आदमी-की-एजेंसी वाला दाँव असली है: एक ऑपरेटर, तीन क्लाइंट पर ट्रेन किए गए तीन agents, सब Slack और Meet में एक साथ चलते हुए।
यूनिट इकोनॉमिक्स भी ऐसी टिकाऊ दिखती है जैसी Sora की नहीं थी। PikaStream की प्रति-स्ट्रीम H100 लागत $0.20 प्रति मिनट पर मौजूदा GPU कीमतों के हिसाब से करीब-करीब मार्जिन-पॉज़िटिव है। मॉडल वेट्स नहीं, बल्कि agent के व्यक्तित्व का डेटा ही वह जगह है जहाँ खाई बनी रहती है।
हम सबसे पहले क्या टेस्ट करेंगे
अगर आप एक छोटी टीम हैं, तो सबसे ज़्यादा फ़ायदे वाला प्रयोग शायद Google Meet skill है। अपने प्रोडक्ट पोज़िशनिंग पर एक agent को ट्रेन कीजिए, उसे अपने अगले बाहरी पिच में एक खामोश भागीदार के तौर पर बुलाइए, फिर उससे बातचीत का सारांश आपको वापस सुनवाइए। यह AI मीटिंग नोट-टेकर वाला पैटर्न ही है, बस इसमें एक चेहरा भी है जिसे सामने वाला देख सके और जिस पर प्रतिक्रिया दे सके।
बड़े स्टूडियो के लिए ज़्यादा दिलचस्प टेस्ट multi-agent है। एक ही चैनल में दो agents, हर एक किसी ब्रांड के अलग-अलग हिस्सों पर ट्रेन किया हुआ, किसी क्रिएटिव चॉइस पर बहस करते हुए जबकि एक इंसान मॉडरेट करता है। यह वही वर्कफ़्लो आकार है जो हर जगह टिकाऊ याददाश्त आने से पहले मुमकिन नहीं था।