एक शक्तिशाली कृत्रिम बुद्धिमत्ता मॉडल जो पिछले सप्ताह एक डेवलपर प्लेटफ़ॉर्म पर गुमनाम रूप से दिखाई दिया, ने अटकलें लगाईं कि चीनी स्टार्टअप डीपसीक आधिकारिक लॉन्च से पहले चुपचाप अपनी अगली पीढ़ी की प्रणाली का परीक्षण कर सकता है।
हंटर अल्फ़ा नामक मुफ़्त मॉडल, 11 मार्च को एआई गेटवे प्लेटफ़ॉर्म ओपनराउटर पर बिना किसी डेवलपर के आरोप के सामने आया और बाद में प्लेटफ़ॉर्म द्वारा इसे “स्टील्थ मॉडल” के रूप में वर्णित किया गया।
रॉयटर्स द्वारा किए गए परीक्षणों के दौरान, हंटर अल्फा चैटबॉट ने खुद को “मुख्य रूप से चीनी भाषा में प्रशिक्षित एक चीनी एआई मॉडल” के रूप में वर्णित किया और कहा कि इसका प्रशिक्षण डेटा मई 2025 तक बढ़ा दिया गया है, वही ज्ञान कटऑफ बिंदु डीपसीक के स्वयं के चैटबॉट द्वारा रिपोर्ट किया गया है।
हालाँकि, जब इसके निर्माता के बारे में पूछा गया, तो सिस्टम ने इसके डेवलपर की पहचान करने से इनकार कर दिया।
चैटबॉट ने कहा, “मैं केवल अपना नाम, अपना पैरामीटर स्केल और अपनी संदर्भ विंडो लंबाई जानता हूं।”
न तो डीपसीक और न ही ओपनराउटर ने मॉडल के निर्माता की पहचान की है और उन्होंने टिप्पणी के अनुरोधों का जवाब नहीं दिया।
हंटर अल्फा का प्रोफाइल पेज इसे 1-ट्रिलियन-पैरामीटर मॉडल के रूप में वर्णित करता है, जिसका अर्थ है कि इसे लगभग एक ट्रिलियन समायोज्य मूल्यों का उपयोग करके प्रशिक्षित किया गया था जो यह निर्धारित करता है कि सिस्टम भाषा को कैसे संसाधित करता है और प्रतिक्रियाएं उत्पन्न करता है। अधिक पैरामीटर वाले मॉडल को संचालित करने के लिए आमतौर पर काफी अधिक कंप्यूटिंग शक्ति की आवश्यकता होती है।
इस विज्ञापन के नीचे कहानी जारी है
सिस्टम दस लाख टोकन तक की एक संदर्भ विंडो का भी विज्ञापन करता है, जो इस बात का माप है कि एक एआई मॉडल एक इंटरैक्शन के दौरान कितना टेक्स्ट प्रोसेस कर सकता है या याद रख सकता है। एक टोकन मोटे तौर पर पाठ के एक छोटे टुकड़े से मेल खाता है, जैसे कि किसी शब्द का हिस्सा।
एआई एजेंट सिस्टम बनाने वाले इंजीनियर नबील हाउम ने कहा, “जो संयोजन सामने आया वह हंटर अल्फा का 1 मिलियन टोकन संदर्भ था जो तर्क क्षमता और मुफ्त पहुंच के साथ जोड़ा गया था।”
उन्होंने कहा, “उस संदर्भ विंडो वाले अधिकांश फ्रंटियर मॉडल बड़े पैमाने पर वास्तविक लागत के साथ आते हैं।”
वे विशिष्टताएं डीपसीक के अगली पीढ़ी के वी4 मॉडल के लिए स्थानीय मीडिया में अपेक्षाओं से मिलती जुलती हैं, जिसके बारे में चीनी आउटलेट्स ने बताया है कि यह अप्रैल की शुरुआत में लॉन्च हो सकता है। डीपसीक, अपने कई चीनी प्रतिस्पर्धियों की तरह, अच्छी तरह से वित्त पोषित है, हालांकि इसकी एक असामान्य संरचना है क्योंकि इसकी मूल कंपनी एक तकनीकी समूह के बजाय एक मात्रात्मक हेज फंड है।
इस विज्ञापन के नीचे कहानी जारी है
हालांकि ओवरलैप कोई सीधा संबंध स्थापित नहीं करता है, लेकिन इसने डेवलपर्स के बीच अटकलों को तेज कर दिया है कि अनाम सिस्टम डीपसीक द्वारा आगामी रिलीज का प्रारंभिक परीक्षण संस्करण हो सकता है।
एआई इंजीनियर डेनियल ड्यूहर्स्ट ने कहा, “विचार श्रृंखला का पैटर्न शायद सबसे मजबूत संकेत है,” एआई इंजीनियर ने मॉडल के जारी होने के बाद उसका विश्लेषण करते हुए कहा कि एआई मॉडल कैसे काम करता है।
“तर्क शैली को छिपाना कठिन है और यह दर्शाता है कि एक मॉडल को कैसे प्रशिक्षित किया गया था।”
उन्होंने कहा कि हंटर अल्फा का पैमाना और मेमोरी क्षमता उन विशिष्टताओं से भी मेल खाती है जो इस साल की शुरुआत से डीपसीक वी4 के लिए प्रसारित हुई हैं।
इस विज्ञापन के नीचे कहानी जारी है
फिर भी, कुछ डेवलपर्स ने आगाह किया कि मॉडल को डीपसीक से जोड़ने वाले सबूत अनिर्णायक थे।
“मेरे विश्लेषण से पता चलता है कि हंटर अल्फा संभवतः डीपसीक वी4 नहीं है,” उमुर ओज़कुल ने कहा, जो स्वतंत्र एआई बेंचमार्क परीक्षण चलाते हैं, डीपसीक के मौजूदा सिस्टम के साथ तुलना करने पर टोकन-संबंधित व्यवहार और वास्तुशिल्प पैटर्न में अंतर का हवाला देते हुए।
उन्होंने कहा कि विज्ञापित समय और क्षमताओं को देखते हुए मॉडल को डीपसीक से जोड़ने की अटकलें समझ में आती हैं।
डेवलपर परीक्षण
अनाम मॉडल लॉन्च असामान्य नहीं हैं, क्योंकि ओपनराउटर जैसे प्लेटफ़ॉर्म डेवलपर्स को एक ही इंटरफ़ेस के माध्यम से दर्जनों एआई मॉडल के लिए प्रश्न भेजने की अनुमति देते हैं, जिससे वे नए सिस्टम के लिए एक लोकप्रिय परीक्षण मैदान बन जाते हैं।
इस विज्ञापन के नीचे कहानी जारी है
पोनी अल्फा नामक एक गुमनाम मॉडल फरवरी में ओपनराउटर पर दिखाई दिया, जिसके पांच दिन बाद चीनी फर्म जिपू एआई ने पुष्टि की कि यह उसके जीएलएम-5 सिस्टम का हिस्सा था।
हंटर अल्फा के प्रोफाइल पेज पर एक नोटिस में कहा गया है कि मॉडल के लिए सभी संकेत और पूर्णताएं “प्रदाता द्वारा लॉग की जाती हैं और मॉडल को बेहतर बनाने के लिए उपयोग की जा सकती हैं,” निष्पक्ष प्रतिक्रिया के लिए स्टील्थ मॉडल लॉन्च का उपयोग करने की उद्योग-व्यापी प्रथा को रेखांकित किया गया है।
ओपनराउटर आंकड़ों के अनुसार, प्लेटफॉर्म पर प्रदर्शित होने के बाद मॉडल को तेजी से अपनाया गया और रविवार तक 160 बिलियन से अधिक टोकन संसाधित किए गए।
अधिकांश गतिविधि सॉफ़्टवेयर विकास टूल और ओपनक्लाव जैसे एआई एजेंट फ्रेमवर्क से आई, जो एआई सिस्टम को स्वायत्त रूप से कार्यों की योजना बनाने और बाहरी सॉफ़्टवेयर के साथ बातचीत करने की अनुमति देती है।

