AI में Google की बढ़त पर आंतरिक रूप से ‘कोड रेड’ घोषित करने के कुछ दिनों बाद, OpenAI ने एक नए उन्नत मॉडल के साथ वापसी की है। सैम ऑल्टमैन के नेतृत्व वाली एआई पावरहाउस ने जीपीटी-5.2 पेश किया है, जिसे वह पेशेवर काम और लंबे समय तक चलने वाले एजेंटों के लिए अपना सबसे उन्नत फ्रंटियर मॉडल बताता है।
ओपनएआई का कहना है कि नया मॉडल पेशेवर ज्ञान कार्य के लिए इसकी अब तक की सबसे सक्षम श्रृंखला है, जिसे विशेष रूप से उद्यम उपयोग के लिए डिज़ाइन किया गया है।
GPT-5.2 क्या है?
GPT-5.2 मूल रूप से AI मॉडल की एक नई पीढ़ी है जो अपने पूर्ववर्तियों की तुलना में वास्तविक कार्यस्थल कार्यों में तेज़, अधिक सक्षम और कहीं बेहतर है। सरल शब्दों में, यदि आप लंबे दस्तावेज़ों को सारांशित करने, कोड की जांच करने, प्रेजेंटेशन का मसौदा तैयार करने, स्प्रेडशीट में डेटा को एकत्रित करने आदि के लिए एआई का उपयोग कर रहे हैं, तो यह मॉडल इन सभी क्षमताओं को एक मानव विशेषज्ञ के बहुत करीब ले जाएगा।
ओपनएआई के अनुसार, जो कंपनियां चैटजीपीटी एंटरप्राइज का उपयोग कर रही हैं, उनका दावा है कि उन्होंने प्रतिदिन 40-60 मिनट की बचत की है। कंपनी का दावा है कि हैवी यूजर्स के काम के बोझ से हफ्ते में 10 घंटे कम हो गए हैं। अब, GPT-5.2 के साथ, ये लाभ और भी तेज होने जा रहे हैं।
OpenAI का दावा है कि GPT-5.2 स्प्रेडशीट और प्रस्तुतियाँ बनाने, कोड लिखने और डिबगिंग करने, छवियों को समझने और उनका विश्लेषण करने, बहुत लंबे दस्तावेज़ों को पढ़ने, बीच में खोए बिना बहु-चरणीय कार्यों को हल करने और यहां तक कि खोज, डेटाबेस या कंपनी सॉफ़्टवेयर जैसे बाहरी टूल को कॉल करने में भी बेहतर है। सरल शब्दों में, GPT-5.2 उन लोगों के लिए विकसित किया गया है जो AI का उपयोग अपने दैनिक कार्य के हिस्से के रूप में करते हैं, न कि केवल त्वरित प्रश्नों के लिए।
नियमित चैटजीपीटी में, जीपीटी-5.2 तीन संस्करणों में आता है – इंस्टेंट, थिंकिंग और प्रो। इंस्टेंट रोजमर्रा के कार्यों के लिए तेज़ प्रतिक्रियाओं के लिए है, जबकि थिंकिंग जटिल कार्यों के लिए अधिक संरचित और विस्तृत तर्क के लिए है, और प्रो जटिल और तकनीकी समस्याओं के लिए उच्चतम गुणवत्ता वाले उत्तर देता है।
GPT-5.2 प्रारंभ में सभी भुगतान किए गए ChatGPT योजनाओं में लागू हो रहा है। एपीआई में, यह तुरंत gpt-5.2, gpt-5.2-chat-latest और gpt-5.2-pro के रूप में उपलब्ध है। टोकन मूल्य निर्धारण GPT-5.1 से अधिक है, लेकिन अभी भी प्रतिस्पर्धी फ्रंटियर मॉडल से नीचे है, और अधिक दक्षता के कारण, उच्च गुणवत्ता वाले परिणाम उत्पन्न करने में अक्सर कुल लागत कम होती है।
इस विज्ञापन के नीचे कहानी जारी है
GPT-5.2 प्रदर्शन
अपने आधिकारिक ब्लॉग में, OpenAI ने खुलासा किया कि GPT-5.2 को सबसे बड़े परीक्षणों में से एक से गुजरना पड़ा, जिसे GDPval के नाम से जाना जाता है। यह परीक्षण एक महत्वपूर्ण मूल्यांकन है जो यह जांचता है कि एआई मॉडल वित्त से लेकर बिक्री संचालन से लेकर डिजाइन तक 44 वास्तविक दुनिया के व्यवसायों में कितनी अच्छी तरह कार्य करता है। दूसरी ओर, मॉडल का सबसे सक्षम संस्करण, GPT-5.2 ‘थिंकिंग’, कथित तौर पर 70.9 प्रतिशत कार्यों में उद्योग के पेशेवरों से मेल खाता है या उनसे बेहतर प्रदर्शन करता है, जो GPT-5 के स्कोर से लगभग दोगुना है।
जब कोडिंग की बात आती है, तो SWE-बेंच प्रो पर, एक बेंचमार्क जो चार प्रोग्रामिंग भाषाओं में वास्तविक दुनिया के इंजीनियरिंग कार्यों का अनुकरण करता है, GPT-5.2 ने एक नया रिकॉर्ड बनाया। कथित तौर पर मॉडल डिबगिंग, सुविधाओं को लागू करने, कोड की समीक्षा करने और संपूर्ण एंड-टू-एंड इंजीनियरिंग कार्यों को संभालने में बेहतर है। नए मॉडल का परीक्षण करने वाले डेवलपर्स ने यह भी पाया कि मॉडल ने फ्रंट-एंड नौकरियों पर बेहतर प्रदर्शन किया, जिसमें प्राकृतिक भाषा संकेतों से 3 डी इंटरफेस या जटिल दृश्य उत्पन्न करना शामिल है। ये सभी कार्य कम गलतियों के साथ पूरे किये गये।
टेक्स्ट प्रोसेसिंग और मल्टी-स्टेप प्रोजेक्ट हैंडलिंग
ओपनएआई का यह भी दावा है कि नया मॉडल कम मतिभ्रम के साथ आता है। GPT-5.2 का सबसे प्रभावशाली पहलू यह है कि यह बड़ी मात्रा में टेक्स्ट को प्रोसेस कर सकता है। कंपनी ने कहा कि मॉडल सैकड़ों-हजारों टोकन की जानकारी पर नज़र रख सकता है। ओपनएआई के लंबे-संदर्भ बेंचमार्क में, मॉडल ने लगभग पूर्ण सटीकता हासिल की, तब भी जब प्रासंगिक विवरण बड़ी फ़ाइलों में गहराई से छिपे हुए थे।
एक अन्य महत्वपूर्ण क्षेत्र उपकरण का उपयोग है। कथित तौर पर यह मॉडल बहु-चरणीय कार्यों को संभालने में बेहतर है जिसमें बाहरी उपकरण शामिल होते हैं। Tau2 बेंचमार्क पर, GPT-5.2 ने दूरसंचार-आधारित ग्राहक सहायता परिदृश्यों में 98.7 प्रतिशत सटीकता हासिल की। इसका मतलब यह है कि जब किसी उत्तर के लिए कई चरणों, कई उपकरणों और कुछ योजना की आवश्यकता होती है, तो मॉडल के खो जाने की संभावना बहुत कम होती है। कंपनी का यह भी दावा है कि परीक्षणों में उसने यात्रा की दोबारा बुकिंग, सामान का पता लगाना, होटलों की व्यवस्था करना और यहां तक कि मेडिकल-सीटिंग अनुरोधों को लागू करने जैसी जटिल ग्राहक-सेवा स्थितियों को भी संभाला। यह सब एक निरंतर वर्कफ़्लो में पूरा किया गया था, कुछ पुराने मॉडल आधे रास्ते में ही गिर गए होंगे।
इस विज्ञापन के नीचे कहानी जारी है
इसका मतलब है, जो लोग अनुबंधों, शोध पत्रों, कानूनी दस्तावेजों, प्रतिलेखों या बहु-फ़ाइल परियोजनाओं के साथ काम करते हैं, उनके लिए मॉडल आदर्श हो सकता है। यह विशाल डेटासेट को मैन्युअल रूप से तोड़े बिना उनके बारे में प्रश्न पूछना संभव बनाता है। यह मॉडल बेहतर दृष्टि क्षमताओं के साथ भी आता है। GPT-5.2 चार्ट, डैशबोर्ड, तकनीकी आरेख, यूआई स्क्रीनशॉट और यहां तक कि कम गुणवत्ता वाली छवियों की व्याख्या करने में बहुत मजबूत है। वैज्ञानिक आंकड़ा तर्क और सॉफ्टवेयर इंटरफ़ेस समझ में इसकी सटीकता में काफी सुधार हुआ है।
कार्यस्थल उपयोग के मामलों से परे, GPT-5.2 ने उन्नत वैज्ञानिक और गणितीय तर्क में भी तीव्र सुधार प्रदर्शित किया है। स्नातक स्तर के विज्ञान प्रश्नों पर, यह 92 प्रतिशत से अधिक सटीकता तक पहुंच गया, जबकि विशेषज्ञ गणित समस्याओं पर, इसने एक नया रिकॉर्ड बनाया। ओपनएआई के अनुसार, शोधकर्ताओं ने पहले ही इसका उपयोग सांख्यिकीय शिक्षण सिद्धांत में प्रमाण प्रस्तावित करने के लिए किया है जिसे बाद में मानव विशेषज्ञों द्वारा मान्य किया गया था।
OpenAI के लिए इसका क्या मतलब है?
Google द्वारा जेमिनी 3 की घोषणा के बाद से AI स्टार्टअप को तीव्र प्रतिस्पर्धा का सामना करना पड़ रहा है, जिसने विभिन्न बेंचमार्क में जोरदार प्रदर्शन किया है। जेमिनी 3 की सफलता के बाद, सैम ऑल्टमैन ने इस महीने की शुरुआत में ‘कोड रेड’ की घोषणा की। एक अन्य सहकर्मी एंथ्रोपिक से भी प्रतिस्पर्धा तेज हो गई है, जिसने अपना उन्नत मॉडल क्लाउड ओपस 4 लॉन्च किया है। कर्मचारियों को लिखे अपने नोट में, ऑल्टमैन ने उनसे विज्ञापनों के एकीकरण सहित अन्य योजनाओं में देरी करते हुए चैटबॉट की गुणवत्ता में सुधार पर ध्यान केंद्रित करने का आग्रह किया।
नए मॉडल के साथ, OpenAI उपयोगकर्ताओं के लिए अधिक आर्थिक मूल्य की आशा कर रहा है, क्योंकि यह स्प्रेडशीट बनाने, प्रस्तुतियाँ बनाने और जटिल बहु-चरणीय परियोजनाओं को प्रबंधित करने में बेहतर है।