2 मिनट पढ़ेंनई दिल्ली3 अप्रैल, 2026 03:48 अपराह्न IST
माइक्रोसॉफ्ट ने अपना तीसरा इन-हाउस विकसित एआई मॉडल एमएआई-ट्रांसक्राइब-1 जारी किया है, जिसके बारे में उसका दावा है कि यह दुनिया का सबसे सटीक ट्रांसक्रिप्शन मॉडल है।
केवल 3.9 प्रतिशत की औसत शब्द त्रुटि दर के साथ, एमएआई-ट्रांसक्राइब-1 25 भाषाओं में काम करता है – अंग्रेजी, फ्रेंच, जर्मन, इतालवी, स्पेनिश, हिंदी, पुर्तगाली, चेक, डेनिश, फिनिश, हंगेरियन, डच, पोलिश, रोमानियाई, स्वीडिश, जापानी, कोरियाई, चीनी, अरबी, इंडोनेशियाई, रूसी, थाई, तुर्की और वियतनामी।
माइक्रोसॉफ्ट का नया AI मॉडल 11 मुख्य भाषाओं में FLUERS उद्योग-मानक बेंचमार्क में प्रथम स्थान पर है और शेष 14 भाषाओं में व्हिस्पर-लार्ज-v3 को पीछे छोड़ देता है। यह 14 में से 11 भाषाओं में हाल ही में लॉन्च किए गए Google जेमिनी 3.1 फ्लैश से भी आगे निकल गया। माइक्रोसॉफ्ट फाउंड्री में उपलब्ध, कंपनी का कहना है कि MAI-Transcribe-1 की बैच ट्रांसक्रिप्शन गति उसकी Azure फास्ट पेशकश की तुलना में 2.5 गुना तेज है और यह केवल $0.36 प्रति घंटे पर उपलब्ध है।
कंपनी का कहना है कि MAI-Transcribe-1 सभी समर्थित भाषाओं में अत्यधिक सटीक है, जो इसे स्पीच-टू-टेक्स्ट उपयोग मामलों की एक विस्तृत श्रृंखला के लिए एक आदर्श विकल्प बनाता है। हालाँकि यह वास्तविक समय प्रतिलेखन का समर्थन नहीं करता है, Microsoft का कहना है कि वह भविष्य के संस्करण में इस सुविधा को जोड़ देगा। MAI-Transcribe-1 के साथ, Microsoft ने दो नए AI मॉडल – MAI-Image-2 और MAI-Voice-1 भी जारी किए, जो, जैसा कि उनके नाम से पता चलता है, चित्र और ऑडियो उत्पन्न कर सकते हैं।
टेक दिग्गज का कहना है कि एमएआई-वॉयस-1 उसका प्रमुख वॉयस जेनरेशन मॉडल है जो लंबे प्रारूप वाली सामग्री में भी “प्राकृतिक, यथार्थवादी भाषण, बारीकियों, भावनात्मक रेंज और अभिव्यक्ति से समृद्ध है जो वक्ता की पहचान को संरक्षित करता है” उत्पन्न कर सकता है। केवल 1 सेकंड में 60 सेकंड का ऑडियो जेनरेट करने में सक्षम, MAI-वॉयस-1 GPU-कुशल भी है। यह कोपायलट ऑडियो एक्सप्रेशंस और कोपायलट पॉडकास्ट में उपलब्ध है।
जहां तक एमएआई-इमेज-2 का सवाल है, माइक्रोसॉफ्ट का कहना है कि यह “प्रदर्शन और गति” पर ध्यान केंद्रित करता है और एरेना.एआई लीडरबोर्ड पर शीर्ष 3 मॉडल परिवार में भी दिखाई दिया। हालाँकि Microsoft के AI मॉडल उतने बड़े या सबसे तेज़ नहीं हो सकते हैं, कंपनी उन्हें Google और OpenAI के बड़े भाषा मॉडल के सस्ते विकल्प के रूप में बेचने की उम्मीद करती है।
