
माइक्रोसॉफ्ट के अनुसार, एमएआई-वॉयस-1 “प्राकृतिक, यथार्थवादी भाषण, बारीकियों, भावनात्मक सीमा और अभिव्यक्ति से समृद्ध” उत्पन्न करता है, और इसे लंबे प्रारूप वाली सामग्री में वक्ता की पहचान को संरक्षित करने के लिए बनाया गया था। मॉडल “एक सेकंड” में एक मिनट का ऑडियो उत्पन्न कर सकता है और इसका कम GPU उपयोग इसे तेज़ और किफायती बनाता है।
रेडमंड के अनुसार, एमएआई-इमेज-2 में कोपायलट पर “टर्बोचार्ज्ड” छवि निर्माण प्रदर्शन और गति है। इसने Arena.ai लीडरबोर्ड पर शीर्ष तीन मॉडल परिवारों में शुरुआत की, और जल्द ही इसे बिंग और पावरपॉइंट में पेश किया जाएगा।
माइक्रोसॉफ्ट ने कहा कि मॉडल फोटोग्राफरों, डिजाइनरों और दृश्य कथाकारों की सहायता से बनाया गया था, जो “प्राकृतिक प्रकाश व्यवस्था, सटीक त्वचा टोन और बनावट की मांग करते हैं”, साथ ही ग्राफिक्स, लेआउट और आरेखों के लिए स्पष्ट पाठ की आवश्यकता होती है।

