
चीनी एआई कंपनी डीपसीक ने एक नई प्रशिक्षण पद्धति, मैनिफोल्ड-कंस्ट्रेन्ड हाइपर-कनेक्शन्स (एमएचसी) का अनावरण किया है, जो बड़े भाषा मॉडल को अधिक कुशलतापूर्वक और कम लागत पर प्रशिक्षित करना संभव बनाएगी, रिपोर्ट साउथ चाइना मॉर्निंग पोस्ट.
यह विधि तथाकथित हाइपर-कनेक्शन का एक और विकास है, जिसे मूल रूप से 2024 में बाइटडांस द्वारा विकसित किया गया था। यह तकनीक, बदले में, माइक्रोसॉफ्ट रिसर्च एशिया के क्लासिक रेसनेट आर्किटेक्चर पर आधारित है।
डीपसीक का कहना है कि बुनियादी ढांचे के स्तर पर विशिष्ट अनुकूलन के कारण एमएचसी कम्प्यूटेशनल लागत में वृद्धि किए बिना अधिक स्थिर और स्केलेबल प्रशिक्षण प्रदान करता है। शोधकर्ताओं ने सकारात्मक परिणामों के साथ 27 बिलियन मापदंडों वाले मॉडलों पर प्रौद्योगिकी का परीक्षण किया है।