सैन फ्रांसिस्को एआई स्टार्टअप कंड्यूट ने भूमिगत प्रयोगशाला में सबसे बड़ा मस्तिष्क-से-भाषा डेटासेट बनाया | प्रौद्योगिकी समाचार

सैन फ्रांसिस्को में एक खिड़की रहित तहखाने में, एक छोटे एआई स्टार्टअप ने चुपचाप मानव मस्तिष्क-भाषा डेटा का अब तक रिकॉर्ड किया गया सबसे बड़ा संग्रह इकट्ठा किया है। पिछले छह महीनों में, कॉन्डिट का कहना है कि उसने हजारों स्वयंसेवकों से लगभग 10,000 घंटे की गैर-आक्रामक तंत्रिका रिकॉर्डिंग एकत्र की है, सभी का एक ही उद्देश्य है: मशीनों को विचारों को पाठ में अनुवाद करना सिखाना।

यह प्रयास, जो बड़े पैमाने पर सार्वजनिक दृष्टिकोण से सामने आया, दो घंटे के सत्रों के लिए कॉम्पैक्ट रिकॉर्डिंग बूथों के माध्यम से घूमने वाले प्रतिभागियों की एक स्थिर धारा पर निर्भर था। अंदर, वे शब्दों को बोलने या टाइप करने से पहले के क्षणों में सूक्ष्म तंत्रिका संकेतों को पकड़ने के लिए डिज़ाइन किए गए कस्टम-निर्मित हेडसेट पहनकर स्वतंत्र रूप से बात करते थे या टाइप करते थे। कंड्यूट का मानना ​​है कि परिणामी डेटासेट, न्यूरो-भाषा अनुसंधान के लिए पहले एकत्र की गई किसी भी चीज़ से बेहतर है।

यह भी पढ़ें: मस्तिष्क क्यों थक जाता है: शोधकर्ताओं ने मानसिक थकान के जीव विज्ञान का खुलासा किया

सत्रों को नैदानिक ​​​​प्रयोगों के रूप में मानने के बजाय, कंपनी बातचीत में लग गई। प्रारंभ में, प्रतिभागियों को संरचित कार्यों के माध्यम से निर्देशित किया गया था, लेकिन टीम ने तुरंत एक समस्या देखी: कठोर संकेतों ने ऊर्जा को खत्म कर दिया और चापलूसी डेटा का उत्पादन किया। बड़े भाषा मॉडल के साथ ओपन-एंडेड संवाद की अनुमति देने के लिए सेटअप को फिर से डिज़ाइन किया गया, जिससे प्रतिभागियों को स्वाभाविक रूप से बोलने के लिए जगह मिल सके। इंजीनियरों का कहना है कि उस बदलाव से समृद्ध भाषा आउटपुट और मस्तिष्क गतिविधि, ऑडियो और टेक्स्ट के बीच स्पष्ट संरेखण हुआ।

रिकॉर्डिंग को संभव बनाने के लिए, कॉन्डिट ने स्क्रैच से अपना स्वयं का हार्डवेयर बनाया। टीम ने पाया कि ऑफ-द-शेल्फ हेडसेट एक बार में पर्याप्त सिग्नल कैप्चर नहीं कर सके। उनके समाधान ने ईईजी (इलेक्ट्रोएन्सेफलोग्राम), कार्यात्मक निकट-अवरक्त स्पेक्ट्रोस्कोपी, और अतिरिक्त सेंसर को लगभग चार पाउंड वजन वाले भारी, 3 डी-मुद्रित रिग में संयोजित किया। ये प्रशिक्षण हेडसेट कभी भी आरामदायक नहीं थे; उन्हें यथासंभव अधिक डेटा खींचने के लिए डिज़ाइन किया गया था। रोजमर्रा के उपयोग के लिए हल्के संस्करण बाद में आएंगे, जिन्हें मॉडलों की वास्तव में आवश्यकता के अनुसार आकार दिया जाएगा।

विभिन्न सेंसरों से डेटा को एक एकीकृत भंडारण प्रणाली में डाला जाता है जो सब कुछ सटीक रूप से सिंक्रनाइज़ रखता है। वह समय मायने रखता है. मॉडलों को किसी व्यक्ति के बोलने या टाइप करने से कुछ सेकंड पहले मस्तिष्क की गतिविधि को देखने के लिए प्रशिक्षित किया जाता है, और ऐसे पैटर्न की खोज की जाती है जो भाषा के भौतिक रूप लेने से पहले अर्थ का संकेत देते हैं।

टीम का सबसे बड़ा प्रारंभिक सिरदर्द बिजली का शोर था। बिजली के हस्तक्षेप से सिग्नल विकृत हो गए, इसलिए कर्मचारियों ने केबल लपेटे, फिल्टर के साथ प्रयोग किया और यहां तक ​​कि इमारत की मुख्य बिजली भी बंद कर दी, प्रयोगशाला पूरी तरह से बैटरी पर चल रही थी। वर्कअराउंड ने मदद की, लेकिन डेटा गिराए जाने से लेकर भारी बैटरी पैक की अदला-बदली की लॉजिस्टिक्स तक नई समस्याएं पेश कीं। समय के साथ, पैमाना ही समाधान बन गया। एक बार जब डेटासेट कई हजार घंटे पार कर गया, तो मॉडल ने व्यक्तियों और रिकॉर्डिंग सेटअपों में सामान्यीकरण करना शुरू कर दिया, जिससे अत्यधिक शोर दमन कम महत्वपूर्ण हो गया।

इस विज्ञापन के नीचे कहानी जारी है

जैसे-जैसे परियोजना बढ़ी, दक्षता भी बढ़ी। भ्रष्ट सत्रों को तुरंत चिन्हित करने के लिए बैकएंड सिस्टम को फिर से बनाया गया और पर्यवेक्षकों के एक छोटे समूह ने एक साथ कई बूथों की निगरानी शुरू कर दी। एक कस्टम शेड्यूलिंग प्रणाली हेडसेट को लगभग निरंतर उपयोग में रखती है, कभी-कभी दिन में 20 घंटे तक काम करती है। कंड्यूट का कहना है कि इन परिवर्तनों से परियोजना के दौरान डेटा के प्रत्येक उपयोग योग्य घंटे की लागत में लगभग 40 प्रतिशत की कटौती हुई है।

डेटा संग्रह काफी हद तक पूरा होने के साथ, कंपनी अब अपना ध्यान अंदर की ओर केंद्रित कर रही है, अपने डिकोडिंग मॉडल को प्रशिक्षित और परिष्कृत कर रही है। हालाँकि, वे प्रणालियाँ मस्तिष्क संकेतों से अर्थ का कितनी सटीकता से पुनर्निर्माण कर सकती हैं, इसका विवरण अभी भी गुप्त है।