एआई के सामने चुनौतीः अब यहां से कहां बढ़े
१५ नवम्बर २०२४ओपनएआई के चैटजीपीटी मॉडल ने पिछले दो साल में जिस रफ्तार से तरक्की की है, वह अप्रत्याशित है. लैंग्वेज मॉडल के रूप में आर्टिफिशियल इंटेलिजेंस का यह इस्तेमाल क्रांतिकारी साबित हुआ और इसने लगभग हर क्षेत्र में पैठ बनाई. मसलन, भारतीय अदालतों में अब चैटजीपीटी का इस्तेमाल हो रहा है.
लेकिन अब एआई कंपनियां उनके नए और बड़े भाषा मॉडल्स के विकास में देरी और चुनौतियों का सामना कर रही हैं. ये कंपनियां एआई मॉडल की ट्रेनिंग के लिए ऐसे तकनीकी तरीके बना रही हैं जो एल्गोरिदम को अधिक मानवीय ढंग से "सोचने" में मदद करें.
एआई के कई वैज्ञानिकों, शोधकर्ताओं, और निवेशकों का मानना है कि ये तकनीकें, जो ओपनएआई के हाल ही में जारी 01 मॉडल का आधार हैं, एआई के क्षेत्र में बड़े बदलाव ला सकती हैं. इस बदलाव से कंपनियों के ऊर्जा और कंप्यूटर चिप्स जैसे संसाधनों की मांग पर भी असर पड़ सकता है.
दो साल पहले वायरल हुए चैटबॉट चैटजीपीटी के लॉन्च के बाद से, एआई से जुड़ी टेक्नोलॉजी कंपनियां इस बात पर जोर देती रही हैं कि बड़े पैमाने पर डेटा और कंप्यूटिंग पावर जोड़ने से एआई मॉडल में सुधार होगा. लेकिन अब कई प्रमुख एआई वैज्ञानिक "बड़ा यानी बेहतर" वाले सिद्धांत की सीमाओं पर सवाल उठा रहे हैं.
ओपनएआई और सेफ सुपरइंटेलिजेंस (एसएसआई) के सह-संस्थापक, इल्या सुटस्केवर ने कहा कि बड़े पैमाने पर प्री-ट्रेनिंग के परिणाम अब उतने प्रभावी नहीं हैं. उन्होंने कहा, "2010 का दशक स्केलिंग का युग था, अब हम फिर से खोज और आविष्कार के युग में लौट आए हैं. सही चीज को बड़ा करना अब पहले से कहीं ज्यादा महत्वपूर्ण है."
नए तरीकों की तलाश
बड़े एआई लैब्स में शोधकर्ता ऐसे मॉडल विकसित करने में जूझ रहे हैं जो ओपनएआई के जीपीटी-4 मॉडल से बेहतर हों. बड़े मॉडल्स के लिए होने वाले 'ट्रेनिंग रन' पर लाखों डॉलर का खर्च आता है और ये प्रक्रिया कई महीनों तक चल सकती है. साथ ही, बड़ी मात्रा में डेटा की मांग और ऊर्जा की कमी भी एक बड़ी चुनौती बनती जा रही है.
इससे निपटने के लिए, शोधकर्ता "टेस्ट-टाइम कंप्यूट" जैसे तरीकों की खोज कर रहे हैं, जिसमें एआई मॉडल के ‘इन्फरेंस फेज' में सुधार किया जा सकता है. यह मॉडल को जटिल गणनाओं में और ज्यादा डेटा को प्रोसेस करने की सुविधा देता है.
ओपनएआई ने अपने नए मॉडल 01 में इस तकनीक को अपनाया है, जो समस्याओं को इंसान-प्रेरित तर्क-वितर्क के साथ हल करता है. इसी तरह की तकनीक विकसित करने के लिए अन्य प्रमुख एआई लैब्स, जैसे एंथ्रोपिक, एक्सएआई और गूगल डीपमाइंड कोशिशों में जुटे हैं.
एआई के विस्तार की पर्यावरणीय लागत
बड़े भाषा मॉडल्स (एलएलएम) के प्रशिक्षण से जुड़ी पर्यावरणीय लागत एक बड़ी चिंता का विषय बन चुकी है. कई अध्ययनों में सामने आया है कि अत्याधुनिक एआई मॉडल्स को प्रशिक्षित करने में भारी ऊर्जा की खपत होती है, जिससे बड़े पैमाने पर कार्बन उत्सर्जन होता है.
2019 में यूनिवर्सिटी ऑफ मैसाचुसेट्स, एमहर्स्ट के एक अध्ययन में बताया गया कि एक बड़े एआई मॉडल को प्रशिक्षित करने में लगभग 300 टन कार्बन डाइऑक्साइड का उत्सर्जन होता है, जो पांच कारों के पूरे जीवनकाल के उत्सर्जन के बराबर है.
2020 में हुए एक शोध में पाया गया कि बड़े भाषा मॉडल्स को प्रशिक्षित करने में दसियों हजार किलोवाट बिजली की जरूरत होती है.
शोधकर्ताओं ने बताया कि लैंग्वेज प्रोसेसिंग के सबसे आधुनिक बीईआरटी मॉडल के प्रशिक्षण में लगभग 143 मीट्रिक टन कार्बन उत्सर्जन हुआ. यह उत्सर्जन पारंपरिक तकनीकी गतिविधियों की तुलना में कहीं अधिक है, जिससे बड़े मॉडल्स के पर्यावरण पर असर को लेकर सवाल खड़े होते हैं.
संसाधनों की कमी और विकल्प
एआई चिप्स, विशेषकर एनविडिया के जीपीयू चिप्स की भारी वैश्विक मांग ने संसाधनों और सप्लाई चेन पर भी दबाव डाला है. सेमीकंडक्टरों की कमी पर हालिया शोध में पाया गया कि जीपीयू और अन्य एआई आधारित चिप्स के निर्माण में बहुत अधिक पानी, ऊर्जा और कोबाल्ट और लिथियम जैसे दुर्लभ तत्वों की जरूरत होती है, जिन्हें हासिल करने के तरीके पर्यावरण के बहुत अनुकूल नहीं होते.
यही वजह है कि अब कंपनियां आर्टिफिशियल इंटेलिजेंस को प्रशिक्षित करने के वैकल्पिक तरीकों और नए हार्डवेयर विकसित करने पर जोर दे रही हैं. 2022 में हुए एक शोध में सुझाव दिया गया कि कंपनियां नई तकनीकों जैसे ‘टेस्ट-टाइम कंप्यूट' और कस्टम एआई एक्सेलरेटर का उपयोग करने की ओर बढ़ रही हैं, जिससे पारंपरिक जीपीयू चिप्स पर निर्भरता कम हो सकती है और संसाधनों की कमी का हल निकल सकता है.
एआई हार्डवेयर में बदलाव की संभावना
इस बदलाव से एनविडिया जैसी कंपनियों के एआई चिप्स की मांग में बदलाव हो सकता है. फिलहाल एआई क्षेत्र में एनविडिया के चिप्स का दबदबा है, लेकिन इस नई तकनीक के कारण उन्हें इन्फरेंस बाजार में प्रतिस्पर्धा का सामना करना पड़ सकता है.
सेकोयो कैपिटल की पार्टनर सोन्या हुआंग ने कहा, "यह बदलाव हमें एक बड़े प्री-ट्रेनिंग क्लस्टर से इन्फरेंस क्लाउड्स की ओर ले जाएगा, जो इन्फरेंस के लिए क्लाउड-बेस्ड सर्वर्स हैं."
एनविडिया ने अपने नवीनतम एआई चिप्स ब्लैकवेल के लिए इन्फरेंस की बढ़ती मांग को लेकर टिप्पणी की है. कंपनी के सीईओ जेन्सेन हुआंग ने हाल ही में कहा, "हमने इन्फरेंस के समय के लिए दूसरा स्केलिंग नियम खोज लिया है. इससे ब्लैकवेल की मांग में वृद्धि हुई है."
रिपोर्टः विवेक कुमार (रॉयटर्स)