Friday 31 March 2023

एआई के ताकतवर होनें के मायने

 क्या-क्या गुल खिलाएगी बातें बनाने वाली एआई

चंद्रभूषण

आर्टिफिशियल इंटेलिजेंस, एआई, यानी कृत्रिम बुद्धि का मायने-मतलब पिछले दो-ढाई दशकों में लगातार बदलता आ रहा है। लेकिन इसका एक खास रूप- शब्द के आगे शब्द जोड़कर उपयोगी बातचीत कर लेना, सार्थक लेख लिख देना, कुछेक मुश्किलों का ठीक-ठाक हल सुझा देना- इधर दो महीनों से लगातार चर्चा में है। थोड़ा पीछे जाएं तो यह लहर पिछले छह महीनों से चल रही है, लेकिन इसमें बड़े ब्रांडों की धमक अभी हाल ही में सुनाई पड़ी है। नवंबर 2022 में ओपेनएआई नाम की अमेरिकी कंपनी ने चैटजीपीटी नाम से अपनी एक खास एआई लांच की। एक हलके में इसने जबर्दस्त कामयाबी पाई और कई साल पहले बनाया गया टिकटॉक का रिकॉर्ड बहुत बुरी तरह तोड़ते हुए दस करोड़ उपभोक्ता सिर्फ दो महीने में हासिल कर लिए। 

भारत में प्रतिबंधित और छोटे वीडियो पर आधारित चीनी सोशल मीडिया कंपनी टिकटॉक को इस मुकाम तक पहुंचने में नौ महीने लगे थे। चैटजीपीटी का सिलसिला आगे बढ़ाते हुए माइक्रोसॉफ्ट ने अपने सर्च इंजन बिंग को चैटजीपीटी पर ही आधारित ‘बिंगचैट’ सुविधा के साथ बीती 7 फरवरी को नए सिरे से लांच किया, जबकि गूगल ने अभी 21 मार्च को ‘बार्ड’ नाम से अपनी एआई शुरू की, जिसके लिए फिलहाल आपका एक वेटिंग लिस्ट का हिस्सा बनना जरूरी है। बीच में 14 मार्च को ओपेनएआई कंपनी ने अपने चैटजीपीटी का नया संस्करण भी लांच किया है, जो पिछले तीन वर्षों से तैयार किए जाए रहे जीपीटी-4 पर आधारित है। यह सुविधा फिलहाल स-शुल्क है और इसके लिए हर महीने आपको 20 डॉलर अदा करने पड़ेंगे। इस गोरखधंधे की तह में जाने से पहले कुछ भारी-भरकम शब्दों का मतलब समझा जाए।

जीपीटी का फुल फॉर्म है ‘जेनरेटिव प्री-ट्रेंड ट्रांसफॉर्मर’। हिंदी में इसका उल्था करना बेमतलब होगा, लिहाजा इसके अर्थ को लेकर ही कुछ अंदाजा लगाया जाए। यह कि इस सॉफ्टवेयर को एक निश्चित शब्द-भंडार में से सही शब्दों का चयन करते हुए सवालों का सबसे सटीक, सबसे प्रासंगिक जवाब तैयार करने के लिए प्रशिक्षित किया गया है। ध्यान रहे, गूगल सर्च या बिंग की तरह इसका काम इंटरनेट पर पहले से मौजूद जवाबों को खोजकर उनका लिंक चिपका देना नहीं है। जीपीटी का काम कोई भी जवाब बिल्कुल नए सिरे से बनाना है, जिसके लिए वह अपने पास मौजूद सूचना भंडार से सूचनाएं उठा सकता है, या इंटरनेट से जुड़ा होने की स्थिति में उसकी सेवाएं भी ले सकता है। 

तीन एआई का फर्क

चैटजीपीटी का नया संस्करण बहुत ताकतवर होते हुए भी इंटरनेट से नहीं जुड़ा है। प्रॉसेसिंग के लिए उसके पास अंतिम सूचनाएं 2021 तक की ही हैं। इसका फायदा यह है कि उसके जवाब बाकियों से ज्यादा साफ हैं। रही बात जीपीटी के संस्करणों में फर्क की तो इसका तीसरा संस्करण जीपीटी-3 सिर्फ 3000 शब्दों से काम चलाता था जबकि चौथा जीपीटी-4 पचीस हजार शब्दों पर खड़ा है। ध्यान रहे, इस तरह के चैटबॉट सिर्फ ओपेनएआई कंपनी ही बना रही है, जिसमें अमेरिका की कई बड़ी सॉफ्टवेयर कंपनियों ने अपनी पूंजी लगा रखी है। शब्द से शब्द जोड़ने का यह काम कितना मुश्किल है, इसका अंदाजा इस बात से लगाया जा सकता है कि दुनिया का पांचवें नंबर का सबसे शक्तिशाली सुपरकंप्यूटर ओपेनएआई ने इंसानी भाषा में शब्दों के पैटर्न पर काम करने के लिए लगा रखा है। 

इसके बनाए चैटबॉट्स का इस्तेमाल अभी सबसे आगे बढ़कर सर्च इंजन चलाने वाली दो मुख्य कंपनियों गूगल और माइक्रोसॉफ्ट ने किया है। उन्होंने इसकी ट्रेनिंग अपने-अपने ढंग से कराई है। माइक्रोसॉफ्ट का बिंगचैट और गूगल का बार्ड, दोनों जिस प्लैटफॉर्म पर बनाए गए हैं, वह जीपीटी-3.5 है, यानी जीपीटी-3 और जीपीटी-4 के बीच का संस्करण। इसमें बिंगचैट के तीन रूप हैं- बैलेंस्ड, क्रिएटिव और प्रेस्सी। तीनों के नतीजे अलग-अलग आते हैं। लेकिन बार्ड और बिंगचैट के बीच कॉन्सेंप्ट के स्तर पर सबसे बड़ा फर्क इनकी ट्रेनिंग के डेटाबेस से आता है। बिंगचैट को मुख्यतः सूचनाओं की खोज के लिए गढ़ा गया है जबकि बार्ड की ट्रेनिंग इंसानी बातचीत के डेटाबेस पर आधारित है। 

इस फर्क के चलते निजी बातचीत के लिए बार्ड बहुत उम्दा चैटबॉट साबित हो सकता है, जबकि किसी खोजबीन या एक कैटेगरी की कुछ मिलती-जुलती चीजों की आपसी तुलना के आधार पर नतीजे निकालने के लिए बिंगचैट को बेहतर पाया जा रहा है। रही बात ओपेनएआई द्वारा सीधे जारी चैटजीपीटी की तो उसकी बुनियाद ही इन दोनों से आगे की है तो ज्यादातर मामलों में इसके नतीजे भी बेहतर आना स्वाभाविक है।

खेल बिगाड़ने का खेल

एक बात तय है कि अभी यह अपने क्षेत्र में बिल्कुल शुरुआती स्तर की टेक्नॉलजी है। कुछ विशेषज्ञों का कहना है कि माइक्रोसॉफ्ट ने सिर्फ गूगल का खेल बिगाड़ने के लिए अपना बिंगचैट इतनी जल्दी बाजार में ला दिया। गूगल सर्च से उसका बाजार छीनने की उसकी दो कोशिशें, इंटरनेट एक्सप्लोरर और बिंग बेकार साबित हो चुकी हैं। उसे उम्मीद है कि बिंगचैट के बल पर इस लड़ाई में वह शायद कुछ नया कर ले जाएगी। रही बात गूगल की तो बार्ड को लेकर उसकी एक लंबी योजना थी। लैम्डा यानी ‘लैंग्वेज मॉडल फॉर डायलॉग अप्लीकेशंस’ अलग-अलग क्षेत्र में अलग-अलग मूड के मुताबिक बातचीत की दिशा तय करने का कार्यक्रम था। 

कहना मुश्किल है कि बतौर एक प्रॉडक्ट ‘बार्ड’ के बाजार की होड़ में उतर आने के बाद लैम्डा का काम निर्धारित रास्ते पर बढ़ पाएगा या नहीं। भाषा इंसान की सबसे बड़ी खोज है। इसपर सुदूर अतीत की छाप मौजूद है तो सुदूर भविष्य की संभावनाएं भी इसी में खोजी जा सकती हैं। भाषा में किए जाने वाले काम की कोई सीमा नहीं है, लेकिन जिस समय में हम जी रहे हैं उसकी मुख्यधारा इससे कुछ तुरंता सेवाएं लेने की ही है। गूगल के लैम्डा का खोजी दायरा इससे कहीं ज्यादा बड़ा रहा है। याद करें तो पिछले साल लैम्डा पर काम कर रहे उसके एक सीनियर सॉफ्टवेयर इंजीनिर ब्लेक लेमॉइन ने इस चैटबॉट को एक सचेतन प्राणी, सेंटिएंट बीइंग बता दिया था। 

एक सोशल साइट पर यह आर्टिकल प्रकाशित होने के साथ ही हल्ला उठा कि रोबॉट और मैट्रिक्स जैसी कुछ चर्चित हॉलिवुड फिल्मों में जिस तरह कृत्रिम बुद्धि को मानवता पर कब्जा करते दिखाया गया है, कहीं वैसा ही कोई काम अपनी लैब में गूगल ने तो नहीं कर डाला है। पादरी बनने का प्रशिक्षण ले चुके कट्टर ईसाई मिजाज वाले ब्लेक लेमॉइन ने न सिर्फ लैम्डा के साथ अपनी बातचीत को सार्वजनिक कर दिया था बल्कि इसे एक रिपब्लिकन सीनेटर को सौंप दिया था, ताकि ‘नैतिकता के आधार पर’ लैम्डा को ‘गंदी-संदी’ बातचीत के लिए प्रशिक्षित करने से रोका जा सके। 

ऐसे में गूगल ने प्रोफेशनल गोपनीयता के मुद्दे पर ब्लेक को बाहर का दरवाजा दिखा दिया। मिजाज से ही विरोधाभासी यह सॉफ्टवेयर इंजीनियर अभी पता नहीं क्या कर रहा है, लेकिन हाल में जारी उसके एक बयान में लैम्डा को उसके दोनों प्रतिद्वंद्वियों से कहीं बेहतर बताया गया। समस्या यह है कि अभी छप रही सारी तुलनाएं बार्ड, बिंगचैट और नए चैटजीपीटी द्वारा तैयार किए गए छोटे लेखों की हैं और इनका आधार यह है कि वे कितने उपयोगी और सटीक हैं। इसकी जड़ में यह नुकसान छिपा है कि इस तकनीक की संभावनाएं कहीं सिकुड़ती न चलीं जाएं।

No comments:

Post a Comment