क्या-क्या गुल खिलाएगी बातें बनाने वाली एआई
चंद्रभूषण
आर्टिफिशियल इंटेलिजेंस, एआई, यानी कृत्रिम बुद्धि का मायने-मतलब पिछले दो-ढाई दशकों में लगातार बदलता आ रहा है। लेकिन इसका एक खास रूप- शब्द के आगे शब्द जोड़कर उपयोगी बातचीत कर लेना, सार्थक लेख लिख देना, कुछेक मुश्किलों का ठीक-ठाक हल सुझा देना- इधर दो महीनों से लगातार चर्चा में है। थोड़ा पीछे जाएं तो यह लहर पिछले छह महीनों से चल रही है, लेकिन इसमें बड़े ब्रांडों की धमक अभी हाल ही में सुनाई पड़ी है। नवंबर 2022 में ओपेनएआई नाम की अमेरिकी कंपनी ने चैटजीपीटी नाम से अपनी एक खास एआई लांच की। एक हलके में इसने जबर्दस्त कामयाबी पाई और कई साल पहले बनाया गया टिकटॉक का रिकॉर्ड बहुत बुरी तरह तोड़ते हुए दस करोड़ उपभोक्ता सिर्फ दो महीने में हासिल कर लिए।
भारत में प्रतिबंधित और छोटे वीडियो पर आधारित चीनी सोशल मीडिया कंपनी टिकटॉक को इस मुकाम तक पहुंचने में नौ महीने लगे थे। चैटजीपीटी का सिलसिला आगे बढ़ाते हुए माइक्रोसॉफ्ट ने अपने सर्च इंजन बिंग को चैटजीपीटी पर ही आधारित ‘बिंगचैट’ सुविधा के साथ बीती 7 फरवरी को नए सिरे से लांच किया, जबकि गूगल ने अभी 21 मार्च को ‘बार्ड’ नाम से अपनी एआई शुरू की, जिसके लिए फिलहाल आपका एक वेटिंग लिस्ट का हिस्सा बनना जरूरी है। बीच में 14 मार्च को ओपेनएआई कंपनी ने अपने चैटजीपीटी का नया संस्करण भी लांच किया है, जो पिछले तीन वर्षों से तैयार किए जाए रहे जीपीटी-4 पर आधारित है। यह सुविधा फिलहाल स-शुल्क है और इसके लिए हर महीने आपको 20 डॉलर अदा करने पड़ेंगे। इस गोरखधंधे की तह में जाने से पहले कुछ भारी-भरकम शब्दों का मतलब समझा जाए।
जीपीटी का फुल फॉर्म है ‘जेनरेटिव प्री-ट्रेंड ट्रांसफॉर्मर’। हिंदी में इसका उल्था करना बेमतलब होगा, लिहाजा इसके अर्थ को लेकर ही कुछ अंदाजा लगाया जाए। यह कि इस सॉफ्टवेयर को एक निश्चित शब्द-भंडार में से सही शब्दों का चयन करते हुए सवालों का सबसे सटीक, सबसे प्रासंगिक जवाब तैयार करने के लिए प्रशिक्षित किया गया है। ध्यान रहे, गूगल सर्च या बिंग की तरह इसका काम इंटरनेट पर पहले से मौजूद जवाबों को खोजकर उनका लिंक चिपका देना नहीं है। जीपीटी का काम कोई भी जवाब बिल्कुल नए सिरे से बनाना है, जिसके लिए वह अपने पास मौजूद सूचना भंडार से सूचनाएं उठा सकता है, या इंटरनेट से जुड़ा होने की स्थिति में उसकी सेवाएं भी ले सकता है।
तीन एआई का फर्क
चैटजीपीटी का नया संस्करण बहुत ताकतवर होते हुए भी इंटरनेट से नहीं जुड़ा है। प्रॉसेसिंग के लिए उसके पास अंतिम सूचनाएं 2021 तक की ही हैं। इसका फायदा यह है कि उसके जवाब बाकियों से ज्यादा साफ हैं। रही बात जीपीटी के संस्करणों में फर्क की तो इसका तीसरा संस्करण जीपीटी-3 सिर्फ 3000 शब्दों से काम चलाता था जबकि चौथा जीपीटी-4 पचीस हजार शब्दों पर खड़ा है। ध्यान रहे, इस तरह के चैटबॉट सिर्फ ओपेनएआई कंपनी ही बना रही है, जिसमें अमेरिका की कई बड़ी सॉफ्टवेयर कंपनियों ने अपनी पूंजी लगा रखी है। शब्द से शब्द जोड़ने का यह काम कितना मुश्किल है, इसका अंदाजा इस बात से लगाया जा सकता है कि दुनिया का पांचवें नंबर का सबसे शक्तिशाली सुपरकंप्यूटर ओपेनएआई ने इंसानी भाषा में शब्दों के पैटर्न पर काम करने के लिए लगा रखा है।
इसके बनाए चैटबॉट्स का इस्तेमाल अभी सबसे आगे बढ़कर सर्च इंजन चलाने वाली दो मुख्य कंपनियों गूगल और माइक्रोसॉफ्ट ने किया है। उन्होंने इसकी ट्रेनिंग अपने-अपने ढंग से कराई है। माइक्रोसॉफ्ट का बिंगचैट और गूगल का बार्ड, दोनों जिस प्लैटफॉर्म पर बनाए गए हैं, वह जीपीटी-3.5 है, यानी जीपीटी-3 और जीपीटी-4 के बीच का संस्करण। इसमें बिंगचैट के तीन रूप हैं- बैलेंस्ड, क्रिएटिव और प्रेस्सी। तीनों के नतीजे अलग-अलग आते हैं। लेकिन बार्ड और बिंगचैट के बीच कॉन्सेंप्ट के स्तर पर सबसे बड़ा फर्क इनकी ट्रेनिंग के डेटाबेस से आता है। बिंगचैट को मुख्यतः सूचनाओं की खोज के लिए गढ़ा गया है जबकि बार्ड की ट्रेनिंग इंसानी बातचीत के डेटाबेस पर आधारित है।
इस फर्क के चलते निजी बातचीत के लिए बार्ड बहुत उम्दा चैटबॉट साबित हो सकता है, जबकि किसी खोजबीन या एक कैटेगरी की कुछ मिलती-जुलती चीजों की आपसी तुलना के आधार पर नतीजे निकालने के लिए बिंगचैट को बेहतर पाया जा रहा है। रही बात ओपेनएआई द्वारा सीधे जारी चैटजीपीटी की तो उसकी बुनियाद ही इन दोनों से आगे की है तो ज्यादातर मामलों में इसके नतीजे भी बेहतर आना स्वाभाविक है।
खेल बिगाड़ने का खेल
एक बात तय है कि अभी यह अपने क्षेत्र में बिल्कुल शुरुआती स्तर की टेक्नॉलजी है। कुछ विशेषज्ञों का कहना है कि माइक्रोसॉफ्ट ने सिर्फ गूगल का खेल बिगाड़ने के लिए अपना बिंगचैट इतनी जल्दी बाजार में ला दिया। गूगल सर्च से उसका बाजार छीनने की उसकी दो कोशिशें, इंटरनेट एक्सप्लोरर और बिंग बेकार साबित हो चुकी हैं। उसे उम्मीद है कि बिंगचैट के बल पर इस लड़ाई में वह शायद कुछ नया कर ले जाएगी। रही बात गूगल की तो बार्ड को लेकर उसकी एक लंबी योजना थी। लैम्डा यानी ‘लैंग्वेज मॉडल फॉर डायलॉग अप्लीकेशंस’ अलग-अलग क्षेत्र में अलग-अलग मूड के मुताबिक बातचीत की दिशा तय करने का कार्यक्रम था।
कहना मुश्किल है कि बतौर एक प्रॉडक्ट ‘बार्ड’ के बाजार की होड़ में उतर आने के बाद लैम्डा का काम निर्धारित रास्ते पर बढ़ पाएगा या नहीं। भाषा इंसान की सबसे बड़ी खोज है। इसपर सुदूर अतीत की छाप मौजूद है तो सुदूर भविष्य की संभावनाएं भी इसी में खोजी जा सकती हैं। भाषा में किए जाने वाले काम की कोई सीमा नहीं है, लेकिन जिस समय में हम जी रहे हैं उसकी मुख्यधारा इससे कुछ तुरंता सेवाएं लेने की ही है। गूगल के लैम्डा का खोजी दायरा इससे कहीं ज्यादा बड़ा रहा है। याद करें तो पिछले साल लैम्डा पर काम कर रहे उसके एक सीनियर सॉफ्टवेयर इंजीनिर ब्लेक लेमॉइन ने इस चैटबॉट को एक सचेतन प्राणी, सेंटिएंट बीइंग बता दिया था।
एक सोशल साइट पर यह आर्टिकल प्रकाशित होने के साथ ही हल्ला उठा कि रोबॉट और मैट्रिक्स जैसी कुछ चर्चित हॉलिवुड फिल्मों में जिस तरह कृत्रिम बुद्धि को मानवता पर कब्जा करते दिखाया गया है, कहीं वैसा ही कोई काम अपनी लैब में गूगल ने तो नहीं कर डाला है। पादरी बनने का प्रशिक्षण ले चुके कट्टर ईसाई मिजाज वाले ब्लेक लेमॉइन ने न सिर्फ लैम्डा के साथ अपनी बातचीत को सार्वजनिक कर दिया था बल्कि इसे एक रिपब्लिकन सीनेटर को सौंप दिया था, ताकि ‘नैतिकता के आधार पर’ लैम्डा को ‘गंदी-संदी’ बातचीत के लिए प्रशिक्षित करने से रोका जा सके।
ऐसे में गूगल ने प्रोफेशनल गोपनीयता के मुद्दे पर ब्लेक को बाहर का दरवाजा दिखा दिया। मिजाज से ही विरोधाभासी यह सॉफ्टवेयर इंजीनियर अभी पता नहीं क्या कर रहा है, लेकिन हाल में जारी उसके एक बयान में लैम्डा को उसके दोनों प्रतिद्वंद्वियों से कहीं बेहतर बताया गया। समस्या यह है कि अभी छप रही सारी तुलनाएं बार्ड, बिंगचैट और नए चैटजीपीटी द्वारा तैयार किए गए छोटे लेखों की हैं और इनका आधार यह है कि वे कितने उपयोगी और सटीक हैं। इसकी जड़ में यह नुकसान छिपा है कि इस तकनीक की संभावनाएं कहीं सिकुड़ती न चलीं जाएं।
No comments:
Post a Comment