वर्तमान जनरेटिव एआई एक ऐसी एआई तकनीक है जो ट्रांसफार्मर के एक बड़ी सफलता के रूप में आविष्कार के साथ विकसित हुई।
ध्यान तंत्र (Attention Mechanism) को ट्रांसफार्मर की निर्णायक विशेषता के रूप में वर्णित किया जा सकता है। यह ट्रांसफार्मर की घोषणा करने वाले पेपर के शीर्षक "Attention Is All You Need" में संक्षिप्त रूप से व्यक्त किया गया है।
इसका संदर्भ यह है कि उस समय एआई शोधकर्ता एआई को मनुष्यों की तरह कुशलता से प्राकृतिक भाषा को संभालने में सक्षम बनाने के लिए विभिन्न प्रयास कर रहे थे और परीक्षण-और-त्रुटि में लगे हुए थे, सफल तरीकों का नामकरण कर रहे थे और उनके बारे में पेपर प्रकाशित कर रहे थे।
कई शोधकर्ताओं का मानना था कि इन कई प्रभावी तंत्रों को विभिन्न तरीकों से मिलाकर, वे धीरे-धीरे मनुष्यों की तरह प्राकृतिक भाषा को संभालने में सक्षम एआई बना सकते हैं। वे नए तंत्रों की खोज करने पर केंद्रित थे जो दूसरों के साथ मिलकर काम कर सकते थे, और इन तंत्रों के इष्टतम संयोजनों को खोजने पर केंद्रित थे।
हालांकि, ट्रांसफार्मर ने इस पारंपरिक ज्ञान को उलट दिया। यह संदेश कि विभिन्न तंत्रों को संयोजित करने की कोई आवश्यकता नहीं थी, और केवल ध्यान तंत्र की आवश्यकता थी, पेपर के शीर्षक में स्पष्ट था।
हालांकि ट्रांसफार्मर में निश्चित रूप से विभिन्न तंत्र शामिल हैं, इसमें कोई संदेह नहीं है कि ध्यान तंत्र उनमें विशेष रूप से अभूतपूर्व और विशिष्ट था।
ध्यान तंत्र का अवलोकन
ध्यान तंत्र (Attention Mechanism) एक ऐसी प्रणाली है जो एआई को यह सीखने की अनुमति देती है कि प्राकृतिक भाषा में एक विशिष्ट शब्द को संसाधित करते समय, पिछले वाक्यों में निहित कई शब्दों में से उसे किन शब्दों पर ध्यान देना चाहिए।
यह एआई को यह सटीक रूप से समझने में सक्षम बनाता है कि कोई शब्द किस चीज़ को संदर्भित करता है, उदाहरण के लिए, जब "यह," "वह," या "उपर्युक्त" (पिछले वाक्य में एक शब्द की ओर इशारा करते हुए) जैसे प्रदर्शनात्मक शब्दों से निपटते हैं, या "पहला वाक्य," "सूचीबद्ध दूसरा उदाहरण," या "पिछला पैराग्राफ" जैसे स्थितिगत संदर्भों से निपटते हैं।
इसके अलावा, यह संशोधक को सही ढंग से व्याख्या कर सकता है, भले ही वे वाक्य में दूर-दूर हों, और लंबे पाठों में भी, यह उन शब्दों की व्याख्या कर सकता है जो वर्तमान शब्द संदर्भित करता है, जिससे वह अन्य वाक्यों के बीच खो न जाए।
यह "ध्यान" की उपयोगिता है।
इसके विपरीत, इसका मतलब यह है कि वर्तमान में संसाधित किए जा रहे शब्द की व्याख्या करते समय, अनावश्यक शब्दों को मास्क कर दिया जाता है और व्याख्या से हटा दिया जाता है।
एक दिए गए शब्द की व्याख्या के लिए आवश्यक शब्दों को ही बनाए रखकर और अप्रासंगिक शब्दों को व्याख्या से हटाकर, व्याख्या किए जाने वाले शब्दों का सेट कुछ तक ही सीमित रहता है, चाहे पाठ कितना भी लंबा क्यों न हो, जिससे व्याख्यात्मक घनत्व पतला होने से रोका जा सके।
वर्चुअल इंटेलिजेंस
अब, थोड़ा हटकर बात करें तो, मैं वर्चुअल इंटेलिजेंस की अवधारणा पर विचार कर रहा हूँ।
वर्तमान में, जब व्यावसायिक उपयोग के लिए जनरेटिव एआई का उपयोग किया जाता है, यदि कंपनी के भीतर की सभी जानकारी को एक ही ज्ञान आधार के रूप में एआई को प्रदान किया जाता है, तो ज्ञान की विशाल मात्रा अत्यधिक हो सकती है, जिससे ऐसी घटना हो सकती है जहाँ एआई इसे ठीक से संसाधित नहीं कर पाता।
इस कारण से, ज्ञान को कार्य के अनुसार अलग करना अधिक प्रभावी होता है, प्रत्येक कार्य के लिए एआई चैट तैयार करना या विशिष्ट कार्यों के लिए विशेष एआई उपकरण बनाना।
परिणामस्वरूप, जटिल कार्यों को करते समय, इन एआई चैट या एआई उपकरणों को संयोजित करना आवश्यक हो जाता है, जिनमें से प्रत्येक का अपना अलग ज्ञान होता है।
जबकि यह जनरेटिव एआई की वर्तमान सीमा को दर्शाता है, मूल रूप से, भविष्य के जनरेटिव एआई के साथ भी, किसी विशिष्ट कार्य के लिए आवश्यक ज्ञान पर ही ध्यान केंद्रित करने से उच्च सटीकता मिलनी चाहिए।
इसके बजाय, मेरा मानना है कि भविष्य का जनरेटिव एआई, मनुष्यों द्वारा ज्ञान को खंडित किए बिना भी, स्थिति के अनुसार आवश्यक ज्ञान को आंतरिक रूप से अलग करने और उपयोग करने में सक्षम होगा।
यह क्षमता वर्चुअल इंटेलिजेंस है। यह एक वर्चुअल मशीन की तरह है जो एक ही कंप्यूटर पर कई अलग-अलग ऑपरेटिंग सिस्टम चला सकती है। इसका मतलब है कि एक ही बुद्धिमत्ता के भीतर, विभिन्न विशिष्टताओं वाली कई वर्चुअल बुद्धिमत्ताएं कार्य कर सकती हैं।
वर्तमान जनरेटिव एआई भी कई लोगों के बीच चर्चा का अनुकरण कर सकता है या कई पात्रों वाली कहानियाँ उत्पन्न कर सकता है। इसलिए, वर्चुअल इंटेलिजेंस कोई विशेष क्षमता नहीं है बल्कि वर्तमान जनरेटिव एआई का ही एक विस्तार है।
माइक्रो वर्चुअल इंटेलिजेंस
वर्चुअल इंटेलिजेंस का तंत्र, जो कार्य के अनुसार आवश्यक ज्ञान को सीमित करता है, ध्यान तंत्र के समान कुछ कार्य करता है।
दूसरे शब्दों में, यह ध्यान तंत्र के समान है कि यह वर्तमान में निष्पादित किए जा रहे कार्य के आधार पर केवल प्रासंगिक ज्ञान पर ध्यान केंद्रित करता है और उसे संसाधित करता है।
इसके विपरीत, ध्यान तंत्र को एक ऐसा तंत्र कहा जा सकता है जो वर्चुअल इंटेलिजेंस के समान कुछ साकार करता है। हालांकि, जबकि मैं जिस वर्चुअल इंटेलिजेंस की कल्पना करता हूं वह ज्ञान के संग्रह से प्रासंगिक ज्ञान का चयन करता है, ध्यान तंत्र शब्दों के संग्रह की इकाई पर काम करता है।
इस कारण से, ध्यान तंत्र को माइक्रो वर्चुअल इंटेलिजेंस कहा जा सकता है।
स्पष्ट ध्यान तंत्र
यदि हम ध्यान तंत्र को माइक्रो वर्चुअल इंटेलिजेंस के रूप में देखते हैं, तो, इसके विपरीत, मैंने पहले जिस वर्चुअल इंटेलिजेंस का उल्लेख किया था, उसे एक मैक्रो ध्यान तंत्र का निर्माण करके प्राप्त किया जा सकता है।
और इस मैक्रो ध्यान तंत्र को बड़े भाषा मॉडल की आंतरिक संरचना में जोड़ने या तंत्रिका नेटवर्क सीखने को शामिल करने की आवश्यकता नहीं है।
यह बस प्राकृतिक भाषा में लिखा गया एक स्पष्ट कथन हो सकता है, जैसे: "कार्य A निष्पादित करते समय, ज्ञान B और ज्ञान C का संदर्भ लें।"
यह कार्य A के लिए आवश्यक ज्ञान को स्पष्ट करता है। यह कथन स्वयं एक प्रकार का ज्ञान है।
इसे एक स्पष्ट ध्यान तंत्र कहा जा सकता है। इस कथन को ध्यान ज्ञान (Attention Knowledge) माना जा सकता है, जो उस ज्ञान को स्पष्ट रूप से व्यक्त करता है जिस पर कार्य A करते समय ध्यान केंद्रित किया जाना चाहिए।
इसके अलावा, इस ध्यान ज्ञान को जनरेटिव एआई द्वारा उत्पन्न या अद्यतन किया जा सकता है।
यदि किसी कार्य में ज्ञान की कमी के कारण विफलता होती है, तो इस प्रतिबिंब के आधार पर, उस कार्य के लिए संदर्भ के रूप में अतिरिक्त ज्ञान को शामिल करने के लिए ध्यान ज्ञान को अद्यतन किया जा सकता है।
निष्कर्ष
ध्यान तंत्र ने जनरेटिव एआई की क्षमताओं को नाटकीय रूप से उन्नत किया है।
यह केवल एक तंत्र नहीं था जो संयोग से अच्छी तरह से काम करता था; बल्कि, जैसा कि हमने यहां देखा है, प्रत्येक स्थिति के लिए संदर्भित की जाने वाली जानकारी को गतिशील रूप से सीमित करने का तंत्र ही उन्नत बुद्धिमत्ता का सार प्रतीत होता है।
और, वर्चुअल इंटेलिजेंस और स्पष्ट ध्यान ज्ञान की तरह, ध्यान तंत्र विभिन्न स्तरों पर बुद्धिमत्ता को पुनरावर्ती रूप से बढ़ाने की कुंजी भी है।