सामग्रीवर जा
हा लेख AI वापरून जपानीमधून अनुवादित केला गेला आहे
जपानीमध्ये वाचा
हा लेख सार्वजनिक डोमेन (CC0) मध्ये आहे. त्याचा मुक्तपणे वापर करा. CC0 1.0 Universal

सूक्ष्म आभासी बुद्धिमत्ता म्हणून लक्ष यंत्रणा

सध्याची जनरेटिव्ह एआय (Generative AI) ही एक एआय तंत्रज्ञान आहे जे ट्रान्सफॉर्मरच्या (Transformer) शोधानंतर एक मोठे यश म्हणून उदयास आले.

लक्ष यंत्रणा (Attention Mechanism) ट्रान्सफॉर्मरचे मुख्य वैशिष्ट्य म्हणून वर्णन केले जाऊ शकते. ट्रान्सफॉर्मरची घोषणा करणाऱ्या शोधनिबंधाच्या शीर्षकात “Attention Is All You Need” (लक्ष हीच एक गरज आहे) यातून हे स्पष्टपणे व्यक्त होते.

यामागील पार्श्वभूमी अशी आहे की, त्यावेळी एआय संशोधक एआयला मानवाप्रमाणे नैसर्गिक भाषा कुशलतेने हाताळता यावी यासाठी विविध प्रयत्न करत होते आणि चाचण्या व त्रुटींमधून यशस्वी झालेल्या पद्धतींना नावे देऊन शोधनिबंध प्रकाशित करत होते.

अनेक संशोधकांचा असा विश्वास होता की, या अनेक प्रभावी यंत्रणांना विविध मार्गांनी एकत्र करून, ते हळूहळू मानवाप्रमाणे नैसर्गिक भाषा हाताळण्यास सक्षम असे एआय तयार करू शकतील. ते इतर यंत्रणांसह कार्य करू शकणाऱ्या नवीन यंत्रणा शोधण्यावर आणि या यंत्रणांचे सर्वोत्तम संयोजन शोधण्यावर लक्ष केंद्रित करत होते.

मात्र, ट्रान्सफॉर्मरने ही पारंपरिक समजूत बदलून टाकली. विविध यंत्रणा एकत्र करण्याची गरज नाही, आणि केवळ लक्ष यंत्रणाच आवश्यक आहे, हा संदेश शोधनिबंधाच्या शीर्षकातून स्पष्ट होत होता.

ट्रान्सफॉर्मरमध्ये निश्चितच अनेक यंत्रणा समाविष्ट आहेत, तरीही लक्ष यंत्रणा त्यापैकी विशेषतः क्रांतिकारी आणि वेगळी होती यात शंका नाही.

लक्ष यंत्रणेचे विहंगावलोकन

लक्ष यंत्रणा (Attention Mechanism) ही एक प्रणाली आहे जी एआयला नैसर्गिक भाषेत विशिष्ट शब्दावर प्रक्रिया करताना, मागील वाक्यांमधील अनेक शब्दांपैकी कोणत्या शब्दांवर लक्ष केंद्रित करावे हे शिकण्याची अनुमती देते.

यामुळे एआयला एखाद्या शब्दाचा संदर्भ अचूकपणे समजून घेता येतो, उदाहरणार्थ, जेव्हा "हे", "ते" किंवा "नमूद केलेले" (मागील वाक्यातील शब्दाकडे निर्देश करणारे) यांसारख्या निर्देशवाचक शब्दांचा वापर केला जातो, किंवा "सुरुवातीचे वाक्य", "दुसरे उदाहरण" किंवा "मागील परिच्छेद" यांसारख्या स्थितीवाचक संदर्भांचा वापर केला जातो.

याव्यतिरिक्त, वाक्यात विशेषणे दूर असली तरी ती योग्यरित्या अर्थ लावू शकते आणि लांब मजकुरांमध्येही, सध्याचा शब्द ज्या संदर्भाचा उल्लेख करत आहे तो गमावल्याशिवाय शब्दांचा अर्थ लावू शकते, ज्यामुळे ते इतर वाक्यांमध्ये हरवत नाही.

हाच "लक्ष" (attention) चा उपयोग आहे.

याचा उलट अर्थ असा आहे की, सध्या प्रक्रिया होत असलेल्या शब्दाचा अर्थ लावताना, अनावश्यक शब्द मुखवटा घालून अर्थ लावण्यापासून काढून टाकले जातात.

दिलेल्या शब्दाचा अर्थ लावण्यासाठी आवश्यक असलेले शब्दच ठेवून आणि अनावश्यक शब्द काढून टाकून, अर्थ लावण्यासाठी असलेल्या शब्दांचा समूह कितीही मोठा मजकूर असला तरी तो काही शब्दांपुरताच मर्यादित राहतो, ज्यामुळे अर्थ लावण्याची घनता कमी होत नाही.

आभासी बुद्धिमत्ता

आता, थोडा विषय बदलून, मी आभासी बुद्धिमत्तेच्या संकल्पनेवर विचार करत आहे.

सध्या, व्यवसायासाठी जनरेटिव्ह एआय (Generative AI) वापरताना, जर कंपनीतील सर्व माहिती एकत्रित करून एआयला एकच ज्ञानकोष म्हणून दिली, तर ज्ञानाचे प्रमाण इतके जास्त होते की, एआयला ते योग्यरित्या प्रक्रिया करणे शक्य होत नाही.

या कारणामुळे, प्रत्येक कार्यासाठी ज्ञान वेगळे करणे अधिक प्रभावी ठरते, म्हणजेच प्रत्येक कार्यासाठी एआय चॅट तयार करणे किंवा विशिष्ट कार्यांसाठी विशेष एआय साधने (AI tools) बनवणे.

परिणामी, जेव्हा जटिल कार्ये केली जातात, तेव्हा या विभाजित ज्ञानासह असलेल्या एआय चॅट्स किंवा एआय साधनांना एकत्र करणे आवश्यक ठरते.

जरी हे जनरेटिव्ह एआयची सध्याची मर्यादा असली तरी, मुळात, भविष्यातील जनरेटिव्ह एआयमध्येही, विशिष्ट कार्यासाठी आवश्यक असलेल्या ज्ञानावरच लक्ष केंद्रित केल्यास अधिक अचूकता मिळेल.

त्याऐवजी, माझा विश्वास आहे की भविष्यातील जनरेटिव्ह एआय मानवांना ज्ञान विभाजित करण्याची गरज नसतानाही, परिस्थितीनुसार आवश्यक ज्ञान आंतरिकरित्या ओळखण्यास आणि वापरण्यास सक्षम असेल.

ही क्षमता म्हणजे आभासी बुद्धिमत्ता (Virtual Intelligence) होय. हे एकाच संगणकावर अनेक भिन्न ऑपरेटिंग सिस्टम्स चालवू शकणाऱ्या व्हर्च्युअल मशीनसारखे आहे. याचा अर्थ असा की, एकाच बुद्धिमत्तेमध्ये, वेगवेगळ्या विशेषज्ञांसह अनेक आभासी बुद्धिमत्ता कार्य करू शकतात.

सध्याची जनरेटिव्ह एआय देखील अनेक लोकांमधील चर्चांचे अनुकरण करू शकते किंवा अनेक पात्रांची कथा तयार करू शकते. त्यामुळे, आभासी बुद्धिमत्ता ही काही विशेष क्षमता नसून, सध्याच्या जनरेटिव्ह एआयचाच एक विस्तार आहे.

सूक्ष्म आभासी बुद्धिमत्ता

आभासी बुद्धिमत्तेची यंत्रणा, जी कार्याप्रमाणे आवश्यक ज्ञान मर्यादित करते, ती लक्ष यंत्रणेसारखेच काहीतरी करते.

दुसऱ्या शब्दांत सांगायचे तर, सध्या चालू असलेल्या कार्यावर आधारित केवळ संबंधित ज्ञानावर लक्ष केंद्रित करते आणि त्यावर प्रक्रिया करते, या अर्थाने ती लक्ष यंत्रणेसारखीच आहे.

याउलट, लक्ष यंत्रणा (Attention Mechanism) ही आभासी बुद्धिमत्तेसारखे काहीतरी साध्य करणारी यंत्रणा आहे असे म्हणता येईल. तथापि, मी कल्पना करत असलेली आभासी बुद्धिमत्ता ज्ञानाच्या संग्रहातून संबंधित ज्ञान निवडते, तर लक्ष यंत्रणा शब्दांच्या संग्रहाच्या युनिटवर कार्य करते.

या कारणामुळे, लक्ष यंत्रणेला सूक्ष्म आभासी बुद्धिमत्ता (Micro Virtual Intelligence) असे म्हणता येईल.

स्पष्ट लक्ष यंत्रणा

जर आपण लक्ष यंत्रणेला (Attention Mechanism) सूक्ष्म आभासी बुद्धिमत्ता म्हणून पाहिले, तर याउलट, मी पूर्वी उल्लेख केलेली आभासी बुद्धिमत्ता एक स्थूल लक्ष यंत्रणा (macro attention mechanism) तयार करून साध्य केली जाऊ शकते.

आणि या स्थूल लक्ष यंत्रणेला मोठ्या भाषा मॉडेल्सच्या अंतर्गत संरचनेत जोडण्याची किंवा न्यूरल नेटवर्क लर्निंगचा समावेश करण्याची आवश्यकता नाही.

ते केवळ नैसर्गिक भाषेत लिहिलेले एक स्पष्ट विधान असू शकते, जसे की: "कार्य अ (Task A) कार्यान्वित करताना, ज्ञान ब (Knowledge B) आणि ज्ञान क (Knowledge C) चा संदर्भ घ्या."

हे कार्य अ साठी आवश्यक ज्ञान स्पष्ट करते. हे विधान स्वतःच एक प्रकारचे ज्ञान आहे.

याला स्पष्ट लक्ष यंत्रणा (Explicit Attention Mechanism) असे म्हटले जाऊ शकते. हे विधान लक्ष ज्ञान (Attention Knowledge) मानले जाऊ शकते, जे कार्य अ करताना कोणत्या ज्ञानावर लक्ष केंद्रित केले पाहिजे हे स्पष्टपणे व्यक्त करते.

पुढे, हे लक्ष ज्ञान जनरेटिव्ह एआयद्वारे (generative AI) तयार किंवा अद्ययावित केले जाऊ शकते.

जर ज्ञानाच्या कमतरतेमुळे एखादे कार्य अयशस्वी झाले, तर त्या विचारमंथनावर आधारित, त्या कार्यासाठी संदर्भ म्हणून अतिरिक्त ज्ञान समाविष्ट करण्यासाठी लक्ष ज्ञान अद्ययावित केले जाऊ शकते.

निष्कर्ष

लक्ष यंत्रणेने (Attention Mechanism) जनरेटिव्ह एआयच्या (generative AI) क्षमतांमध्ये नाट्यमय वाढ केली आहे.

ही केवळ एक यंत्रणा नव्हती जी योगायोगाने चांगली काम करत होती; उलट, आपण येथे पाहिल्याप्रमाणे, प्रत्येक परिस्थितीसाठी संदर्भित माहिती गतिशीलपणे मर्यादित करण्याची यंत्रणाच प्रगत बुद्धिमत्तेचे सार असल्याचे दिसते.

आणि, आभासी बुद्धिमत्ता आणि स्पष्ट लक्ष ज्ञानाप्रमाणे, लक्ष यंत्रणा विविध स्तरांवर बुद्धिमत्तेला पुनरावृत्तीने वाढवण्यासाठी देखील महत्त्वाची आहे.