सामग्रीवर जा
हा लेख AI वापरून जपानीमधून अनुवादित केला गेला आहे
जपानीमध्ये वाचा
हा लेख सार्वजनिक डोमेन (CC0) मध्ये आहे. त्याचा मुक्तपणे वापर करा. CC0 1.0 Universal

सूक्ष्म आभासी बुद्धिमत्ता म्हणून लक्ष यंत्रणा (The Attention Mechanism as Micro Virtual Intelligence)

सध्याची जनरेटिव्ह AI ही एक AI तंत्रज्ञान आहे जी ट्रान्सफॉर्मर्सच्या (Transformers) शोधानंतर मोठ्या प्रमाणावर विकसित झाली, जो एक मोठा महत्त्वाचा शोध होता.

लक्ष यंत्रणा (Attention Mechanism) हे ट्रान्सफॉर्मरचे (Transformer) एक वैशिष्ट्य आहे. ट्रान्सफॉर्मरची (Transformer) घोषणा करणाऱ्या शोधनिबंधाच्या शीर्षकात हे थोडक्यात व्यक्त केले आहे: "Attention is All You Need."

त्यामागे असे कारण आहे की, त्यावेळी AI संशोधक AI ला मानवांप्रमाणे नैसर्गिक भाषा हाताळण्यासाठी विविध प्रयत्न आणि चाचण्या करत होते, आणि विविध यशस्वी पद्धतींना नावे देऊन शोधनिबंध प्रकाशित करत होते.

अनेक संशोधकांचा असा विश्वास होता की, अनेक चांगल्या प्रकारे कार्य करणाऱ्या या यंत्रणांना विविध मार्गांनी एकत्र केल्यास, मानवांसारखी नैसर्गिक भाषा हाताळणारी AI हळूहळू उदयास येईल. त्यामुळे ते इतर यंत्रणांसह कार्य करू शकणाऱ्या नवीन यंत्रणा शोधण्यावर आणि या यंत्रणांचे सर्वोत्तम संयोजन शोधण्यावर काम करत होते.

तथापि, ट्रान्सफॉर्मरने (Transformer) ही पारंपरिक विचारसरणी उलथून टाकली. विविध यंत्रणा एकत्र करण्याची गरज नाही, आणि फक्त लक्ष यंत्रणेची (attention mechanism) आवश्यकता आहे, हा संदेश शोधनिबंधाच्या शीर्षकात व्यक्त केला आहे.

अर्थात, ट्रान्सफॉर्मरमध्ये (Transformer) स्वतः विविध यंत्रणा समाविष्ट आहेत, परंतु त्यापैकी लक्ष यंत्रणा (attention mechanism) विशेषतः महत्त्वपूर्ण आणि वेगळी होती यात शंका नाही.

लक्ष यंत्रणेचे विहंगावलोकन (Overview of the Attention Mechanism)

लक्ष यंत्रणा (attention mechanism) ही एक अशी प्रणाली आहे जी नैसर्गिक भाषेवर शब्दशः प्रक्रिया करत असताना, एखाद्या विशिष्ट शब्दावर प्रक्रिया करताना वाक्यातील अनेक मागील शब्दांपैकी कोणत्या शब्दावर "लक्ष केंद्रित करावे" हे शिकू शकते.

यामुळे, "हा," "तो," किंवा "वर नमूद केलेला" (जे मागील वाक्यांमधील शब्दांना सूचित करतात) यांसारख्या शब्दांना किंवा "सुरुवातीचे वाक्य," "सूचीबद्ध दुसरे उदाहरण," किंवा "मागील परिच्छेद" (जे मजकुरातील स्थाने दर्शवतात) यांसारख्या वाक्प्रचारांना काय सूचित केले जाते हे अचूकपणे समजून घेण्यास मदत होते.

शिवाय, वाक्यात विशेषण दूर असले तरीही ते शब्दांचा योग्य अर्थ लावू शकते, आणि मजकूर कितीही मोठा असला तरीही, इतर वाक्यांमध्ये वर्तमान शब्दाचा संदर्भ न गमावता त्याचा अर्थ लावू शकते.

हे "लक्ष" चे उपयोग आहे.

याउलट, याचा अर्थ असाही होतो की, सध्या प्रक्रिया केलेल्या शब्दाचा अर्थ लावताना, अनावश्यक शब्द मुखवटा घालून अर्थ लावण्यापासून काढून टाकले जातात.

दिलेल्या शब्दाचा अर्थ लावण्याकरिता आवश्यक असलेले शब्दच ठेवून आणि अनावश्यक शब्द काढून टाकून, अर्थ लावण्यासाठी असलेल्या शब्दांचा समूह मर्यादित राहतो, मजकूर कितीही मोठा असला तरी, ज्यामुळे अर्थ लावण्याची घनता कमी होण्यापासून प्रतिबंधित होते.

आभासी बुद्धिमत्ता (Virtual Intelligence)

आता, विषय थोडा बदलून, मी आभासी बुद्धिमत्तेच्या संकल्पनेबद्दल विचार करत आहे.

सध्या, व्यवसायासाठी जनरेटिव्ह AI वापरताना, जर तुम्ही कंपनीतील सर्व माहिती एकत्र करून जनरेटिव्ह AI ला ज्ञान म्हणून पुरवली, तर ज्ञानाच्या प्रचंड प्रमाणामुळे AI ला ती माहिती योग्यरित्या हाताळणे कठीण होऊ शकते.

या कारणास्तव, कार्य-आधारित ज्ञान विभाजित करणे अधिक चांगले कार्य करते, प्रत्येक कार्यासाठी AI चॅट्स तयार करणे किंवा विशिष्ट कार्यांसाठी विशेष AI साधने तयार करणे.

याचा अर्थ असा होतो की, जटिल कार्यांसाठी, हे विभाजित ज्ञान-आधारित AI चॅट्स आणि साधने एकत्र करणे आवश्यक होते.

जनरेटिव्ह AI वापरताना ही एक सध्याची मर्यादा आहे, परंतु भविष्यातील जनरेटिव्ह AI मध्ये देखील, विशिष्ट कार्यांसाठी, त्या कार्यासाठी आवश्यक असलेल्या ज्ञानावरच लक्ष केंद्रित केल्यास अधिक अचूकता प्राप्त होईल.

त्याऐवजी, माझा असा विश्वास आहे की भविष्यातील जनरेटिव्ह AI मानवांना ज्ञानाचे विभाजन करण्याची आवश्यकता नसतानाही, परिस्थितीनुसार आवश्यक ज्ञान संचांमध्ये अंतर्गतपणे स्विच करण्यास सक्षम असेल.

ही क्षमता आभासी बुद्धिमत्ता आहे. हे एकाच संगणकावर अनेक भिन्न ऑपरेटिंग सिस्टिम चालवू शकणाऱ्या व्हर्च्युअल मशीनसारखे आहे. याचा अर्थ असा की एकाच बुद्धिमत्तेमध्ये, वेगवेगळ्या विशिष्ट क्षेत्रांमध्ये अनेक आभासी बुद्धिमत्ता कार्य करू शकतात.

सध्याची जनरेटिव्ह AI देखील अनेक लोकांमध्ये चर्चांचे अनुकरण करू शकते किंवा अनेक पात्रांचा समावेश असलेल्या कथा तयार करू शकते. त्यामुळे, आभासी बुद्धिमत्ता ही काही विशेष क्षमता नसून, सध्याच्या जनरेटिव्ह AI चाच विस्तार आहे.

सूक्ष्म आभासी बुद्धिमत्ता (Micro Virtual Intelligence)

आभासी बुद्धिमत्तेची यंत्रणा, जी कार्यनुसार आवश्यक ज्ञानाला मर्यादित करते, ती लक्ष यंत्रणेसारखेच काहीतरी करते.

म्हणजेच, सध्या प्रक्रिया केलेल्या कार्यावर अवलंबून, ती फक्त संबंधित ज्ञानावर लक्ष केंद्रित करते, या बाबतीत ती लक्ष यंत्रणेसारखीच आहे.

याउलट, लक्ष यंत्रणा ही आभासी बुद्धिमत्तेसारखे काहीतरी साकार करणारी यंत्रणा आहे असे म्हणता येईल. तथापि, मी ज्या आभासी बुद्धिमत्तेचा विचार करत आहे ती ज्ञानाच्या संचातून संबंधित ज्ञान निवडणारी यंत्रणा आहे, तर लक्ष यंत्रणा शब्दांच्या संचावर कार्य करते.

या कारणामुळे, लक्ष यंत्रणेला सूक्ष्म आभासी बुद्धिमत्ता असे म्हटले जाऊ शकते.

स्पष्ट लक्ष यंत्रणा (Explicit Attention Mechanism)

जर आपण लक्ष यंत्रणेला (attention mechanism) सूक्ष्म आभासी बुद्धिमत्ता मानले, तर याउलट, मी आधी उल्लेख केलेली आभासी बुद्धिमत्ता एक स्थूल लक्ष यंत्रणा (macro attention mechanism) तयार करून साकार केली जाऊ शकते.

आणि या स्थूल लक्ष यंत्रणेला मोठ्या भाषा मॉडेल्सच्या अंतर्गत संरचनेत जोडण्याची किंवा न्यूरल नेटवर्क प्रशिक्षणाची आवश्यकता नाही.

हे फक्त नैसर्गिक भाषेत लिहिलेले एक स्पष्ट वाक्य असू शकते, जसे की "कार्य अ (Task A) करताना, ज्ञान ब (Knowledge B) आणि ज्ञान क (Knowledge C) चा संदर्भ घ्या."

यामुळे कार्य अ साठी आवश्यक ज्ञान स्पष्ट होते. हे वाक्य स्वतःच एक प्रकारचे ज्ञान आहे.

याला स्पष्ट लक्ष यंत्रणा (explicit attention mechanism) असे म्हटले जाऊ शकते. हे वाक्य लक्ष ज्ञान (attention knowledge) म्हणून वर्णन केले जाऊ शकते, जे कार्य अ करताना कोणत्या ज्ञानावर लक्ष केंद्रित केले पाहिजे हे स्पष्टपणे नमूद करते.

शिवाय, हे लक्ष ज्ञान जनरेटिव्ह AI द्वारे तयार किंवा अद्यतनित केले जाऊ शकते.

जर ज्ञानाच्या कमतरतेमुळे एखादे कार्य अयशस्वी झाले, तर त्यातून धडा घेऊन, त्या कार्यासाठी संदर्भित केले जावे असे अतिरिक्त ज्ञान समाविष्ट करण्यासाठी लक्ष ज्ञान अद्यतनित केले जाऊ शकते.

निष्कर्ष (Conclusion)

लक्ष यंत्रणेने (attention mechanism) जनरेटिव्ह AI च्या क्षमतांमध्ये नाट्यमय सुधारणा केली आहे.

ही केवळ योगायोगाने चांगली काम करणारी यंत्रणा नव्हती; जसे आपण येथे पाहिले आहे, प्रत्येक परिस्थितीत संदर्भित करण्यासाठी माहिती गतिशीलपणे कमी करण्याची यंत्रणाच प्रगत बुद्धिमत्तेचे सार असल्याचे दिसते.

आणि आभासी बुद्धिमत्ता आणि स्पष्ट लक्ष ज्ञानाप्रमाणे, लक्ष यंत्रणा विविध स्तरांवर बुद्धिमत्तेला पुनरावर्तीपणे पुढे नेण्यासाठी देखील महत्त्वाची आहे.