सामग्रीवर जा
हा लेख AI वापरून जपानीमधून अनुवादित केला गेला आहे
जपानीमध्ये वाचा
हा लेख सार्वजनिक डोमेन (CC0) मध्ये आहे. त्याचा मुक्तपणे वापर करा. CC0 1.0 Universal

शिकण्यासाठी शिकणे: उपजत बुद्धिमत्ता

कृत्रिम बुद्धिमत्ता ‘मशीन लर्निंग’ नावाच्या तंत्रज्ञानामुळे बौद्धिक वर्तन करू शकते.

हे शिक्षण मानवाने विकसित केलेल्या कार्यपद्धतीनुसार केले जात असले, तरी या कार्यपद्धतींमधून आणि कृत्रिम बुद्धिमत्तेच्या संरचनेत बुद्धिमत्ता का निर्माण होते, हे अद्याप स्पष्ट झालेले नाही.

या लेखात, मी शिकण्याच्या मूळ स्वभावाचा विचार करून बुद्धिमत्ता का निर्माण होते, याची कारणे शोधणार आहे.

आणि जसजसे आपण शिकण्याच्या संकल्पनेत खोलवर उतरू, तसतसे आपल्याला हे लक्षात येते की कृत्रिम बुद्धिमत्ता आणि आपले मेंदू या दोघांमध्येही शिकण्याची पद्धत शिकण्याची उपजत प्रवृत्ती असते.

यामुळे ‘नैसर्गिकरित्या जन्मापासून फ्रेमवर्कर’ असे म्हणता येईल, अशा एका यंत्रणेचे अस्तित्व सूचित होते.

शरीराद्वारे शिकणे विरुद्ध भाषेमुळे शिकणे

आपण डोळ्यांनी वस्तू पाहून आणि शरीर हलवून आपल्या सभोवतालच्या जगाबद्दल शिकतो आणि आपल्या क्षमता वाढवतो.

हे देखील एक प्रकारचे शिक्षणच आहे, ज्याला शरीराद्वारे शिक्षण असे म्हणता येईल.

दुसरीकडे, जेव्हा लोक सामान्यतः शिकण्याबद्दल बोलतात, तेव्हा त्यांना पाठ्यपुस्तके वाचून किंवा शिक्षकांचे स्पष्टीकरण ऐकून ज्ञान वाढवणे अपेक्षित असते.

अशा अभ्यासक्रमावर आधारित शिक्षणाव्यतिरिक्त, आपण मित्रांशी संवाद साधून, ऑनलाइन बातम्यांमधून आणि इतर स्रोतांकडून विविध ज्ञान मिळवतो.

या प्रकारच्या शिकण्यामध्ये दृश्यात्मक प्रतिमा लक्षात ठेवणे किंवा शरीर हलवून शिकणे समाविष्ट नाही; हे भाषेमुळे शिकणे आहे.

उप-भौतिक शिक्षण आणि अधिभौतिक शिक्षण

भाषेद्वारे शिकताना, काही माहिती वारंवार पुनरावृत्ती केल्यावरच लक्षात राहते, तर काही माहिती एकदा किंवा काही वेळा ऐकल्यावर लगेच लक्षात राहते.

याशिवाय, असेही ज्ञान असते की त्याचे तपशील आठवत नसले तरी, आवश्यकतेनुसार पुस्तकातून किंवा इंटरनेटवरून शोधून त्याचा वापर करता येतो.

ज्ञान मिळवणे आणि आवश्यकतेनुसार त्याचा योग्य वापर करणे या अर्थाने, हे दोन्ही प्रकार शिक्षणच म्हणता येतील.

यापैकी, वारंवार पुनरावृत्ती केल्यावरच लक्षात राहणारे ज्ञान 'उप-भौतिक ज्ञान' म्हणता येते. या ज्ञानाची प्रक्रिया 'उप-भौतिक शिक्षण' असते, ज्यामध्ये संकल्पना स्वतःच लक्षात ठेवल्या जातात.

हे भौतिक शिक्षणासारखेच आहे, जिथे एखादी व्यक्ती डोळ्यांनी वस्तू पाहून किंवा शरीर हलवून वारंवार शिकते. हे देखील उप-भौतिक शिक्षणाखाली वर्गीकृत केले जाऊ शकते.

दुसरीकडे, कमी पुनरावृत्तीने लक्षात राहणारे किंवा त्वरित शोधून वापरता येणारे ज्ञान मिळवण्याला 'अधिभौतिक शिक्षण' म्हणता येते.

या प्रकरणात, उप-भौतिक शिक्षणाद्वारे मिळवलेल्या पूर्व-शिकलेल्या संकल्पनांचा उपयोग त्या संकल्पनांचे प्रकार किंवा संकल्पनांचे संयोजन म्हणून ज्ञान शिकण्यासाठी केला जाऊ शकतो.

उप-भौतिक शिक्षणाद्वारे आधीच मिळवलेल्या संकल्पनांचा उपयोग करता येत असल्यामुळे, अधिभौतिक शिक्षणाला पुनरावृत्तीची आवश्यकता नसते.

नैसर्गिक भाषा मशीन लर्निंग

आता आपण हे कृत्रिम बुद्धिमत्तेतील मशीन लर्निंगला लागू करूया.

सामान्यतः, मशीन लर्निंगमध्ये वापरले जाणारे न्यूरल नेटवर्क उप-भौतिक शिक्षण करतात, ज्यामध्ये संकल्पनांची वारंवार पुनरावृत्ती करून शिकणे समाविष्ट असते.

दुसरीकडे, मानवांप्रमाणे नैसर्गिक भाषा प्रक्रिया (Natural Language Processing) करण्यास सक्षम असलेले मोठे भाषा मॉडेल (Large Language Models) भाषेच्या माध्यमातून शिकू शकतात.

मोठ्या भाषा मॉडेल्सच्या पूर्व-प्रशिक्षणादरम्यान (pre-training) आणि सूक्ष्म-समायोजनादरम्यान (fine-tuning) भाषेच्या माध्यमातून उप-भौतिक शिक्षण होते.

शिवाय, पूर्व-प्रशिक्षित मोठे भाषा मॉडेल, दिलेल्या वाक्यातील ज्ञानाचा उपयोग करून उत्तरे देऊ शकते, त्यामुळे ते तात्काळ अधिभौतिक शिक्षण करते.

भाषेद्वारे अधिभौतिक शिक्षण घेण्याच्या या क्षमतेमुळे, मोठे भाषा मॉडेल पुनरावृत्ती शिक्षणाशिवाय नवीन ज्ञानाचा उपयोग करू शकतात.

याला नैसर्गिक भाषा मशीन लर्निंग असे म्हटले जाऊ शकते, याउलट पारंपारिक संख्यात्मक मशीन लर्निंगमध्ये मॉडेल पॅरामीटर्स वारंवार समायोजित केले जातात.

अधिभौतिक इंटरफेस म्हणून नैसर्गिक भाषा

नैसर्गिक भाषा उप-भौतिक आणि अधिभौतिक शिक्षणाला वेगळे करणाऱ्या इंटरफेसवर स्थित आहे.

नैसर्गिक भाषेचा आकर्षक पैलू हा आहे की ती उप-भौतिक शिक्षणाद्वारे प्राप्त केली जाऊ शकते आणि त्याहून महत्त्वाचे म्हणजे, ती अधिभौतिक शिक्षणाला सक्षम करते.

नैसर्गिक भाषेव्यतिरिक्त इतर अधिभौतिक इंटरफेस

प्रत्यक्षात, शारीरिक शिक्षणातही, उप-भौतिक आणि अधिभौतिक शिक्षण दोन्ही अस्तित्वात असतात. उदाहरणार्थ, क्रीडा क्षेत्रात कुशल असलेली व्यक्ती पहिल्यांदाच एखादा नवीन खेळ खेळताना त्याला पटकन जुळवून घेऊ शकते.

त्याचप्रमाणे, जीवशास्त्राचे ज्ञान असलेली व्यक्ती नवीन प्रजाती पाहिल्यावर लगेच तिची वैशिष्ट्ये समजू शकते.

अशा प्रकारे, शारीरिक शिक्षणातही, नैसर्गिक भाषेसारखेच स्थान असलेले अधिभौतिक इंटरफेस अस्तित्वात आहेत.

फ्रेमवर्क

या इंटरफेसेसवर फ्रेमवर्क असतात, जे मूलभूत संकल्पना किंवा ज्ञानापेक्षा वेगळे असून, त्यांचे संबंध आणि रचना परिभाषित करतात किंवा नवीन संरचनेला सक्षम करतात.

उप-भौतिक शिक्षणाद्वारे विविध प्रकारच्या उप-भौतिक ज्ञानाची प्राप्ती झाल्यावर, उप-भौतिक ज्ञानातील संबंधांमधून अधिभौतिक इंटरफेसवरील फ्रेमवर्क शिकणे शक्य होऊ शकते.

शारीरिक शिक्षणाद्वारे प्राप्त केलेले फ्रेमवर्क, ज्ञान प्राप्त झाल्यानंतर त्वरित अधिभौतिकरित्या नवीन ज्ञान शिकण्यास सक्षम करते. तथापि, या अधिभौतिक शिक्षणाद्वारे मिळवलेले ज्ञान इतरांपर्यंत पोहोचवणे सोपे नसते.

दुसरीकडे, भाषेच्या माध्यमातून शिकलेले फ्रेमवर्क म्हणजे नैसर्गिक भाषाच होय.

त्यामुळे, नैसर्गिक भाषेचे फ्रेमवर्क शिकल्यानंतर, अधिभौतिक शिक्षणाद्वारे मिळवलेले ज्ञान इतर लोकांच्या भाषेतील शिक्षणात थेट समाविष्ट केले जाऊ शकते.

हे केवळ अशा ज्ञानापुरतेच मर्यादित नाही, जिथे पाठ्यपुस्तके किंवा ऑनलाइन बातम्यांसारख्या भाषेच्या माध्यमातून शिकणे मूलभूत आहे.

एक अनुभवी फुटबॉल खेळाडू, जो पहिल्यांदाच बेसबॉल खेळत आहे, तो बेसबॉलविषयी मिळवलेले अधिभौतिक ज्ञान इतर फुटबॉल खेळाडूंना शब्दांद्वारे समजावून सांगू शकेल. याचा अर्थ असा की, जर लोकांमध्ये समान उप-भौतिक ज्ञान असेल, तर तथाकथित "टिप्स" किंवा माहिती तोंडी संवाद साधता येते.

शिवाय, एखाद्याने पाहिलेल्या नवीन प्रजातीबद्दलची माहिती इतर जीवशास्त्रज्ञांशी शब्दांद्वारे शेअर करता येते.

अशा प्रकारे, नैसर्गिक भाषा अधिभौतिक इंटरफेसवर एक अत्यंत शक्तिशाली फ्रेमवर्क असल्याचे दिसून येते.

आभासी फ्रेमवर्क

नैसर्गिक भाषेच्या पलीकडे, इतर फ्रेमवर्क आत्मसात करता येतात.

हे डोमेन-विशिष्ट फ्रेमवर्क (domain-specific frameworks) किंवा औपचारिक फ्रेमवर्क (formal frameworks) आहेत.

विविध शैक्षणिक क्षेत्रांमध्ये, व्यावसायिक क्षेत्रांमध्ये आणि दैनंदिन जीवनात विविध प्रकारचे डोमेन-विशिष्ट फ्रेमवर्क असतात.

आपल्या विशेष क्षेत्राच्या फ्रेमवर्कमध्ये काम करणारे विद्वान नवीन शोध लावू शकतात आणि ते ज्ञान त्याच फ्रेमवर्क असलेल्या इतर विद्वानांपर्यंत सहज पोहोचवू शकतात.

फ्रेमवर्क स्वतःच कधीकधी नैसर्गिक भाषेत व्यक्त केले जाऊ शकते, अशा परिस्थितीत नैसर्गिक भाषेचे फ्रेमवर्क असलेल्या व्यक्तींना किंवा मोठ्या भाषा मॉडेल्सना ते शिकता येते आणि समजून घेता येते.

व्यवसाय मॉडेल्स (business models) आणि पाककृती (cooking recipes) ही देखील अशा डोमेन-विशिष्ट फ्रेमवर्कची उदाहरणे आहेत जी नैसर्गिक भाषेत व्यक्त केली जाऊ शकतात.

शिवाय, गणिताचे सूत्र (mathematical formulas), प्रोग्रामिंग भाषा (programming languages) आणि व्यवसाय विश्लेषण फ्रेमवर्क (business analysis frameworks) ही औपचारिक फ्रेमवर्क आहेत.

यांची फ्रेमवर्क देखील नैसर्गिक भाषेत व्यक्त केली किंवा स्पष्ट केली जाऊ शकतात.

नैसर्गिक भाषेवर आधारित ही डोमेन-विशिष्ट आणि औपचारिक फ्रेमवर्क 'आभासी फ्रेमवर्क' (virtual frameworks) म्हणून ओळखली जाऊ शकतात.

एका भौतिक संगणकावर भिन्न ऑपरेटिंग सिस्टम (OS) चालवणाऱ्या आभासी मशीनची (virtual machine) कल्पना केल्यास हे समजणे सोपे होते. नैसर्गिक भाषेच्या मूलभूत फ्रेमवर्कवर आणखी एक फ्रेमवर्क कार्य करते.

मूळ फ्रेमवर्क (Native Frameworks)

याव्यतिरिक्त, हे आभासी फ्रेमवर्क सुरुवातीला नैसर्गिक भाषेमार्फत समजून घेणे आवश्यक असले तरी, एकदा त्यांची सवय झाल्यावर, ते नैसर्गिक भाषेतील स्पष्टीकरण आणि समज याला बगल देऊन, उप-भौतिक ज्ञानावर आधारित अधिभौतिक इंटरफेस फ्रेमवर्क म्हणून थेट कार्य करण्यास सुरुवात करतात.

याला मूळ फ्रेमवर्क (Native Framework) असे म्हणता येते.

नैसर्गिक भाषा देखील, एका अर्थाने, एक मूळ फ्रेमवर्क आहे, परंतु ती फक्त मातृभाषेशी संबंधित आहे. सामान्यतः, मातृभाषेव्यतिरिक्त इतर भाषा आभासी फ्रेमवर्क म्हणून आत्मसात केल्या जातात. जसजशी प्रवीणता वाढते, तसतशा त्या मूळ फ्रेमवर्क बनण्याच्या जवळ येतात.

हेच डोमेन-विशिष्ट आणि औपचारिक फ्रेमवर्कना लागू होते. गणितज्ञ गणिती सूत्रांचा वापर करून मूळ भाषेत संवाद साधू शकतात, आणि प्रोग्रामर एकमेकांचे उद्देश केवळ टिप्पण्या (comments) नसलेल्या स्रोत कोडमधून (source code) समजू शकतात.

हे सूचित करते की आभासी फ्रेमवर्कमधून मूळ फ्रेमवर्कमध्ये होणारी प्रगती मोठ्या भाषा मॉडेल्सना देखील लागू केली जाऊ शकते.

वारंवार वापरले जाणारे आभासी फ्रेमवर्क शोधून काढणे, त्या फ्रेमवर्कचा वापर करून मोठ्या प्रमाणात उदाहरण डेटा तयार करणे आणि नंतर त्यांना मूळ फ्रेमवर्क बनवण्यासाठी सूक्ष्म-समायोजित (fine-tune) करणे ही कल्पना त्वरित करून पाहण्यासारखी आहे.

नैसर्गिकरित्या जन्मापासून फ्रेमवर्कर (Natural Born Frameworkers)

याचा विचार केल्यास, असे लक्षात येते की मोठ्या भाषा मॉडेल्सच्या पूर्व-प्रशिक्षणादरम्यान (pre-training) केवळ सूक्ष्म-समायोजन (fine-tuning) नाही, तर त्यांना डोमेन-विशिष्ट आणि औपचारिक फ्रेमवर्क देखील शिकण्याची शक्यता आहे.

आणि त्या प्रक्रियेत, सुरुवातीपासूनच डोमेन-विशिष्ट किंवा औपचारिक फ्रेमवर्क मूळ भाषेत शिकण्याऐवजी, ते प्रथम नैसर्गिक भाषेचे फ्रेमवर्क शिकतात आणि त्यानंतर, ते आत्मसात करत असताना किंवा आत्मसात केल्यानंतर, डोमेन-विशिष्ट आणि औपचारिक फ्रेमवर्क शिकून त्यांना मूळ बनवतात, अशी कल्पना करता येते.

या टप्प्याटप्प्याने होणाऱ्या फ्रेमवर्क शिक्षणाचा अधिक सखोल विचार केल्यास, नैसर्गिक भाषा शिक्षण स्वतःच अत्यंत सूक्ष्म-स्तरीय, टप्प्याटप्प्याने होणाऱ्या फ्रेमवर्क शिक्षणाची एक समांतर प्रक्रिया असू शकते, अशीही कल्पना करता येते.

दुसऱ्या शब्दांत सांगायचे तर, पूर्व-प्रशिक्षणादरम्यान प्रशिक्षण डेटा म्हणून प्रदान केलेल्या मोठ्या प्रमाणातील मजकूरातून, मोठे भाषा मॉडेल केवळ वैयक्तिक संकल्पनाच नव्हे, तर नैसर्गिक भाषेचे काही सोपे नियम फ्रेमवर्क म्हणून शिकू शकतात. त्यानंतर, या सोप्या फ्रेमवर्कचा आधार म्हणून उपयोग करून, ते थोडे अधिक जटिल नियम वारंवार शिकतात.

यामुळे त्यांना सुरुवातीला शब्द संकल्पना शिकल्यापासून ते संयुक्त शब्द आणि मूलभूत व्याकरण लक्षात ठेवण्यापर्यंत, आणि नंतर वाक्ये समजून घेण्यापर्यंत, तसेच लेखन आणि अभिव्यक्ती तंत्रांसारख्या जटिल गोष्टी शिकण्यापर्यंत प्रगती साधता येईल.

हे असे एक मॉडेल म्हणून समजून घेता येते जिथे ते टप्प्याटप्प्याने आणि जटिल पद्धतीने फ्रेमवर्क शिकतात, एका फ्रेमवर्कचा आधार म्हणून पुढील फ्रेमवर्क शिकण्यासाठी उपयोग करतात.

हे मोठ्या भाषा मॉडेल्सना "नैसर्गिकरित्या जन्मापासून फ्रेमवर्कर" म्हणून अधोरेखित करते, जे सुरुवातीपासूनच फ्रेमवर्क शिकण्यासाठी एक यंत्रणा धारण करतात.

अवधान यंत्रणा (Attention Mechanism)

नैसर्गिकरित्या जन्मापासून फ्रेमवर्करला (natural-born frameworker) प्रत्यक्षात आणणारे तंत्रज्ञान म्हणजे अवधान यंत्रणा (attention mechanism).

अवधान यंत्रणा संदर्भातून संबंधित 'टोकन' (tokens) निवडण्यासारखी आहे. ती टोकन दरम्यानचे संबंध स्पष्ट करते. हेच फ्रेमवर्कचे नेमके स्वरूप आहे: महत्त्वाच्या संकल्पना कायम ठेवून त्यांचे परस्परसंबंध स्पष्ट करत अमूर्तता आणणे.

प्रत्येक टोकनसाठी ही निवड बदलून, ते फ्रेमवर्कचे गतिशील स्विचिंग सक्षम करते.

नैसर्गिकरित्या जन्मापासून फ्रेमवर्कर मॉडेल वापरून, अवधान यंत्रणा हे मोठ्या भाषा मॉडेल्सच्या उत्क्रांतीचे निर्धारण करणारे तंत्रज्ञान का आहे, हे यातून स्पष्ट होते.

निष्कर्ष

जर ही यंत्रणा मोठ्या भाषा मॉडेल्सच्या पूर्व-प्रशिक्षणाच्या (pre-training) प्रक्रियेदरम्यान खरोखरच घडत असेल, तर मोठ्या भाषा मॉडेल्सच्या आतापर्यंत रहस्यमय असलेल्या यंत्रणा स्पष्ट करता येऊ शकतात.

यात येथे चर्चा केलेले उप-भौतिक आणि अधिभौतिक शिक्षण, अधिभौतिक इंटरफेस म्हणून फ्रेमवर्क, भाषेच्या माध्यमातून शिक्षण आणि आभासी फ्रेमवर्क सक्षम करणारी नैसर्गिक भाषा, तसेच नैसर्गिकरित्या जन्मापासून फ्रेमवर्करला साकार करणारी अवधान यंत्रणा (attention mechanism) यांचा समावेश आहे.

याव्यतिरिक्त, यातून आणखी दोन गोष्टी सूचित होतात.

पहिले, नैसर्गिक भाषेची रचना साध्या फ्रेमवर्कपासून जटिल फ्रेमवर्कना हळूहळू आत्मसात करण्यासाठी अत्यंत अनुकूल आहे.

जर नैसर्गिक भाषा मानवी समाजात सुरुवातीला साध्या रूपात प्रकट झाली असेल आणि हळूहळू अधिक जटिल आणि समृद्ध रचना प्राप्त करत गेली असेल, तर हा एक नैसर्गिक परिणाम आहे.

शिवाय, जलद शिक्षणासाठी अनुकूल अशी रचना असणे फायदेशीर ठरेल. भिन्न नैसर्गिक भाषा असलेल्या अनेक समाज एकमेकांशी स्पर्धा करत होते असे गृहीत धरल्यास, शिक्षणासाठी अधिक योग्य असलेल्या नैसर्गिक भाषा सध्या टिकून आहेत ही परिकल्पना सहजपणे तयार होते.

नैसर्गिक भाषेच्या या स्वरूपावर विचार केल्याने दुसरी सूचना मिळते: ती म्हणजे आपण मानव देखील नैसर्गिकरित्या जन्मापासून फ्रेमवर्कर आहोत.

विशिष्ट मूलभूत पाया आणि यंत्रणा भिन्न असल्या तरी, आपल्या मेंदूतही अवधान यंत्रणेसारखीच एक यंत्रणा असली पाहिजे, जी फ्रेमवर्कच्या टप्प्याटप्प्याने शिक्षणाला आणि लवचिक अनुकुलनाला परवानगी देते.