कृत्रिम बुद्धिमत्ता यंत्र शिक्षण (machine learning) या तंत्रज्ञानाद्वारे बुद्धिमान वर्तन (intelligent behavior) दर्शवू शकते.
जरी ही शिक्षण प्रक्रिया मानवाद्वारे विकसित केलेल्या कार्यपद्धतीनुसार होत असली तरी, या कार्यपद्धती आणि कृत्रिम बुद्धिमत्तेच्या संरचनेत बुद्धिमत्ता का निर्माण होते, हे अजून पूर्णपणे स्पष्ट झालेले नाही.
या लेखामध्ये, शिक्षणाच्या सारतत्त्वावर विचार करून, बुद्धिमत्तेच्या उदयाची कारणे शोधण्याचा माझा उद्देश आहे.
शिक्षणाच्या संकल्पनेचा आपण सखोल अभ्यास करत असताना, आपण या निष्कर्षावर पोहोचतो की कृत्रिम बुद्धिमत्ता आणि आपले मेंदू या दोघेही शिकायला कसे शिकावे याची जन्मजात क्षमता बाळगतात.
यावरून असे सूचित होते की 'नॅचरल बोर्न फ्रेमवर्कर' (Natural Born Frameworker) असे संबोधले जाणारे एक यंत्रणा अस्तित्वात आहे.
शरीराद्वारे शिक्षण आणि भाषेमार्फत शिक्षण
आपण वस्तू डोळ्यांनी पाहून आणि आपले शरीर हलवून आपल्या सभोवतालच्या जगाला समजून घेतो आणि आपल्या क्षमता वाढवतो.
हे देखील शिक्षणाचे एक रूप आहे, ज्याला शरीराद्वारे शिक्षण असे म्हटले जाऊ शकते.
दुसरीकडे, जेव्हा आपण सामान्यतः शिक्षणाचा विचार करतो, तेव्हा आपल्याला पाठ्यपुस्तके वाचून किंवा शिक्षकांचे स्पष्टीकरण ऐकून आपले ज्ञान वाढवण्याची कल्पना येते.
अशा शैक्षणिक अभ्यासक्रमावर आधारित शिक्षणाव्यतिरिक्त, आपण मित्रमंडळींशी बोलून, ऑनलाइन बातम्यांमधून आणि इतर स्त्रोतांकडून विविध ज्ञान प्राप्त करतो.
या प्रकारचे शिक्षण हे प्रतिमा दृश्यात्मकपणे लक्षात ठेवण्याबद्दल किंवा शारीरिक हालचालींद्वारे शिकण्याबद्दल नसून, भाषेमार्फत शिक्षण होय.
मेटाकॉग्निटिव्ह शिक्षण (Metacognitive Learning) आणि मेटाफिजिकल शिक्षण (Metaphysical Learning)
भाषेवर आधारित शिक्षणामध्ये, काही ज्ञान वारंवार पुनरावृत्ती केल्याशिवाय लक्षात ठेवता येत नाही, तर काही ज्ञान केवळ एकदा किंवा काही वेळा अनुभवल्यानंतर शिकता येते.
पर्यायाने, काही ज्ञान पूर्णपणे लक्षात नसले तरी, आवश्यकतेनुसार ते पुस्तकातून किंवा इंटरनेटवरून शोधून वापरले जाऊ शकते.
आवश्यकतेनुसार ज्ञान मिळवणे आणि योग्यरित्या वापरणे या अर्थाने, हे दोन्ही प्रकार शिक्षण मानले जाऊ शकतात.
यापैकी, वारंवार पुनरावृत्ती केल्याशिवाय जे ज्ञान लक्षात ठेवता येत नाही, त्याला मेटाकॉग्निटिव्ह ज्ञान (metacognitive knowledge) म्हटले जाऊ शकते. संकल्पना स्वतः शिकण्याची प्रक्रिया म्हणजे मेटाकॉग्निटिव्ह शिक्षण.
हे शारीरिक शिक्षणासारखे आहे, जिथे आपल्या डोळ्यांनी वस्तू पाहणे किंवा आपले शरीर हलवणे यात पुनरावृत्ती समाविष्ट असते. यांनाही मेटाकॉग्निटिव्ह शिक्षण म्हणून वर्गीकृत केले जाऊ शकते.
याउलट, कमी प्रयत्नांत लक्षात ठेवता येणारे किंवा जागेवर शोधून वापरता येणारे ज्ञान मिळवण्याला मेटाफिजिकल शिक्षण (metaphysical learning) म्हटले जाऊ शकते.
या प्रकरणात, मेटाकॉग्निटिव्ह शिक्षणातून प्राप्त झालेल्या पूर्व-शिकलेल्या संकल्पनांचा उपयोग नवीन ज्ञान त्या संकल्पनांचे प्रकार म्हणून किंवा संकल्पनांच्या संयोजनातून शिकण्यासाठी केला जाऊ शकतो.
मेटाकॉग्निटिव्ह शिक्षणाद्वारे आधीच पारंगत झालेल्या संकल्पनांचा वापर करता येत असल्याने, मेटाफिजिकल शिक्षणासाठी पुनरावृत्तीची आवश्यकता नसते.
नैसर्गिक भाषा यंत्र शिक्षण
आता आपण हे कृत्रिम बुद्धिमत्तेतील यंत्र शिक्षणाला (machine learning) लागू करूया.
सामान्यतः, यंत्र शिक्षणात वापरली जाणारी न्यूरल नेटवर्क्स मेटाकॉग्निटिव्ह शिक्षण (metacognitive learning) करतात, ज्यात संकल्पनांचे पुनरावृत्तीने शिक्षण समाविष्ट असते.
दुसरीकडे, मानवांप्रमाणे नैसर्गिक भाषा प्रक्रिया (natural language processing) करण्यास सक्षम असलेले मोठे भाषा मॉडेल (large language models) भाषेमार्फत शिक्षण (learning through language) करू शकतात.
मोठ्या भाषा मॉडेल्सच्या पूर्व-प्रशिक्षणादरम्यान (pre-training) आणि फाइन-ट्यूनिंगदरम्यान (fine-tuning) भाषा-आधारित मेटाकॉग्निटिव्ह शिक्षण होते.
प्रशिक्षित मोठे भाषा मॉडेल नंतर इनपुट वाक्यात असलेल्या ज्ञानाचा वापर करून उत्तर देऊ शकते, याचा अर्थ ते तात्काळ मेटाफिजिकल शिक्षण करत आहे.
भाषा-आधारित मेटाफिजिकल शिक्षणाची ही क्षमता मोठ्या भाषा मॉडेल्सना पुनरावृत्तीच्या शिक्षणाशिवाय नवीन ज्ञानाचा वापर करण्यास अनुमती देते.
याची तुलना पारंपरिक संख्यात्मक यंत्र शिक्षणाशी केली जाऊ शकते, जे मॉडेल पॅरामीटर्समध्ये पुनरावृत्तीने समायोजन करते, आणि याला नैसर्गिक भाषा यंत्र शिक्षण असे म्हटले जाऊ शकते.
नैसर्गिक भाषा हे मेटाफिजिकल इंटरफेस म्हणून
नैसर्गिक भाषा ही मेटाकॉग्निटिव्ह शिक्षण आणि मेटाफिजिकल शिक्षण यांना वेगळे करणाऱ्या इंटरफेसवर स्थित आहे.
नैसर्गिक भाषेचा मनोरंजक पैलू हा आहे की ती मेटाकॉग्निटिव्ह शिक्षणाद्वारे प्राप्त केली जाऊ शकते आणि तिच्या आधारे मेटाफिजिकल शिक्षण शक्य होते.
नैसर्गिक भाषेव्यतिरिक्त इतर मेटाफिजिकल इंटरफेस
खरं तर, शारीरिक शिक्षणामध्येही मेटाकॉग्निटिव्ह शिक्षण आणि मेटाफिजिकल शिक्षण अस्तित्वात असते. उदाहरणार्थ, खेळात कुशल असलेली व्यक्ती तिला कधीही अनुभव नसलेल्या नवीन खेळाशी त्वरित जुळवून घेऊ शकते.
त्याचप्रमाणे, जीवशास्त्राचे ज्ञान असलेली व्यक्ती जेव्हा नवीन प्रजाती पाहते, तेव्हा तिची वैशिष्ट्ये लगेच समजून घेऊ शकते.
अशा प्रकारे, शारीरिक शिक्षणामध्येही, नैसर्गिक भाषेसारखीच जागा असलेला एक मेटाफिजिकल इंटरफेस अस्तित्वात असतो.
फ्रेमवर्क
या इंटरफेसवर एक फ्रेमवर्क असते, जे मूलभूत संकल्पना किंवा ज्ञानापेक्षा वेगळे असते; ते त्यांचे संबंध आणि संरचना परिभाषित करते आणि नवीन संरचनेस सक्षम करते.
विविध मेटाकॉग्निटिव्ह ज्ञान मेटाकॉग्निटिव्ह शिक्षणाद्वारे प्राप्त केल्यावर, कधीकधी या मेटाकॉग्निटिव्ह ज्ञानांमधील संबंधांवरून मेटाफिजिकल इंटरफेसवरील फ्रेमवर्क शिकणे शक्य होते.
शारीरिक शिक्षणातून मिळालेले फ्रेमवर्क त्यावर प्रभुत्व मिळाल्यावर मेटाफिजिकल शिक्षणाद्वारे नवीन ज्ञान त्वरित प्राप्त करण्यास सक्षम करते. तथापि, अशा मेटाफिजिकल शिक्षणातून मिळालेले ज्ञान इतरांना सहजपणे सांगता येत नाही.
दुसरीकडे, भाषेमार्फत शिक्षणातून मिळालेले फ्रेमवर्क हे नैसर्गिक भाषा (natural language) स्वतःच असते.
म्हणून, नैसर्गिक भाषेचे फ्रेमवर्क शिकून मेटाफिजिकल शिक्षणाद्वारे प्राप्त केलेले ज्ञान थेट दुसऱ्या व्यक्तीच्या भाषा संपादनात (language acquisition) इनपुट केले जाऊ शकते.
हे केवळ पाठ्यपुस्तके किंवा ऑनलाइन बातम्यांसारख्या प्रामुख्याने भाषा संपादनावर आधारित ज्ञानालाच लागू होत नाही.
पहिल्यांदा बेसबॉल खेळणाऱ्या एका अनुभवी सॉकर खेळाडूला त्याने मिळवलेले बेसबॉलचे मेटाफिजिकल ज्ञान इतर अनुभवी सॉकर खेळाडूंना स्पष्टपणे सांगता येऊ शकते. याचा अर्थ असा की जर लोक समान मेटाकॉग्निटिव्ह ज्ञान सामायिक करत असतील, तर ते शब्दांचा वापर करून "टिप्स" किंवा "ट्रिक्स" म्हणून ओळखले जाणारे ज्ञान एकमेकांना सांगू शकतात.
याव्यतिरिक्त, आपण पाहिलेल्या नवीन प्रजातीबद्दलचे ज्ञान इतर जीवशास्त्रज्ञांना तोंडी सांगून ते ज्ञान सामायिक केले जाऊ शकते.
अशा प्रकारे, नैसर्गिक भाषा हे मेटाफिजिकल इंटरफेसवर स्थित एक अत्यंत शक्तिशाली फ्रेमवर्क असल्याचे दिसून येते.
आभासी फ्रेमवर्क
नैसर्गिक भाषेच्या वर, दुसरे फ्रेमवर्क प्राप्त केले जाऊ शकते.
यात डोमेन-विशिष्ट फ्रेमवर्क किंवा मेटाफिजिकल फ्रेमवर्क समाविष्ट आहेत.
विविध शैक्षणिक शाखा, व्यावसायिक क्षेत्रे आणि दैनंदिन जीवनात अनेक प्रकारची डोमेन-विशिष्ट फ्रेमवर्क (domain-specific frameworks) अस्तित्वात आहेत.
विद्वान त्यांच्या विशेष फ्रेमवर्कमध्ये नवीन शोध लावू शकतात आणि ते शोध ज्ञान म्हणून त्याच फ्रेमवर्क असलेल्या इतर विद्वानांना सहजपणे देऊ शकतात.
फ्रेमवर्क स्वतः कधीकधी नैसर्गिक भाषेत व्यक्त केले जाऊ शकते, अशा परिस्थितीत, नैसर्गिक भाषेचे फ्रेमवर्क असलेले व्यक्ती किंवा मोठे भाषा मॉडेल (large language models) ते प्राप्त करून समजू शकतात.
व्यवसाय मॉडेल्स (business models) आणि पाककृती (cooking recipes) ही देखील अशी डोमेन-विशिष्ट फ्रेमवर्कची उदाहरणे आहेत जी नैसर्गिक भाषेत व्यक्त केली जाऊ शकतात.
याव्यतिरिक्त, गणितीय सूत्रे, प्रोग्रामिंग भाषा (programming languages) आणि व्यवसाय विश्लेषण फ्रेमवर्क ही औपचारिक फ्रेमवर्क आहेत.
यांना देखील नैसर्गिक भाषेत व्यक्त किंवा स्पष्ट केले जाऊ शकते.
नैसर्गिक भाषेवर आधारित अशा डोमेन-विशिष्ट फ्रेमवर्क आणि औपचारिक फ्रेमवर्कना आभासी फ्रेमवर्क (virtual frameworks) म्हटले जाऊ शकते.
हे भौतिक संगणकावर दुसरे ऑपरेटिंग सिस्टम चालवणाऱ्या आभासी मशीनची (virtual machine) कल्पना करून सहज समजू शकते. नैसर्गिक भाषा हे पायाभूत फ्रेमवर्क म्हणून कार्य करते आणि त्यावर दुसरे फ्रेमवर्क कार्य करत असते.
मूळ फ्रेमवर्क
सुरुवातीला, हे आभासी फ्रेमवर्क (virtual framework) नैसर्गिक भाषेमार्फत (natural language) समजून घ्यावे लागते, परंतु सरावाने ते नैसर्गिक भाषेतील स्पष्टीकरण आणि समजूत बाजूला सारून थेट मेटाकॉग्निटिव्ह ज्ञानावर (metacognitive knowledge) आधारित मेटाफिजिकल इंटरफेस फ्रेमवर्क म्हणून कार्य करू लागते.
याला मूळ फ्रेमवर्क (native framework) म्हटले जाऊ शकते.
नैसर्गिक भाषा ही एका अर्थाने मूळ फ्रेमवर्क आहे, परंतु ती फक्त आपल्या मातृभाषेच्या बाबतीतच. सामान्यतः, मातृभाषेशिवायच्या इतर भाषा आभासी फ्रेमवर्क म्हणून आत्मसात केल्या जातात. जसजशी प्रवीणता वाढते, तसतसे त्या मूळ फ्रेमवर्कच्या स्थितीत येतात.
हेच डोमेन-विशिष्ट फ्रेमवर्क (domain-specific frameworks) आणि औपचारिक फ्रेमवर्कनाही लागू होते. गणितज्ञ गणिताची सूत्रे वापरून एकमेकांशी मूळ भाषेत संवाद साधू शकतात, आणि प्रोग्रामर्स एकमेकांच्या हेतू केवळ टिप्पणी नसलेल्या स्त्रोत कोडमधून (source code) समजून घेऊ शकतात.
यावरून असे सूचित होते की आभासी फ्रेमवर्कमधून मूळ फ्रेमवर्कमध्ये होणारे संक्रमण मोठ्या भाषा मॉडेल्सनाही (large language models) लागू केले जाऊ शकते.
वारंवार वापरले जाणारे आभासी फ्रेमवर्क शोधून, त्या आभासी फ्रेमवर्कचा वापर करून मोठ्या प्रमाणात उदाहरण डेटा (example data) तयार करणे आणि नंतर त्यांना फाइन-ट्यून (fine-tuning) करून मूळ फ्रेमवर्कमध्ये रूपांतरित करणे ही कल्पना त्वरित करून पाहण्यासारखी आहे.
नॅचरल बोर्न फ्रेमवर्कर
याचा विचार केल्यास, आपल्याला हे लक्षात येते की मोठे भाषा मॉडेल (large language models) ही विशेषीकृत आणि औपचारिक फ्रेमवर्क (frameworks) केवळ फाइन-ट्यूनिंग (fine-tuning) दरम्यानच नव्हे, तर पूर्व-प्रशिक्षणादरम्यानही (pre-training) शिकत असावीत.
पुढे, त्या प्रक्रियेत, हे शक्य आहे की ते सुरुवातीपासून विशेषीकृत किंवा औपचारिक फ्रेमवर्क मूळ स्वरूपात (natively) शिकत नाहीत. त्याऐवजी, ते प्रथम नैसर्गिक भाषा फ्रेमवर्क (natural language framework) शिकतात आणि नंतर, त्यात प्राविण्य मिळाल्यावर किंवा त्यादरम्यान, ते विशेषीकृत किंवा औपचारिक फ्रेमवर्क शिकतात आणि त्यांना मूळ फ्रेमवर्कमध्ये (native frameworks) समाविष्ट करतात.
फ्रेमवर्क शिकण्याच्या या वाढत्या संकल्पनेला अधिक सखोलपणे पाहिले असता, नैसर्गिक भाषा शिक्षण स्वतःच अत्यंत सूक्ष्म, वाढत्या फ्रेमवर्क शिक्षणाची एक समांतर पाइपलाइन असू शकते.
म्हणजे, पूर्व-प्रशिक्षणादरम्यान शिकण्याच्या डेटा म्हणून प्रदान केलेल्या मोठ्या प्रमाणात मजकूरातून, मोठे भाषा मॉडेल केवळ वैयक्तिक संकल्पनाच नव्हे, तर नैसर्गिक भाषेचे काही अत्यंत सोपे नियम फ्रेमवर्क म्हणून शिकत असावेत. त्यानंतर, या सोप्या फ्रेमवर्कचा आधार म्हणून वापर करून, ते थोडे अधिक जटिल नियम पुन्हा पुन्हा शिकत असावेत.
अशा प्रकारे, वैयक्तिक शब्द संकल्पना शिकण्याच्या टप्प्यापासून सुरुवात करून, ते संयुक्त शब्द आणि मूलभूत व्याकरण आत्मसात करू शकले पाहिजेत, नंतर वाक्ये समजून घेतली पाहिजेत आणि शेवटी साहित्यिक तंत्रे आणि अभिव्यक्ती शैली यांसारखे जटिल घटक शिकले पाहिजेत.
याला स्तरीकृत आणि संमिश्र फ्रेमवर्क शिक्षणाचे एक मॉडेल म्हणून समजून घेतले जाऊ शकते, जिथे एक फ्रेमवर्क पुढील शिकण्यासाठी आधार म्हणून कार्य करते.
हे मोठ्या भाषा मॉडेल्सना नॅचरल बोर्न फ्रेमवर्कर (Natural Born Frameworkers) म्हणून अधोरेखित करते, ज्यांच्यामध्ये सुरुवातीपासूनच फ्रेमवर्क शिकण्याची यंत्रणा अंतर्भूत असते.
लक्ष यंत्रणा (Attention Mechanism)
नॅचरल बोर्न फ्रेमवर्कर (Natural Born Frameworker) प्रत्यक्षात आणणारे तंत्रज्ञान म्हणजे लक्ष यंत्रणा (attention mechanism) आहे.
लक्ष यंत्रणा ही संदर्भात ज्या टोकन्सवर (tokens) लक्ष केंद्रित केले पाहिजे ते निवडण्यासारखी आहे. ती टोकन्स दरम्यानचे संबंध स्पष्ट करते. हेच फ्रेमवर्कचे (framework) स्वरूप आहे: महत्त्वाच्या संकल्पना राखून अमूर्तता आणणे, तर त्या संकल्पनांमधील संबंध स्पष्ट करणे.
प्रत्येक टोकनसाठी ही निवड बदलून, फ्रेमवर्क देखील गतिशीलपणे बदलणे शक्य होते.
हे आपल्याला स्पष्ट करते की लक्ष यंत्रणा ही मोठ्या भाषा मॉडेल्सच्या (large language models) उत्क्रांतीसाठी एक निर्णायक तंत्रज्ञान का आहे, हे नॅचरल बोर्न फ्रेमवर्करच्या मॉडेलचा वापर करून स्पष्ट केले जाऊ शकते.
निष्कर्ष
जर ही यंत्रणा मोठ्या भाषा मॉडेल्सच्या (large language models) पूर्व-प्रशिक्षणादरम्यान (pre-training) प्रत्यक्षात घडत असेल, तर या मॉडेल्सची पूर्वीची रहस्यमय यंत्रणा स्पष्ट करता येते.
या स्पष्टीकरणामध्ये आपण चर्चा केलेले मेटाकॉग्निटिव्ह आणि मेटाफिजिकल शिक्षण, मेटाफिजिकल इंटरफेस म्हणून फ्रेमवर्क, भाषा संपादन (language acquisition) आणि आभासी फ्रेमवर्कना सक्षम करणारी नैसर्गिक भाषा, तसेच नॅचरल बोर्न फ्रेमवर्करला (Natural Born Frameworker) प्रत्यक्षात आणणारी लक्ष यंत्रणा (attention mechanism) यांचा समावेश आहे.
याव्यतिरिक्त, यातून दोन अतिरिक्त निष्कर्ष निघतात.
प्रथम, नैसर्गिक भाषेत साध्या फ्रेमवर्कपासून हळूहळू जटिल फ्रेमवर्क मूळ फ्रेमवर्कमध्ये (native frameworks) विकसित करण्यासाठी अत्यंत योग्य रचना आहे.
जर नैसर्गिक भाषा सुरुवातीला मानवी समाजात साध्या स्वरूपात उदयास आली आणि हळूहळू अधिक जटिल आणि समृद्ध संरचना प्राप्त करण्यासाठी विकसित झाली, तर हा एक नैसर्गिक परिणाम आहे.
शिवाय, जलद शिक्षणासाठी उपयुक्त असलेली रचना फायदेशीर ठरेल. विविध नैसर्गिक भाषा असलेल्या अनेक समाजांनी स्पर्धा केली असे मानल्यास, शिकण्यासाठी सर्वात योग्य नैसर्गिक भाषा आजपर्यंत टिकून आहे ही परिकल्पना सहज स्थापित होते.
नैसर्गिक भाषेच्या स्वरूपावर चिंतन केल्याने दुसरा निष्कर्ष निघतो: की आपण मानव देखील नॅचरल बोर्न फ्रेमवर्कर आहोत.
विशिष्ट आधार आणि यंत्रणा भिन्न असल्या तरी, आपल्या मेंदूमध्ये देखील लक्ष यंत्रणेसारखी एक प्रणाली असली पाहिजे, जी हळूहळू फ्रेमवर्क शिकते आणि त्यांना लवचिकपणे सुधारित करते.