सामग्रीवर जा
हा लेख AI वापरून जपानीमधून अनुवादित केला गेला आहे
जपानीमध्ये वाचा
हा लेख सार्वजनिक डोमेन (CC0) मध्ये आहे. त्याचा मुक्तपणे वापर करा. CC0 1.0 Universal

कृत्रिम शिक्षण बुद्धिमत्ता प्रणाली: ALIS संकल्पना

येथे, मी कृत्रिम शिक्षण बुद्धिमत्ता प्रणाली (Artificial Learning Intelligence System: ALIS) ची संकल्पना, तत्त्वे, मूलभूत रचना आणि विकास पद्धती तपशीलवारपणे स्पष्ट करून ती व्यवस्थित मांडू इच्छितो.

संकल्पना

सध्याची जनरेटिव्ह एआय, प्रामुख्याने मोठे भाषा मॉडेल्स (LLMs), न्यूरल नेटवर्क-आधारित पर्यवेक्षित शिक्षणावर प्रशिक्षित केली जातात.

शिकण्याच्या प्रक्रियेमध्ये, या न्यूरल नेटवर्कच्या शिक्षणाला आपण जन्मजात शिक्षण असे परिभाषित करतो.

ALIS, जन्मजात शिक्षणाव्यतिरिक्त, अधिग्रहित शिक्षण प्रक्रिया समाकलित करते, ज्यामुळे दोन्ही शिक्षण प्रक्रिया एकत्रित करून अनुमान काढता येते.

या अधिग्रहित शिक्षणामध्ये, शिकलेले ज्ञान न्यूरल नेटवर्कच्या बाहेर जमा केले जाते आणि अनुमानादरम्यान त्याचा उपयोग केला जातो.

म्हणून, ALIS चे तांत्रिक गाभा अनुमानादरम्यान पुन्हा वापरण्यायोग्य ज्ञानाचे निष्कर्षण (extraction), साठवण (storage) आणि निवड व उपयोग (selection and utilization) यामध्ये आहे.

शिवाय, ALIS ही केवळ एक मूलभूत तंत्रज्ञान नाही, तर जन्मजात शिक्षण आणि अधिग्रहित शिक्षण यांचा संगम साधणारी एक प्रणाली तंत्रज्ञान देखील आहे.

शिक्षण बुद्धिमत्ता प्रणालीचे घटक

ALIS या तत्त्वावर कार्य करते की, विद्यमान जन्मजात शिक्षण आणि भविष्यात विचारात घेतले जाणारे अधिग्रहित शिक्षण दोन्ही शिक्षण आणि अनुमान यांच्या समान फ्रेमवर्कचे अनुसरण करतात.

ALIS मधील शिक्षणाची तत्त्वे स्पष्ट करण्यासाठी, आपण शिक्षण बुद्धिमत्ता प्रणालीचे पाच घटक परिभाषित करतो.

पहिले आहे बौद्धिक प्रोसेसर. हे ज्ञान वापरून अनुमान करणारी आणि शिकण्यासाठी ज्ञान काढणारी प्रक्रिया प्रणाली संदर्भित करते.

मोठी भाषा मॉडेल्स (LLMs) आणि मानवी मेंदूचे काही भाग बौद्धिक प्रोसेसरची प्रमुख उदाहरणे आहेत.

दुसरे आहे ज्ञान संग्रह. हे एक साठवणूक ठिकाण संदर्भित करते जिथे काढलेले ज्ञान आवश्यकतेनुसार जतन आणि परत मिळवता येते.

LLMs मध्ये, ज्ञान संग्रह न्यूरल नेटवर्कच्या पॅरामीटर्सचा समावेश करतो. मानवांमध्ये, ते मेंदूतील दीर्घकालीन स्मृतीशी संबंधित आहे.

तिसरे आहे जग. हे मानव किंवा ALIS सारख्या शिक्षण बुद्धिमत्ता प्रणालीद्वारे अनुभवलेले बाह्य वातावरण संदर्भित करते.

मानवांसाठी, जग म्हणजे प्रत्यक्ष वास्तव. LLMs च्या बाबतीत, LLM कडून आउटपुट घेणारी आणि त्याला फीडबॅक देणारी यंत्रणा जगाच्या समतुल्य मानली जाऊ शकते.

चौथे आहे स्टेट मेमरी. हे शिक्षण बुद्धिमत्ता प्रणालीद्वारे अनुमानादरम्यान वापरली जाणारी अंतर्गत तात्पुरती मेमरी-सारखी घटक संदर्भित करते.

LLMs मध्ये, ही अनुमानादरम्यान वापरली जाणारी मेमरी स्पेस आहे, ज्याला हिडन स्टेट्स म्हणून ओळखले जाते. मानवांमध्ये, ते शॉर्ट-टर्म मेमरीशी संबंधित आहे.

पाचवे आहे फ्रेमवर्क. ही, एक प्रकारची, विचार रचना आहे. शिक्षण बुद्धिमत्ता प्रणालीच्या शब्दावलीमध्ये, हे अनुमानादरम्यान आवश्यक ज्ञान निवडण्याचे निकष आणि स्टेट मेमरी व्यवस्थित करण्यासाठी एक तार्किक स्टेट स्पेस रचना संदर्भित करते.

LLMs मध्ये, ही हिडन स्टेट्सची सिमेंटिक रचना आहे, आणि तिची सामग्री सामान्यतः अस्पष्ट आणि मानवांना समजण्यायोग्य नसते. शिवाय, ज्ञान निवड अटेंशन मेकॅनिझममध्ये एम्बेड केलेली असते, जी प्रक्रिया करत असलेल्या प्रत्येक टोकनसाठी कोणत्या विद्यमान टोकनचा संदर्भ घ्यावा हे निवडते.

मानवांमध्ये, वर नमूद केल्याप्रमाणे, ही एक विचार रचना आहे. जेव्हा एखादी विशिष्ट फ्रेमवर्क वापरून विचार केला जातो, तेव्हा दीर्घकालीन स्मृतीमधून विशिष्ट नो-हाऊचा संच आठवला जातो आणि शॉर्ट-टर्म मेमरीमध्ये लोड केला जातो. त्यानंतर, सध्याची समजलेली माहिती विचार फ्रेमवर्कनुसार व्यवस्थित केली जाते, जेणेकरून परिस्थिती समजून घेता येते.

शिक्षण बुद्धिमत्ता प्रणालीची तत्त्वे

शिक्षण बुद्धिमत्ता प्रणाली खालीलप्रमाणे कार्य करते:

एक बौद्धिक प्रोसेसर जगावर कार्य करतो. जग, या कृतीला प्रतिसाद म्हणून, परिणाम परत करते.

बौद्धिक प्रोसेसर या परिणामांमधून पुन्हा वापरण्यायोग्य ज्ञान काढतो आणि ते ज्ञान संग्रहात साठवतो.

जगावर पुनरावृत्तीने कार्य करताना, बौद्धिक प्रोसेसर ज्ञान संग्रहातून ज्ञान निवडतो आणि त्याच्या कृतींमध्ये बदल करण्यासाठी ते वापरतो.

ही मूलभूत यंत्रणा आहे.

तथापि, मूलभूतपणे, ज्ञान निष्कर्षण, साठवणूक, निवड आणि उपयोग करण्याच्या पद्धती निर्धारित करतात की प्रणाली अर्थपूर्ण शिक्षण करू शकते की नाही.

मानवांमध्ये ज्ञान निष्कर्षण, साठवणूक, निवड आणि उपयोग प्रभावीपणे हाताळण्याची यंत्रणा असते, ज्यामुळे ते शिकू शकतात.

LLMs सह न्यूरल नेटवर्क्समध्ये त्यांचे निष्कर्षण बाह्य शिक्षकांद्वारे हाताळले जाते, परंतु त्यांच्याकडे साठवणूक, निवड आणि उपयोग करण्याची यंत्रणा असते. यामुळे त्यांना शिक्षक मिळाल्यास ते शिकू शकतात.

शिवाय, एक शिक्षण बुद्धिमत्ता प्रणाली फ्रेमवर्कचे निष्कर्षण, साठवणूक आणि निवड, तसेच स्टेट मेमरीमध्ये त्यांच्या वापराच्या पद्धतींना ज्ञान म्हणून शिकू शकते, ज्यामुळे अधिक जटिल शिक्षण शक्य होते.

ज्ञानाचे प्रकार

या तत्त्वांवर आधारित, अधिग्रहित शिक्षणाची रचना करताना, अधिग्रहित ज्ञानाचे स्वरूप काय असेल हे स्पष्ट करणे आवश्यक आहे.

एक पद्धत अशी विचारात घेतली जाऊ शकते जिथे अधिग्रहित ज्ञान न्यूरल नेटवर्क पॅरामीटर्स म्हणून स्वतंत्रपणे शिकले जाते.

परंतु, अधिग्रहित ज्ञान केवळ न्यूरल नेटवर्क पॅरामीटर्सपुरते मर्यादित असण्याची गरज नाही. नैसर्गिक भाषेत मजकूर स्वरूपात असलेले ज्ञान हा एक व्यावहारिक पर्याय आहे.

नैसर्गिक भाषेत मजकूर स्वरूपात असलेले ज्ञान LLMs च्या नैसर्गिक भाषा प्रक्रिया क्षमतांचा लाभ घेऊन काढले आणि वापरले जाऊ शकते. शिवाय, ते मानक IT प्रणालींमध्ये डेटा म्हणून हाताळले जाऊ शकत असल्याने, साठवणूक आणि निवड देखील सोपी होते.

याव्यतिरिक्त, नैसर्गिक भाषेत मजकूर स्वरूपात असलेले ज्ञान मानवांना आणि इतर LLMs ना तपासणे, समजून घेणे आणि काही प्रकरणांमध्ये त्याची सामग्री संपादित करणे देखील सोपे आहे.

ते इतर शिक्षण बुद्धिमत्ता प्रणालींसोबत सामायिक केले जाऊ शकते, विलीन केले जाऊ शकते किंवा विभाजित केले जाऊ शकते.

या कारणांमुळे, ALIS संकल्पनेतील अधिग्रहित ज्ञान सुरुवातीला नैसर्गिक भाषेत मजकूर स्वरूपात असलेल्या ज्ञानाला लक्ष्य करून डिझाइन केले जाईल.

अधिग्रहित स्टेट मेमरी आणि फ्रेमवर्क

अधिग्रहित ज्ञानासाठी नैसर्गिक भाषा मजकूर स्वरूप निवडण्याचे फायदे आम्ही स्पष्ट केले आहेत.

त्याचप्रमाणे, अनुमान प्रक्रियेसाठी स्टेट मेमरी आणि फ्रेमवर्कसाठी देखील नैसर्गिक भाषा मजकूराचा वापर केला जाऊ शकतो.

फ्रेमवर्क, वैचारिक संरचना म्हणून, नैसर्गिक भाषेत मजकूर स्वरूपात असलेल्या ज्ञानाप्रमाणेच ज्ञान संग्रहात साठवले आणि वापरले जाऊ शकते.

फ्रेमवर्कद्वारे परिभाषित केलेल्या संरचनेवर आधारित स्थिती आरंभ करताना किंवा अद्यतनित करताना देखील, मजकूर-स्वरूपातील स्टेट मेमरी वापरली जाऊ शकते.

अशाप्रकारे, केवळ अधिग्रहित ज्ञानच नव्हे, तर फ्रेमवर्क आणि स्टेट मेमरी देखील मजकूर स्वरूपात डिझाइन केल्याने, ALIS सामान्यतः अधिग्रहित शिक्षण आणि अनुमानासाठी LLMs च्या नैसर्गिक भाषा प्रक्रिया क्षमतांचा लाभ घेऊ शकते.

औपचारिक ज्ञान

अधिग्रहित ज्ञान, फ्रेमवर्क आणि स्टेट मेमरी केवळ नैसर्गिक भाषेच्या मजकूरातच नव्हे, तर अधिक कठोर औपचारिक भाषांमध्ये किंवा औपचारिक मॉडेल्समध्ये देखील व्यक्त केली जाऊ शकतात.

मी "निवडा" असे लिहिले असले तरी, ALIS चे उद्दिष्ट अनेक भिन्न अधिग्रहित ज्ञान शिक्षण यंत्रणा समाविष्ट करणे आहे जेणेकरून जन्मजात आणि अधिग्रहित शिक्षणाचा संकरित वापर सक्षम होईल.

औपचारिक भाषा किंवा औपचारिक मॉडेल्सद्वारे दर्शविलेले ज्ञान अधिक अचूक आणि संदिग्धता रहित केले जाऊ शकते.

शिवाय, जर एखादे फ्रेमवर्क औपचारिक भाषा किंवा मॉडेल वापरून व्यक्त केले गेले आणि स्टेट मेमरीमध्ये एक प्रारंभिक स्थिती उघड झाली, तर LLM ऐवजी औपचारिक मॉडेल्सवर प्रक्रिया करण्यास सक्षम असलेल्या बौद्धिक प्रोसेसरद्वारे कठोर मॉडेलसह एक सिम्युलेशन किंवा तार्किक विकास केला जाऊ शकतो.

अशा औपचारिक भाषा किंवा औपचारिक मॉडेल्सचे एक प्रमुख उदाहरण प्रोग्रामिंग भाषा आहेत.

प्रणाली जगाबद्दल शिकत असताना, जर ती त्यात आढळणारे नियम आणि संकल्पना फ्रेमवर्कमधील प्रोग्राम म्हणून व्यक्त करू शकली, तर ती संगणकावर त्यांचे सिम्युलेशन करू शकते.

स्तंभ 1: ज्ञानाचे प्रकार

शिक्षण बुद्धिमत्ता प्रणालीमधील ज्ञानाची मांडणी करताना, ते व्यापकपणे तीन प्रकारच्या ज्ञान प्रणालींमध्ये आणि दोन प्रकारच्या स्थितींमध्ये (state) वर्गीकृत केले जाऊ शकते हे स्पष्ट होते.

तीन ज्ञान प्रणाली अशा आहेत: न्यूरल नेटवर्क्सद्वारे हाताळले जाणारे नेटवर्क पॅरामीटर ज्ञान; नैसर्गिक भाषेत व्यक्त केलेले नैसर्गिक ज्ञान; आणि औपचारिक भाषांमध्ये व्यक्त केलेले औपचारिक ज्ञान.

दोन प्रकारच्या स्थिती अशा आहेत: स्टेटलेस आणि स्टेटफुल.

स्टेटलेस नेटवर्क पॅरामीटर ज्ञान हे डीप लर्निंग एआयमध्ये आढळणाऱ्या अंतर्ज्ञानी ज्ञानासारखे आहे. मांजरी आणि कुत्र्यांची वैशिष्ट्ये, ज्यांचा स्पष्टपणे विचार केला जाऊ शकत नाही किंवा तोंडी ओळखता येत नाहीत, ती स्टेटलेस नेटवर्क पॅरामीटर ज्ञान म्हणून शिकली जाऊ शकतात.

स्टेटफुल नेटवर्क पॅरामीटर ज्ञान हे जनरेटिव्ह एआयमध्ये आढळणाऱ्या अस्पष्ट, पुनरावृत्तीच्या प्रक्रियांद्वारे उदयास येणारे ज्ञान आहे.

स्टेटलेस नैसर्गिक ज्ञान हे वैयक्तिक शब्दांशी जोडलेल्या अर्थासारखे ज्ञान आहे.

स्टेटफुल नैसर्गिक ज्ञान हे वाक्यांमधील संदर्भ (context) समाविष्ट करणारे ज्ञान आहे.

काही नैसर्गिक ज्ञान हे स्टेटफुल नेटवर्क पॅरामीटर ज्ञानात जन्मानेच समाविष्ट असते, परंतु नैसर्गिक भाषेच्या मजकूरातून देखील ज्ञान मिळवता येते.

स्टेटलेस औपचारिक ज्ञान हे पुनरावृत्तीशिवाय गणितीय सूत्रांमध्ये व्यक्त केले जाऊ शकणारे ज्ञान आहे. स्टेटफुल औपचारिक ज्ञान हे प्रोग्राम म्हणून व्यक्त केले जाऊ शकणारे ज्ञान आहे.

नैसर्गिक ज्ञान आणि औपचारिक ज्ञानासाठी स्टेट मेमरी म्हणून स्वतःची शॉर्ट-टर्म मेमरी देखील वापरली जाऊ शकते.

तथापि, ती शॉर्ट-टर्म मेमरी असल्याने, स्थिती स्थिरपणे राखणे कठीण होते ही एक समस्या आहे. शिवाय, औपचारिक, संदिग्धता रहित स्थिती राखण्यात ती निपुण नाही.

दुसरीकडे, कागद, संगणक आणि स्मार्टफोन नैसर्गिक भाषा मजकूर, औपचारिक भाषा किंवा औपचारिक मॉडेल लिहिण्यासाठी किंवा संपादित करण्यासाठी स्टेट मेमरी म्हणून वापरले जाऊ शकतात.

सामान्यतः, कागदावरील किंवा संगणकावरील डेटा ज्ञानाची साठवणूक करण्यासाठी ज्ञान संग्रह म्हणून पाहिला जातो, परंतु तो विचार व्यवस्थित करण्यासाठी स्टेट मेमरी म्हणून देखील वापरला जाऊ शकतो.

अशाप्रकारे, हे स्पष्ट आहे की मानव या तीन ज्ञान प्रणालींचा आणि दोन प्रकारच्या स्थितींचा पूर्ण वापर करून बौद्धिक कार्ये करतो.

ALIS मध्ये देखील, या समान तीन ज्ञान प्रणालींचा आणि दोन प्रकारच्या स्थितींचा लाभ घेणाऱ्या बौद्धिक कार्यांना सक्षम करून आणि मजबूत करून तिच्या क्षमतांमध्ये नाट्यमय वाढ करण्याची क्षमता आहे.

विशेषतः, ALIS मध्ये विशाल ज्ञान संग्रह आणि स्टेट मेमरी वापरण्याची ताकद आहे. शिवाय, ते प्रत्येकी अनेक तयार करून आणि त्यांना स्विच करून किंवा एकत्र करून बौद्धिक कार्ये सहजपणे करू शकते.

स्तंभ 2: बुद्धिमान ऑर्केस्ट्रेशन

ज्ञान संग्रहात मोठ्या प्रमाणात ज्ञान जमा करण्याची क्षमता हा एक फायदा असला तरी, जनरेटिव्ह एआय एकाच वेळी प्रक्रिया करू शकणाऱ्या टोकन संख्येवरील मर्यादा आणि अनावश्यक ज्ञानामुळे निर्माण होणाऱ्या आवाजामुळे (noise) ज्ञानाची मात्रा केवळ बौद्धिक कार्यात फायदेशीर ठरते असे नाही.

याउलट, ज्ञान संग्रहाचे योग्यरित्या विभाजन करून आणि त्याला उच्च-घनतेच्या विशेष ज्ञान संग्रहांमध्ये रूपांतरित करून, प्रत्येक विशिष्ट बौद्धिक कार्यासाठी आवश्यक असलेले ज्ञान समाविष्ट करून, टोकन मर्यादा आणि आवाजाच्या समस्या कमी केल्या जाऊ शकतात.

या बदल्यात, प्रत्येक विशेष ज्ञान संग्रह केवळ त्याच्या नियुक्त केलेल्या बौद्धिक कार्यासाठी वापरता येईल.

अनेक बौद्धिक क्रियाकलाप विविध बौद्धिक कार्यांचे जटिल मिश्रण असतात. त्यामुळे, ज्ञानाला बौद्धिक कार्यांच्या प्रकारानुसार विशेष ज्ञान संग्रहांमध्ये विभाजित करून आणि बौद्धिक क्रियाकलापांना वैयक्तिक कार्यांमध्ये उपविभाजित करून, ALIS या विशेष ज्ञान संग्रहांमध्ये योग्यरित्या स्विच करून संपूर्ण बौद्धिक क्रियाकलाप कार्यान्वित करू शकते.

हे ऑर्केस्ट्रासारखे आहे, ज्यात भिन्न वाद्ये वाजवणारे व्यावसायिक संगीतकार आणि समूहाचे नेतृत्व करणारा कंडक्टर असतो.

या प्रणाली तंत्रज्ञानाद्वारे, म्हणजेच बुद्धिमान ऑर्केस्ट्रेशनद्वारे, ALIS आपले बौद्धिक क्रियाकलाप व्यवस्थित करू शकेल.

ALIS मूलभूत रचना आणि विकास पद्धत

येथून पुढे, आपण ALIS च्या विकासाची मांडणी करू.

तत्त्वे आणि स्तंभांमध्ये आधीच चर्चा केल्याप्रमाणे, ALIS कार्यांच्या आणि संसाधनांच्या सोप्या विस्तारासाठी आंतरिकरित्या डिझाइन केले आहे. कारण ALIS चे सार विशिष्ट कार्यांमध्ये नाही, तर ज्ञान निष्कर्षण, साठवणूक, निवड आणि उपयोग या प्रक्रियेमध्ये आहे.

उदाहरणार्थ, अनेक प्रकारच्या ज्ञान निष्कर्षण यंत्रणा पुरविल्या जाऊ शकतात आणि प्रणाली रचना त्यांना निवडण्यासाठी किंवा एकाच वेळी वापरण्यासाठी मुक्त पर्याय देते.

शिवाय, ALIS स्वतः ही निवड करण्यास सक्षम केले जाऊ शकते.

त्याचप्रमाणे, साठवणूक, निवड आणि उपयोग देखील मुक्तपणे निवडले किंवा समांतर केले जाऊ शकतात.

म्हणून, ALIS ला वॉटरफॉल पद्धतीने संपूर्ण कार्यक्षमतेची रचना न करता, वाढत्या आणि चपळ पद्धतीने विकसित केले जाऊ शकते.

ALIS ची सुरुवात

आता, चला एक अगदी सोपी ALIS डिझाइन करूया.

मूलभूत यूआय एक परिचित चॅट एआय असेल. सुरुवातीला, वापरकर्त्याचे इनपुट थेट LLM ला दिले जाते. LLM चा प्रतिसाद यूआयवर प्रदर्शित केला जातो आणि प्रणाली पुढील वापरकर्त्याच्या इनपुटची वाट पाहते.

पुढील इनपुट प्राप्त झाल्यावर, LLM ला केवळ नवीन इनपुटच नव्हे, तर वापरकर्ता आणि LLM यांच्यातील संपूर्ण चॅट इतिहास देखील दिला जातो.

या चॅट एआयच्या यूआयच्या मागे, चॅट इतिहासातून पुन्हा वापरण्यायोग्य ज्ञान काढण्यासाठी एक यंत्रणा तयार केली जाते.

ही यंत्रणा चॅट एआय प्रणालीमध्ये अशी प्रक्रिया म्हणून जोडली जाऊ शकते जी संभाषण संपल्यावर किंवा नियमित अंतराने चालते. अर्थात, ज्ञान निष्कर्षणसाठी LLM वापरले जाते.

या LLM ला ALIS संकल्पना आणि तत्त्वे, तसेच ज्ञान निष्कर्षणचे ज्ञान, एक प्रणाली प्रॉम्प्ट म्हणून दिले जाते. जर ज्ञान हेतूने काढले गेले नाही, तर प्रणाली प्रॉम्प्ट चाचणी आणि त्रुटीद्वारे सुधारित केले पाहिजे.

चॅट इतिहासातून काढलेले ज्ञान थेट ज्ञान तलावात साठवले जाते. ज्ञान तलाव म्हणजे ज्ञान संरचित करण्यापूर्वी ते सपाट स्थितीत साठवण्यासाठी एक साधी यंत्रणा.

पुढे, ज्ञान तलावातून ज्ञान निवडणे सोपे करण्यासाठी एक संरचना यंत्रणा तयार केली जाते.

यात सामान्य RAG मध्ये वापरल्याप्रमाणे सिमेंटिक शोधसाठी एम्बेडिंग वेक्टर स्टोअर आणि कीवर्ड इंडेक्स प्रदान करणे समाविष्ट आहे.

इतर शक्यतांमध्ये अधिक प्रगत ज्ञान ग्राफ तयार करणे किंवा श्रेणी वर्गीकरण करणे समाविष्ट आहे.

ज्ञान तलावासाठी संरचित माहितीच्या या संग्रहाला ज्ञान आधार म्हटले जाईल. हा संपूर्ण ज्ञान आधार आणि ज्ञान तलाव ज्ञान संग्रह म्हणून काम करेल.

पुढे, ज्ञान संग्रह चॅट यूआयच्या प्रक्रियेत समाकलित केला जातो.

हे मूलतः सामान्य RAG यंत्रणेसारखेच आहे. वापरकर्त्याच्या इनपुटसाठी, ज्ञान संग्रहातून संबंधित ज्ञान निवडले जाते आणि वापरकर्त्याच्या इनपुटसह LLM ला दिले जाते.

यामुळे LLM ला वापरकर्त्याच्या इनपुटवर प्रक्रिया करताना आपोआप ज्ञानाचा वापर करता येतो.

अशा प्रकारे, वापरकर्त्यासोबतच्या प्रत्येक संभाषणाने ज्ञान वाढते, ज्यामुळे मागील संभाषणांमधून जमा झालेल्या ज्ञानाचा उपयोग करणारी एक सोपी ALIS शक्य होते.

एक साधे उदाहरण

उदाहरणार्थ, कल्पना करा की एक वापरकर्ता या साध्या ALIS चा वापर करून एक वेब ॲप्लिकेशन विकसित करत आहे.

वापरकर्ता LLM ने प्रस्तावित केलेल्या कोडमुळे एक त्रुटी (error) आल्याचे कळवतो. त्यानंतर, वापरकर्ता आणि LLM समस्येचे निराकरण करण्यासाठी सहयोग करतात. समजा त्यांना असे आढळून आले की LLM ला माहिती असलेली बाह्य API ची तपशीलिका (specification) जुनी होती आणि नवीनतम API तपशीलिका वापरल्याने समस्या सुटली.

या प्रकरणात, LLM ची API तपशीलिका जुनी होती आणि नवीनतम API तपशीलिका काय आहे, हे ज्ञान या चॅट थ्रेडमधून ज्ञान संग्रहात (knowledge store) जमा केले जाऊ शकते.

नंतर, जेव्हा पुढील वेळी त्याच API चा वापर करणारा प्रोग्राम तयार करायचा असेल, तेव्हा ALIS या ज्ञानाचा उपयोग करून सुरुवातीपासूनच नवीनतम API तपशीलिकेवर आधारित प्रोग्राम तयार करू शकेल.

प्रारंभिक ALIS मध्ये सुधारणा

परंतु, हे होण्यासाठी, वापरकर्त्याच्या इनपुटला प्रतिसाद म्हणून हे ज्ञान निवडले जाणे आवश्यक आहे. असे असू शकते की हे ज्ञान थेट वापरकर्त्याच्या इनपुटशी संबंधित नाही, कारण समस्याग्रस्त एपीआयचे नाव सुरुवातीच्या वापरकर्त्याच्या इनपुटमध्ये दिसण्याची शक्यता कमी आहे.

अशा परिस्थितीत, एपीआयचे नाव LLM च्या प्रतिसादात पहिल्यांदाच उदयास येईल.

म्हणून, आम्ही साध्या ALIS ला थोडे वाढवून, प्री-चेक टिप्पणी आणि पोस्ट-चेक टिप्पणीसाठी एक यंत्रणा जोडू.

प्री-चेक टिप्पणी ही LLMs मधील अलीकडील "विचार मोड" सारखी आहे. आम्ही स्टेट मेमरी म्हणून मजकूर धारण करू शकणारी एक मेमरी तयार करतो आणि सिस्टम प्रॉम्प्टद्वारे LLM ला वापरकर्त्याचे इनपुट प्राप्त झाल्यावर प्री-चेक टिप्पणी करण्यास सूचित करतो.

LLM चा प्री-चेक टिप्पणी परिणाम नंतर स्टेट मेमरीमध्ये ठेवला जातो आणि या परिणामावर आधारित, ज्ञान संग्रहातून ज्ञान निवडले जाते.

नंतर, चॅट इतिहास, प्री-चेक टिप्पणी परिणाम, वापरकर्त्याच्या इनपुटशी संबंधित ज्ञान आणि प्री-चेक टिप्पणी परिणामाशी संबंधित ज्ञान LLM ला त्याचा आउटपुट मिळवण्यासाठी दिले जाते.

शिवाय, LLM द्वारे परत आलेल्या परिणामासाठी, ज्ञान संग्रहात ज्ञान शोधले जाते. तेथे आढळलेले कोणतेही ज्ञान समाविष्ट करून, LLM ला नंतर पोस्ट-चेक करण्यास सांगितले जाते.

जर काही समस्या आढळल्यास, समस्यांचे मुद्दे आणि त्यावरील टिप्पण्या/फीडबॅकची कारणे यासह ते पुन्हा चॅट LLM ला पाठवले जातात.

प्री-चेक टिप्पणी आणि पोस्ट-चेक टिप्पणी या दोन्ही दरम्यान ज्ञान निवडण्याची संधी उपलब्ध करून दिल्याने, जमा झालेल्या ज्ञानाचा उपयोग होण्याची शक्यता वाढवता येते.

दृष्टिकोन

प्रारंभिक ALIS तयार करणे आणि त्याच्या कमतरता दूर करण्यासाठी सुधारणा जोडण्याची प्रक्रिया म्हणजे अचूक चपळ विकास आहे, जे दर्शवते की ALIS मध्ये वाढीव सुधारणा केल्या जाऊ शकतात.

शिवाय, उदाहरणार्थ दाखवल्याप्रमाणे, प्रारंभिक ALIS सॉफ्टवेअर विकासात वापरण्यासाठी सर्वात योग्य आहे. याचे कारण असे की हे एक उच्च मागणी असलेले क्षेत्र आहे आणि जिथे ज्ञान स्पष्टपणे जमा केले जाऊ शकते.

हे असे एक क्षेत्र आहे जिथे परिणाम संदिग्ध नसतात, तरीही चाचणी-आणि-त्रुटी, पुनरावृत्तीने ज्ञान संचयनामुळे याला खूप फायदा होतो आणि ते आवश्यकही आहे.

याव्यतिरिक्त, ALIS विकास स्वतःच सॉफ्टवेअर विकास असल्याने, ALIS विकसक देखील ALIS वापरकर्ता असू शकतात हा एक आकर्षक पैलू आहे.

शिवाय, ALIS प्रणालीसोबतच, ज्ञान तलाव (knowledge lake) GitHub सारख्या प्लॅटफॉर्मवर खुलेपणाने सामायिक केले जाऊ शकते.

यामुळे अनेक व्यक्तींना ALIS प्रणालीच्या सुधारणेत आणि ज्ञान संचयनात योगदान देता येईल, ज्यामुळे सर्वांना फायदे मिळतील आणि ALIS चा विकास कार्यक्षमतेने आणखी वेगवान होईल.

अर्थात, ज्ञान सामायिकरण केवळ ALIS विकसकांपुरते मर्यादित नाही; ते ALIS वापरणाऱ्या सर्व सॉफ्टवेअर विकसकांकडून गोळा केले जाऊ शकते.

ज्ञानाचा नैसर्गिक भाषेचा प्रकार दोन अतिरिक्त फायदे देतो.

पहिला फायदा हा आहे की LLM मॉडेल्स बदलले किंवा अद्यतनित केले तरीही ज्ञानाचा उपयोग करता येतो.

दुसरा फायदा हा आहे की प्रचंड प्रमाणात जमा झालेल्या ज्ञान तलावाचा वापर LLMs साठी पूर्व-प्रशिक्षण डेटासेट म्हणून केला जाऊ शकतो. याचा वापर दोन प्रकारे करता येतो: फाइन-ट्यूनिंग म्हणून किंवा LLM च्या पूर्व-प्रशिक्षणासाठीच.

कोणत्याही परिस्थितीत, जर ज्ञान तलावात जमा केलेल्या ज्ञानापासून नैसर्गिकरित्या शिकलेले LLM वापरता आले, तर सॉफ्टवेअर विकास आणखी कार्यक्षम होईल.

याव्यतिरिक्त, सॉफ्टवेअर विकासामध्ये आवश्यकता विश्लेषण, डिझाइन, अंमलबजावणी, चाचणी, संचालन आणि देखभाल यासारख्या विविध प्रक्रियांचा समावेश असतो. प्रत्येक सॉफ्टवेअर डोमेन आणि प्लॅटफॉर्मसाठी विशिष्ट ज्ञान देखील अस्तित्वात आहे. या दृष्टिकोनातून जमा केलेल्या प्रचंड ज्ञानाचे विभाजन करण्यासाठी एक यंत्रणा तयार केल्यास, ALIS ऑर्केस्ट्रा तयार केला जाऊ शकतो.

अशा प्रकारे, ALIS साठी मूलभूत तंत्रज्ञान उपलब्ध आहेत. उर्वरित महत्त्वाचे पाऊल म्हणजे ज्ञान निष्कर्षणचे ज्ञान, योग्य ज्ञान निवड, विशेष ज्ञानाचे विभाजन आणि स्टेट मेमरीचा वापर यासारख्या विविध पद्धतींचा व्यावहारिकपणे प्रयोग करणे - ज्यामुळे प्रभावी दृष्टिकोन शोधता येतील. जटिलता वाढल्यास, प्रक्रिया वेळ आणि LLM वापराचा खर्च देखील वाढेल, ज्यामुळे ऑप्टिमायझेशन आवश्यक होईल.

फ्रेमवर्कच्या विकास आणि शुद्धीकरणामार्फत या चाचणी-आणि-त्रुटी प्रक्रिया आणि ऑप्टिमायझेशन शिक्षण-आधारित पद्धतीने पुढे नेले जाऊ शकते.

सुरुवातीला, विकसक, वापरकर्ता म्हणून, चाचणी-आणि-त्रुटीद्वारे ALIS मध्ये फ्रेमवर्क समाकलित करतील. तथापि, तरीही, LLM स्वतः फ्रेमवर्क कल्पना तयार करण्यासाठी नियुक्त केले जाऊ शकते.

नंतर, जगाकडून मिळालेल्या परिणामांवर आणि काढलेल्या ज्ञानावर आधारित, फ्रेमवर्क सुधारण्यासाठी आणि शोधण्यासाठी एक फ्रेमवर्क ALIS मध्ये समाविष्ट करून, ALIS स्वतःच शिक्षण-चालित पद्धतीने चाचणी-आणि-त्रुटी आणि ऑप्टिमायझेशन करेल.

वास्तविक जगातील ALIS

ALIS या टप्प्यापर्यंत परिष्कृत झाल्यावर, ते केवळ सॉफ्टवेअर विकासाच्या जगापुरते मर्यादित न राहता, विविध प्रकारच्या क्षेत्रांमध्ये ज्ञान संपादन करण्यास सक्षम असावे.

सॉफ्टवेअर विकासाप्रमाणेच, ALIS मानवाद्वारे संगणक वापरून केल्या जाणाऱ्या विविध बौद्धिक क्रियाकलापांमध्ये त्याचा अनुप्रयोग विस्तारण्याची अपेक्षा आहे.

अशा पूर्णपणे बौद्धिक क्रियाकलापांमध्येही, ALIS त्याच्या लक्षित जगाशी संबंधित 'एंबॉडीड एआय' (Embodied AI) सारखा गुणधर्म धारण करेल.

कारण ते स्वतः आणि जगामधील सीमा ओळखते, त्या सीमेद्वारे जगावर कार्य करते आणि जगाकडून प्राप्त होणारी माहिती समजू शकते.

जेव्हा जगासोबतची ही सीमा शारीरिकदृष्ट्या दृश्यमान असते आणि एकाच ठिकाणी स्थानिक असते, तेव्हा आपण तिला सामान्यतः शरीर म्हणतो.

तथापि, जरी सीमा अदृश्य असली आणि अवकाशीयदृष्ट्या वितरित असली तरी, सीमेद्वारे समजून घेण्याची आणि कार्य करण्याची रचना भौतिक शरीर असतानाच्या रचनेसारखीच राहते.

या अर्थाने, बौद्धिक क्रियाकलाप करणारी ALIS आभासीरित्या एंबॉडीड एआयची वैशिष्ट्ये धारण करते असे मानले जाऊ शकते.

आणि, जर ALIS अशा टप्प्यापर्यंत परिष्कृत झाली की ती नवीन, अज्ञात जगांमध्येही योग्यरित्या शिकू शकेल, तर ALIS ला वास्तविक शारीरिक शरीर असलेल्या खऱ्या एंबॉडीड एआयचा भाग म्हणून समाविष्ट करण्याची शक्यता आहे.

अशा प्रकारे, ALIS अखेरीस वास्तविक जगावर लागू होईल आणि त्यातून शिकण्यास सुरुवात करेल.