यहाँ, मैं कृत्रिम शिक्षण बुद्धिमत्ता प्रणाली (ALIS) को उसकी अवधारणा, सिद्धांतों, मूल डिज़ाइन और विकास कार्यप्रणाली का विस्तार से वर्णन करके व्यवस्थित करना चाहूँगा।
अवधारणा
वर्तमान जनरेटिव एआई, मुख्य रूप से बड़े भाषा मॉडल, तंत्रिका नेटवर्क-आधारित पर्यवेक्षित शिक्षण पर प्रशिक्षित होते हैं।
एक शिक्षण प्रक्रिया के रूप में, हम इस तंत्रिका नेटवर्क शिक्षण को सहज अधिगम के रूप में परिभाषित करते हैं।
ALIS सहज अधिगम से अलग, अर्जित शिक्षा प्रक्रिया को एकीकृत करता है, ताकि दोनों शिक्षण प्रक्रियाओं को मिलाकर अनुमान लगाया जा सके।
इस अर्जित शिक्षा में, अर्जित ज्ञान को तंत्रिका नेटवर्क के बाहर जमा किया जाता है और अनुमान के दौरान उसका उपयोग किया जाता है।
इसलिए, ALIS का तकनीकी मूल अनुमान के दौरान पुन: प्रयोज्य ज्ञान के निष्कर्षण, भंडारण और चयन तथा उपयोग में निहित है।
इसके अलावा, ALIS केवल एक एकल मौलिक तकनीक नहीं है, बल्कि एक प्रणाली तकनीक है जो सहज अधिगम और अर्जित शिक्षा को जोड़ती है।
शिक्षण बुद्धिमत्ता प्रणाली के तत्व
ALIS इस सिद्धांत पर काम करता है कि मौजूदा सहज अधिगम और भविष्य में विचार की गई अर्जित शिक्षा दोनों ही सीखने और अनुमान के एक ही ढांचे का पालन करते हैं।
ALIS में सीखने के सिद्धांतों को समझाने के लिए, हम एक शिक्षण बुद्धिमत्ता प्रणाली के पाँच तत्वों को परिभाषित करते हैं।
पहला है बुद्धिमान प्रोसेसर। यह एक प्रसंस्करण प्रणाली को संदर्भित करता है जो ज्ञान का उपयोग करके अनुमान लगाती है और सीखने के लिए ज्ञान निकालती है।
बड़े भाषा मॉडल (LLMs) और मानव मस्तिष्क के कुछ हिस्से बुद्धिमान प्रोसेसर के प्रमुख उदाहरण हैं।
दूसरा है नॉलेज स्टोर। यह एक भंडारण स्थान को संदर्भित करता है जहाँ निकाले गए ज्ञान को आवश्यकतानुसार सहेजा और पुनर्प्राप्त किया जा सकता है।
LLMs में, नॉलेज स्टोर तंत्रिका नेटवर्क के मापदंडों से बना होता है। मनुष्यों में, यह मस्तिष्क में दीर्घकालिक स्मृति से मेल खाता है।
तीसरा है विश्व। यह एक शिक्षण बुद्धिमत्ता प्रणाली, जैसे मनुष्यों या ALIS द्वारा कथित बाहरी वातावरण को संदर्भित करता है।
मनुष्य के लिए, विश्व स्वयं वास्तविकता है। LLMs के मामले में, एक तंत्र जो LLM से आउटपुट प्राप्त करता है और उसे प्रतिक्रिया प्रदान करता है, उसे विश्व के बराबर माना जा सकता है।
चौथा है स्टेट मेमोरी। यह एक आंतरिक अस्थायी मेमोरी जैसे घटक को संदर्भित करता है जिसका उपयोग एक शिक्षण बुद्धिमत्ता प्रणाली अनुमान के दौरान करती है।
LLMs में, यह अनुमान के दौरान उपयोग की जाने वाली मेमोरी स्पेस है, जिसे छिपी हुई स्थिति (हिडन स्टेट) के रूप में जाना जाता है। मनुष्यों में, यह अल्पकालिक स्मृति से मेल खाता है।
पाँचवाँ है ढाँचा। यह, एक तरह से, एक सोचने की संरचना है। शिक्षण बुद्धिमत्ता प्रणालियों की शब्दावली में, यह अनुमान के दौरान आवश्यक ज्ञान के चयन के लिए मानदंड और स्टेट मेमोरी को व्यवस्थित करने के लिए एक तार्किक स्टेट स्पेस संरचना को संदर्भित करता है।
LLMs में, यह छिपी हुई स्थितियों की सिमेंटिक संरचना है, और इसकी सामग्री आम तौर पर अस्पष्ट और मनुष्यों के लिए समझ से बाहर होती है। इसके अलावा, ज्ञान का चयन ध्यान तंत्र में सन्निहित होता है, जो संसाधित किए जा रहे प्रत्येक टोकन के लिए यह चुनता है कि किस मौजूदा टोकन को संदर्भित करना है।
मनुष्यों में, जैसा कि ऊपर उल्लेख किया गया है, यह एक सोचने की संरचना है। एक विशिष्ट ढांचे का उपयोग करके सोचते समय, दीर्घकालिक स्मृति से एक विशिष्ट ज्ञान का सेट याद किया जाता है और अल्पकालिक स्मृति में लोड किया जाता है। फिर, वर्तमान में कथित जानकारी को सोचने के ढांचे के अनुसार व्यवस्थित किया जाता है ताकि स्थिति को समझा जा सके।
शिक्षण बुद्धिमत्ता प्रणाली के सिद्धांत
एक शिक्षण बुद्धिमत्ता प्रणाली निम्नलिखित तरीके से काम करती है:
एक बुद्धिमान प्रोसेसर विश्व पर कार्य करता है। विश्व, इस कार्य के जवाब में, परिणाम लौटाता है।
बुद्धिमान प्रोसेसर इन परिणामों से पुन: प्रयोज्य ज्ञान निकालता है और उसे नॉलेज स्टोर में संग्रहीत करता है।
विश्व पर पुनरावृत्त रूप से कार्य करते समय, बुद्धिमान प्रोसेसर नॉलेज स्टोर से ज्ञान का चयन करता है और अपने कार्यों को संशोधित करने के लिए उसका उपयोग करता है।
यह मूल तंत्र है।
हालांकि, मौलिक रूप से, ज्ञान के निष्कर्षण, भंडारण, चयन और उपयोग के तरीके यह निर्धारित करते हैं कि क्या प्रणाली सार्थक शिक्षा कर सकती है।
मनुष्यों के पास ऐसे तंत्र होते हैं जो इस ज्ञान के निष्कर्षण, भंडारण, चयन और उपयोग को प्रभावी ढंग से संभालते हैं, जिससे वे सीख पाते हैं।
LLM सहित न्यूरल नेटवर्क में, निष्कर्षण बाहरी शिक्षकों द्वारा संभाला जाता है, लेकिन उनके पास भंडारण, चयन और उपयोग के तंत्र होते हैं। यह उन्हें तब तक सीखने की अनुमति देता है जब तक उन्हें एक शिक्षक प्रदान किया जाता है।
इसके अलावा, एक शिक्षण बुद्धिमत्ता प्रणाली ज्ञान के रूप में स्टेट मेमोरी के भीतर फ्रेमवर्क के निष्कर्षण, भंडारण और चयन, और उनके उपयोग के तरीकों को भी सीख सकती है, जिससे अधिक जटिल शिक्षा सक्षम होती है।
ज्ञान के प्रकार
इन सिद्धांतों के आधार पर, अर्जित शिक्षा को डिजाइन करते समय, यह स्पष्ट करना आवश्यक है कि अर्जित ज्ञान किस रूप में होगा।
एक ऐसी विधि पर विचार किया जा सकता है जहाँ अर्जित ज्ञान को तंत्रिका नेटवर्क मापदंडों के रूप में अलग से भी सीखा जाता है।
हालांकि, अर्जित ज्ञान को केवल तंत्रिका नेटवर्क मापदंडों तक ही सीमित रखने की आवश्यकता नहीं है। एक व्यावहारिक विकल्प प्राकृतिक भाषा में पाठ्य रूप में ज्ञान है।
प्राकृतिक भाषा में पाठ्य रूप में ज्ञान को LLM की प्राकृतिक भाषा प्रसंस्करण क्षमताओं का लाभ उठाकर निकाला और उपयोग किया जा सकता है। इसके अलावा, चूंकि इसे मानक आईटी प्रणालियों में डेटा के रूप में संभाला जा सकता है, इसलिए भंडारण और चयन भी आसान है।
इसके अलावा, प्राकृतिक भाषा में पाठ्य रूप में ज्ञान मनुष्यों और अन्य LLM के लिए जाँच, समझने और, कुछ मामलों में, इसकी सामग्री को संपादित करने के लिए भी आसान है।
इसे अन्य शिक्षण बुद्धिमत्ता प्रणालियों के साथ भी साझा, विलय या विभाजित किया जा सकता है।
इन कारणों से, ALIS अवधारणा में अर्जित ज्ञान को शुरू में प्राकृतिक भाषा में पाठ्य रूप में ज्ञान को लक्षित करने के लिए डिज़ाइन किया जाएगा।
अर्जित स्टेट मेमोरी और फ़्रेमवर्क
हमने अर्जित ज्ञान के प्रारूप के रूप में प्राकृतिक भाषा पाठ का चयन करने के लाभों के बारे में बताया है।
इसी तरह, अनुमान के लिए स्टेट मेमोरी और फ़्रेमवर्क के लिए भी प्राकृतिक भाषा पाठ का उपयोग किया जा सकता है।
फ़्रेमवर्क, वैचारिक संरचनाओं के रूप में, प्राकृतिक भाषा में पाठ्य रूप में ज्ञान के रूप में नॉलेज स्टोर में संग्रहीत और उपयोग किए जा सकते हैं।
एक फ़्रेमवर्क द्वारा परिभाषित संरचना के आधार पर स्थितियों को आरंभ या अद्यतन करते समय भी, पाठ-प्रारूप स्टेट मेमोरी का उपयोग किया जा सकता है।
न केवल अर्जित ज्ञान बल्कि फ़्रेमवर्क और स्टेट मेमोरी को भी पाठ प्रारूप में डिज़ाइन करके, ALIS सामान्य रूप से अर्जित शिक्षा और अनुमान के लिए LLM की प्राकृतिक भाषा प्रसंस्करण क्षमताओं का लाभ उठा सकता है।
औपचारिक ज्ञान
अर्जित ज्ञान, फ्रेमवर्क और स्टेट मेमोरी को केवल प्राकृतिक भाषा पाठ में ही नहीं, बल्कि अधिक कठोर औपचारिक भाषाओं या औपचारिक मॉडलों में भी व्यक्त किया जा सकता है।
हालांकि मैंने "चयन" लिखा है, ALIS का लक्ष्य सहज अधिगम और अर्जित शिक्षा के संकर उपयोग को सक्षम करने के लिए कई अलग-अलग अर्जित ज्ञान शिक्षण तंत्रों को शामिल करना है।
औपचारिक भाषाओं या औपचारिक मॉडलों द्वारा दर्शाया गया ज्ञान अधिक सटीक और स्पष्ट किया जा सकता है।
इसके अलावा, यदि एक फ्रेमवर्क को एक औपचारिक भाषा या मॉडल का उपयोग करके व्यक्त किया जाता है और एक प्रारंभिक स्थिति स्टेट मेमोरी में खोली जाती है, तो एक LLM के बजाय औपचारिक मॉडलों को संसाधित करने में सक्षम एक बुद्धिमान प्रोसेसर द्वारा एक कठोर मॉडल के साथ एक सिमुलेशन या तार्किक विकास किया जा सकता है।
ऐसी औपचारिक भाषाओं या औपचारिक मॉडलों का एक प्रमुख उदाहरण प्रोग्रामिंग भाषाएँ हैं।
जैसे-जैसे प्रणाली विश्व के बारे में सीखती है, यदि वह उसमें पाए जाने वाले नियमों और अवधारणाओं को एक फ्रेमवर्क में एक कार्यक्रम के रूप में व्यक्त कर सकती है, तो वह उन्हें कंप्यूटर पर अनुकरण कर सकती है।
कॉलम 1: ज्ञान के प्रकार
एक शिक्षण बुद्धिमत्ता प्रणाली के भीतर ज्ञान को व्यवस्थित करते समय, यह स्पष्ट हो जाता है कि इसे मोटे तौर पर तीन प्रकार की ज्ञान प्रणालियों और दो प्रकार की स्थितियों में वर्गीकृत किया जा सकता है।
तीन ज्ञान प्रणालियाँ हैं: नेटवर्क पैरामीटर ज्ञान, जिसे तंत्रिका नेटवर्क द्वारा संभाला जाता है; प्राकृतिक ज्ञान, जिसे प्राकृतिक भाषा में व्यक्त किया जाता है; और औपचारिक ज्ञान, जिसे औपचारिक भाषाओं में व्यक्त किया जाता है।
दो प्रकार की स्थितियाँ हैं: स्टेटलेस और स्टेटफुल।
स्टेटलेस नेटवर्क पैरामीटर ज्ञान सहज ज्ञान है, जैसा कि गहन शिक्षण एआई में पाया जाता है। बिल्लियों और कुत्तों की विशेषताएँ, जिनके बारे में स्पष्ट रूप से सोचा या मौखिक रूप से पहचाना नहीं जा सकता, उन्हें स्टेटलेस नेटवर्क पैरामीटर ज्ञान के रूप में सीखा जा सकता है।
स्टेटफुल नेटवर्क पैरामीटर ज्ञान वह ज्ञान है जो जेनरेटिव एआई जैसे फ़ज़ी, पुनरावृत्तीय प्रक्रियाओं के माध्यम से उभरता है।
स्टेटलेस प्राकृतिक ज्ञान वह ज्ञान है जैसे व्यक्तिगत शब्दों से जुड़े अर्थ।
स्टेटफुल प्राकृतिक ज्ञान वह ज्ञान है जिसमें वाक्यों के भीतर संदर्भ शामिल होता है।
कुछ प्राकृतिक ज्ञान सहज रूप से स्टेटफुल नेटवर्क पैरामीटर ज्ञान में शामिल होता है, लेकिन ऐसा ज्ञान भी होता है जिसे प्राकृतिक भाषा पाठ से प्राप्त किया जा सकता है।
स्टेटलेस औपचारिक ज्ञान वह ज्ञान है जिसे बिना पुनरावृत्ति के गणितीय सूत्रों में व्यक्त किया जा सकता है। स्टेटफुल औपचारिक ज्ञान वह ज्ञान है जिसे एक प्रोग्राम के रूप में व्यक्त किया जा सकता है।
प्राकृतिक ज्ञान और औपचारिक ज्ञान के लिए स्टेट मेमोरी के रूप में अपनी अल्पकालिक स्मृति का भी उपयोग किया जा सकता है।
हालांकि, चूंकि यह अल्पकालिक स्मृति है, इसलिए एक स्थिति को स्थिर रूप से बनाए रखना मुश्किल है। इसके अलावा, यह औपचारिक, स्पष्ट स्थितियों को धारण करने में कुशल नहीं है।
दूसरी ओर, प्राकृतिक भाषा पाठ, औपचारिक भाषाओं या औपचारिक मॉडलों को लिखने या संपादित करने के लिए कागज, कंप्यूटर और स्मार्टफोन को स्टेट मेमोरी के रूप में उपयोग किया जा सकता है।
आम तौर पर, कागज या कंप्यूटर पर डेटा को अक्सर ज्ञान को याद रखने के लिए एक नॉलेज स्टोर के रूप में माना जाता है, लेकिन इसे विचारों को व्यवस्थित करने के लिए स्टेट मेमोरी के रूप में भी इस्तेमाल किया जा सकता है।
इस प्रकार, यह स्पष्ट है कि मनुष्य इन तीन ज्ञान प्रणालियों और दो प्रकार की स्थितियों का पूरा उपयोग करके बौद्धिक गतिविधियों को अंजाम देते हैं।
ALIS भी इन्हीं तीन ज्ञान प्रणालियों और दो प्रकार की स्थितियों का लाभ उठाने वाली बौद्धिक गतिविधियों को सक्षम और मजबूत करके अपनी क्षमताओं को नाटकीय रूप से बढ़ाने की क्षमता रखता है।
विशेष रूप से, ALIS में विशाल नॉलेज स्टोर और स्टेट मेमोरी का उपयोग करने की शक्ति है। इसके अलावा, यह प्रत्येक के कई तैयार करके और उन्हें स्विच या संयोजित करके बौद्धिक कार्यों को आसानी से कर सकता है।
कॉलम 2: बुद्धिमान ऑर्केस्ट्रेशन
जबकि एक नॉलेज स्टोर में भारी मात्रा में ज्ञान जमा करने में लाभ होता है, लेकिन जनरेटिव एआई एक बार में जितने टोकन संसाधित कर सकता है, उसकी सीमाओं और अप्रासंगिक ज्ञान से उत्पन्न होने वाले शोर के कारण ज्ञान की मात्रा बौद्धिक गतिविधि में केवल एक लाभ में तब्दील नहीं होती है।
इसके विपरीत, नॉलेज स्टोर को उचित रूप से विभाजित करके और इसे उच्च-घनत्व वाले विशेष नॉलेज स्टोर में बदलकर, जिनमें से प्रत्येक में एक विशिष्ट बौद्धिक कार्य के लिए आवश्यक ज्ञान होता है, टोकन सीमाओं और शोर की समस्याओं को कम किया जा सकता है।
बदले में, प्रत्येक विशेष नॉलेज स्टोर केवल उसके निर्धारित बौद्धिक कार्य के लिए ही उपयोग करने योग्य हो जाता है।
कई बौद्धिक गतिविधियाँ विभिन्न बौद्धिक कार्यों के जटिल संयोजन होती हैं। इसलिए, ज्ञान को बौद्धिक कार्य के प्रकार के अनुसार विशेष नॉलेज स्टोर में विभाजित करके और बौद्धिक गतिविधि को व्यक्तिगत कार्यों में उपविभाजित करके, ALIS इन विशेष नॉलेज स्टोर के बीच उचित रूप से स्विच करके पूरी बौद्धिक गतिविधि को निष्पादित कर सकता है।
यह एक ऑर्केस्ट्रा के समान है, जिसमें विभिन्न वाद्ययंत्र बजाने वाले पेशेवर संगीतकार और पूरे समूह का नेतृत्व करने वाला कंडक्टर शामिल होता है।
इस प्रणाली प्रौद्योगिकी, बुद्धिमान ऑर्केस्ट्रेशन के माध्यम से, ALIS अपनी बौद्धिक गतिविधियों को व्यवस्थित करने में सक्षम होगा।
ALIS का मूल डिजाइन और विकास विधि
यहाँ से, हम ALIS के विकास को व्यवस्थित करेंगे।
जैसा कि सिद्धांतों और कॉलमों में पहले ही चर्चा की जा चुकी है, ALIS स्वाभाविक रूप से कार्यों और संसाधनों के आसान विस्तार के लिए डिज़ाइन किया गया है। ऐसा इसलिए है क्योंकि ALIS का सार विशिष्ट कार्यों में नहीं, बल्कि ज्ञान के निष्कर्षण, भंडारण, चयन और उपयोग की प्रक्रियाओं में निहित है।
उदाहरण के लिए, कई प्रकार के ज्ञान निष्कर्षण तंत्र प्रदान किए जा सकते हैं, और सिस्टम डिज़ाइन उन्हें चुनने या एक साथ उपयोग करने के लिए स्वतंत्र विकल्प की अनुमति देता है।
इसके अलावा, ALIS को स्वयं इस चयन को करने के लिए बनाया जा सकता है।
इसी तरह, भंडारण, चयन और उपयोग को भी स्वतंत्र रूप से चुना या समानांतर किया जा सकता है।
इसलिए, ALIS को वृद्धिशील और एजाइल तरीके से विकसित किया जा सकता है, बिना वॉटरफॉल तरीके से पूरी कार्यक्षमता को डिजाइन करने की आवश्यकता के।
ALIS की शुरुआत
अब, आइए एक बहुत ही सरल ALIS डिज़ाइन करें।
बुनियादी यूआई एक परिचित चैट एआई होगा। शुरू में, उपयोगकर्ता का इनपुट सीधे LLM को भेजा जाता है। LLM का जवाब यूआई पर प्रदर्शित होता है, और सिस्टम अगले उपयोगकर्ता इनपुट की प्रतीक्षा करता है।
अगला इनपुट मिलने पर, LLM को न केवल नया इनपुट बल्कि उपयोगकर्ता और LLM के बीच की पूरी चैट हिस्ट्री भी प्रदान की जाती है।
इस चैट एआई के यूआई के पीछे, चैट हिस्ट्री से पुन: प्रयोज्य ज्ञान निकालने के लिए एक तंत्र तैयार किया जाता है।
इस तंत्र को चैट एआई प्रणाली में एक ऐसी प्रक्रिया के रूप में जोड़ा जा सकता है जो बातचीत समाप्त होने पर या नियमित अंतराल पर चलती है। बेशक, ज्ञान निकालने के लिए एक LLM का उपयोग किया जाता है।
इस LLM को ALIS की अवधारणा और सिद्धांतों के साथ-साथ ज्ञान निकालने की जानकारी एक सिस्टम प्रॉम्प्ट के रूप में प्रदान की जाती है। यदि ज्ञान इच्छित रूप से नहीं निकाला जाता है, तो सिस्टम प्रॉम्प्ट को परीक्षण और त्रुटि के माध्यम से सुधारना चाहिए।
चैट हिस्ट्री से निकाला गया ज्ञान सीधे नॉलेज लेक में संग्रहीत किया जाता है। एक नॉलेज लेक बस ज्ञान को संरचित करने से पहले उसे एक सपाट स्थिति में संग्रहीत करने के लिए एक तंत्र है।
इसके बाद, नॉलेज लेक से ज्ञान का चयन करना आसान बनाने के लिए एक संरचनात्मक तंत्र तैयार किया जाता है।
इसमें सिमेंटिक खोज के लिए एक एम्बेडिंग वेक्टर स्टोर, जैसा कि विशिष्ट RAG में उपयोग किया जाता है, और कीवर्ड इंडेक्स प्रदान करना शामिल है।
अन्य संभावनाओं में अधिक उन्नत ज्ञान ग्राफ बनाना या श्रेणी वर्गीकरण करना शामिल है।
नॉलेज लेक के लिए संरचित जानकारी के इस संग्रह को नॉलेज बेस कहा जाएगा। यह पूरा नॉलेज बेस और नॉलेज लेक नॉलेज स्टोर का गठन करेगा।
इसके बाद, नॉलेज स्टोर को चैट यूआई के प्रसंस्करण में एकीकृत किया जाता है।
यह मूल रूप से एक सामान्य RAG तंत्र के समान है। उपयोगकर्ता इनपुट के लिए, नॉलेज स्टोर से प्रासंगिक ज्ञान का चयन किया जाता है और उपयोगकर्ता इनपुट के साथ LLM को भेजा जाता है।
यह LLM को उपयोगकर्ता इनपुट को संसाधित करते समय स्वचालित रूप से ज्ञान का उपयोग करने की अनुमति देता है।
इस तरह, उपयोगकर्ता के साथ प्रत्येक बातचीत के साथ ज्ञान बढ़ता जाता है, जिससे एक सरल ALIS सक्षम होता है जो पिछली बातचीत से संचित ज्ञान का उपयोग करता है।
सरल परिदृश्य
उदाहरण के लिए, एक ऐसे परिदृश्य की कल्पना करें जहाँ एक उपयोगकर्ता इस सरल ALIS का उपयोग करके एक वेब एप्लिकेशन विकसित कर रहा है।
उपयोगकर्ता रिपोर्ट करेगा कि LLM द्वारा प्रस्तावित कोड के परिणामस्वरूप एक त्रुटि हुई। फिर, उपयोगकर्ता और LLM समस्या निवारण के लिए सहयोग करेंगे। मान लीजिए उन्हें पता चलता है कि LLM को जिस बाहरी API विशिष्टता की जानकारी थी, वह पुरानी हो चुकी थी, और नवीनतम API विशिष्टता के अनुकूल होने से समस्या हल हो गई।
इस मामले में, यह ज्ञान कि LLM की API विशिष्टता पुरानी थी और नवीनतम API विशिष्टता क्या है, इस चैट थ्रेड से नॉलेज स्टोर में संचित किया जा सकता है।
फिर, अगली बार उसी API का उपयोग करने वाला एक प्रोग्राम बनाते समय, ALIS इस ज्ञान का लाभ उठाकर शुरू से ही नवीनतम API विशिष्टता के आधार पर एक प्रोग्राम उत्पन्न कर सकता है।
प्रारंभिक ALIS में सुधार
हालाँकि, ऐसा होने के लिए, इस ज्ञान को उपयोगकर्ता के इनपुट के जवाब में चुना जाना चाहिए। हो सकता है कि यह ज्ञान सीधे उपयोगकर्ता के इनपुट से जुड़ा न हो, क्योंकि समस्याग्रस्त API का नाम प्रारंभिक उपयोगकर्ता इनपुट में दिखाई देने की संभावना कम है।
ऐसे मामले में, API का नाम पहली बार LLM के जवाब में ही सामने आएगा।
इसलिए, हम प्री-चेक टिप्पणियों और पोस्ट-चेक टिप्पणियों के लिए एक तंत्र जोड़कर साधारण ALIS का थोड़ा विस्तार करेंगे।
प्री-चेक टिप्पणियाँ LLM में हाल के "विचार मोड" के समान हैं। हम एक ऐसी मेमोरी तैयार करते हैं जो पाठ को स्टेट मेमोरी के रूप में रख सकती है, और LLM को एक सिस्टम प्रॉम्प्ट के माध्यम से निर्देश देते हैं कि उपयोगकर्ता इनपुट प्राप्त होने पर प्री-चेक टिप्पणियाँ करें।
LLM का प्री-चेक टिप्पणी परिणाम तब स्टेट मेमोरी में रखा जाता है, और इस परिणाम के आधार पर, नॉलेज स्टोर से ज्ञान का चयन किया जाता है।
फिर, चैट इतिहास, प्री-चेक टिप्पणी परिणाम, उपयोगकर्ता इनपुट के अनुरूप ज्ञान, और प्री-चेक टिप्पणी परिणाम के अनुरूप ज्ञान को LLM को भेजा जाता है ताकि उसका आउटपुट प्राप्त किया जा सके।
इसके अलावा, LLM द्वारा लौटाए गए परिणाम के लिए, नॉलेज स्टोर में ज्ञान की खोज की जाती है। वहाँ पाए गए किसी भी ज्ञान को शामिल करते हुए, LLM को फिर एक पोस्ट-चेक करने के लिए कहा जाता है।
यदि कोई समस्या मिलती है, तो उन्हें समस्या बिंदुओं और指摘 (टिप्पणियों/प्रतिक्रिया) के कारणों के साथ चैट LLM को वापस भेज दिया जाता है।
प्री-चेक टिप्पणियों और पोस्ट-चेक टिप्पणियों दोनों के दौरान ज्ञान का चयन करने के अवसर प्रदान करके, हम संचित ज्ञान का उपयोग करने की संभावना बढ़ा सकते हैं।
दृष्टिकोण
प्रारंभिक ALIS बनाने और उसकी कमजोरियों को दूर करने के लिए सुधार जोड़ने की प्रक्रिया वास्तव में एजाइल विकास है, जो यह दर्शाता है कि ALIS को वृद्धिशील रूप से बढ़ाया जा सकता है।
इसके अलावा, जैसा कि उदाहरण दिया गया है, प्रारंभिक ALIS सॉफ्टवेयर विकास में उपयोग के लिए सबसे उपयुक्त है। ऐसा इसलिए है क्योंकि यह एक उच्च-मांग वाला क्षेत्र है और एक ऐसा क्षेत्र है जहाँ ज्ञान को स्पष्ट रूप से संचित किया जा सकता है।
यह एक ऐसा क्षेत्र है जहाँ परिणाम स्पष्ट होते हैं, फिर भी इसमें परीक्षण-और-त्रुटि, पुनरावृत्तीय ज्ञान संचय की आवश्यकता होती है और इससे काफी लाभ होता है।
अतिरिक्त रूप से, चूंकि ALIS का विकास स्वयं सॉफ्टवेयर विकास है, यह तथ्य कि ALIS के डेवलपर भी ALIS के उपयोगकर्ता हो सकते हैं, एक आकर्षक पहलू है।
इसके अलावा, ALIS प्रणाली के साथ-साथ, नॉलेज लेक को GitHub जैसे प्लेटफार्मों पर खुले तौर पर साझा किया जा सकता है।
इससे कई व्यक्तियों को ALIS प्रणाली के सुधार और ज्ञान के संचय में योगदान करने की अनुमति मिलेगी, जिससे सभी को लाभ मिलेगा और ALIS के विकास में कुशलता से और तेजी आएगी।
निश्चित रूप से, ज्ञान साझाकरण केवल ALIS डेवलपर्स तक सीमित नहीं है; इसे ALIS का उपयोग करने वाले सभी सॉफ्टवेयर डेवलपर्स से एकत्र किया जा सकता है।
ज्ञान की प्राकृतिक भाषा प्रकृति दो अतिरिक्त लाभ प्रदान करती है।
पहला लाभ यह है कि LLM मॉडल बदलने या अपडेट होने पर भी ज्ञान का उपयोग किया जा सकता है।
दूसरा लाभ यह है कि विशाल संचित नॉलेज लेक को LLM के लिए पूर्व-प्रशिक्षण डेटासेट के रूप में उपयोग किया जा सकता है। इसका उपयोग करने के दो तरीके हैं: फाइन-ट्यूनिंग के रूप में, या स्वयं LLM के पूर्व-प्रशिक्षण के लिए।
किसी भी स्थिति में, यदि नॉलेज लेक में संचित ज्ञान से स्वाभाविक रूप से सीखे गए LLM का उपयोग किया जा सकता है, तो सॉफ्टवेयर विकास और भी कुशल हो जाएगा।
इसके अलावा, सॉफ्टवेयर विकास में आवश्यकताओं का विश्लेषण, डिजाइन, कार्यान्वयन, परीक्षण, संचालन और रखरखाव जैसी विभिन्न प्रक्रियाएं शामिल होती हैं। प्रत्येक सॉफ्टवेयर डोमेन और प्लेटफॉर्म के लिए विशेष ज्ञान भी मौजूद होता है। इन दृष्टिकोणों से संचित ज्ञान की विशाल मात्रा को विभाजित करने के लिए एक तंत्र बनाकर, एक ALIS ऑर्केस्ट्रा का गठन किया जा सकता है।
इस प्रकार, ALIS के लिए मौलिक प्रौद्योगिकियाँ मौजूद हैं। शेष महत्वपूर्ण कदम विभिन्न तरीकों—जैसे ज्ञान निष्कर्षण विशेषज्ञता, उचित ज्ञान चयन, विशेष ज्ञान विखंडन, और स्टेट मेमोरी उपयोग—के साथ व्यावहारिक रूप से प्रयोग करना है ताकि प्रभावी दृष्टिकोणों की खोज की जा सके। जैसे-जैसे जटिलता बढ़ती है, प्रसंस्करण समय और LLM उपयोग लागत भी बढ़ेगी, जिससे अनुकूलन की आवश्यकता होगी।
ये परीक्षण-और-त्रुटि प्रक्रियाएं और अनुकूलन, फ्रेमवर्क के विकास और शोधन के माध्यम से, सीखने-उन्मुख तरीके से आगे बढ़ाए जा सकते हैं।
शुरू में, डेवलपर्स, उपयोगकर्ताओं के रूप में, परीक्षण और त्रुटि के माध्यम से ALIS में फ्रेमवर्क को एकीकृत करेंगे। हालाँकि, तब भी, LLM को स्वयं फ्रेमवर्क विचारों को उत्पन्न करने का काम सौंपा जा सकता है।
फिर, दुनिया से प्राप्त परिणामों और निकाले गए ज्ञान के आधार पर, ALIS में फ्रेमवर्क में सुधार और खोज के लिए एक फ्रेमवर्क को शामिल करके, ALIS स्वयं सीखने-संचालित तरीके से परीक्षण-और-त्रुटि और अनुकूलन करेगा।
वास्तविक दुनिया में ALIS
एक बार जब ALIS को इस स्तर तक परिष्कृत कर लिया जाता है, तो उसे सॉफ्टवेयर विकास की दुनिया तक ही सीमित न रहकर, विभिन्न प्रकार के डोमेन में ज्ञान प्राप्त करने में सक्षम होना चाहिए।
सॉफ्टवेयर विकास के समान, ALIS से उम्मीद की जाती है कि वह मनुष्यों द्वारा कंप्यूटर का उपयोग करके की जाने वाली विभिन्न बौद्धिक गतिविधियों तक अपने अनुप्रयोग के दायरे का विस्तार करेगा।
ऐसी विशुद्ध रूप से बौद्धिक गतिविधियों में भी, ALIS अपने लक्षित विश्व के संबंध में एक मूर्त AI (एम्बेडेड एआई) के समान गुणवत्ता रखेगा।
ऐसा इसलिए है क्योंकि यह अपने और विश्व के बीच की सीमा को पहचानता है, उस सीमा के माध्यम से विश्व पर कार्य करता है, और विश्व से प्राप्त जानकारी को समझ सकता है।
जब विश्व के साथ यह सीमा शारीरिक रूप से दृश्यमान होती है और एक ही स्थान पर स्थानीयकृत होती है, तो हम इसे आम तौर पर शरीर कहते हैं।
हालांकि, भले ही सीमा अदृश्य और स्थानिक रूप से वितरित हो, एक सीमा के माध्यम से धारणा और कार्य की संरचना भौतिक शरीर रखने पर भी समान रहती है।
इस अर्थ में, बौद्धिक गतिविधियों को करने वाले ALIS को वस्तुतः एक मूर्त AI की विशेषताओं को रखने वाला माना जा सकता है।
और, यदि ALIS को एक ऐसे चरण तक परिष्कृत किया जाता है जहाँ वह नए, अज्ञात दुनिया में भी उचित रूप से सीख सकता है, तो ऐसी संभावना है कि ALIS को एक वास्तविक मूर्त AI के हिस्से के रूप में शामिल किया जा सकता है जिसमें एक वास्तविक भौतिक शरीर होता है।
इस तरह, ALIS अंततः वास्तविक दुनिया में लागू होगा और उससे सीखना शुरू करेगा।