এখানে, আমি আর্টিফিশিয়াল লার্নিং ইন্টেলিজেন্স সিস্টেম (ALIS)-এর ধারণা ও নীতি থেকে শুরু করে এর মৌলিক নকশা এবং বিকাশের পদ্ধতি পর্যন্ত বিষয়গুলি তুলে ধরে এটিকে সুসংগঠিত করার লক্ষ্য নিয়েছি।
ধারণা
বর্তমান জেনারেটিভ এআই, প্রধানত বৃহৎ ভাষা মডেলগুলি, নিউরাল নেটওয়ার্ক ব্যবহার করে তত্ত্বাবধানে থাকা শিক্ষার (supervised learning) ভিত্তিতে প্রশিক্ষিত হয়।
আমরা এই নিউরাল নেটওয়ার্ক প্রশিক্ষণের প্রক্রিয়াটিকে সহজাত শিক্ষা (innate learning) হিসেবে স্থান দিচ্ছি।
ALIS এমন একটি সিস্টেম যা সহজাত শিক্ষা থেকে পৃথক একটি অর্জিত শিক্ষার প্রক্রিয়া অন্তর্ভুক্ত করার মাধ্যমে সহজাত এবং অর্জিত উভয় শিক্ষার প্রক্রিয়াকে একীভূত করে ব্যাপক অনুমানকে সক্ষম করে।
এই অর্জিত শিক্ষায়, শেখা জ্ঞান নিউরাল নেটওয়ার্কের বাইরে সংরক্ষিত থাকে এবং অনুমানের সময় ব্যবহার করা হয়।
অতএব, ALIS-এর প্রযুক্তিগত মূল হল পুনরায় ব্যবহারযোগ্য জ্ঞান নিষ্কাশন, সংরক্ষণ, এবং অনুমানের সময় জ্ঞানের নির্বাচন ও ব্যবহার।
তাছাড়া, ALIS শুধুমাত্র একটি একক মৌলিক প্রযুক্তি নয়, এটি একটি সিস্টেম প্রযুক্তিও বটে যা সহজাত এবং অর্জিত শিক্ষাকে একত্রিত করে।
একটি শিক্ষণ বুদ্ধিমত্তা সিস্টেমের উপাদান
ALIS বিদ্যমান সহজাত শিক্ষা এবং ভবিষ্যতের অর্জিত শিক্ষা উভয়কেই শেখা ও অনুমানের কাঠামোর মধ্যে একই নীতি অনুসারে পরিচালিত বলে বিবেচনা করে।
ALIS-এ শেখার নীতিগুলি ব্যাখ্যা করার জন্য, আমরা একটি শিক্ষণ বুদ্ধিমত্তা সিস্টেমের পাঁচটি উপাদান সংজ্ঞায়িত করি:
প্রথমটি হল বুদ্ধিমান প্রসেসর (Intelligent Processor)। এটি একটি প্রক্রিয়াকরণ সিস্টেমকে বোঝায় যা জ্ঞান ব্যবহার করে অনুমান করে এবং শেখার জন্য জ্ঞান নিষ্কাশন করে।
বুদ্ধিমান প্রসেসরের প্রতিনিধিত্বমূলক উদাহরণগুলির মধ্যে রয়েছে LLM এবং মানব মস্তিষ্কের কিছু অংশ।
দ্বিতীয়টি হল জ্ঞান ভাণ্ডার (Knowledge Store)। এটি এমন একটি স্টোরেজ অবস্থানকে বোঝায় যেখানে নিষ্কাশিত জ্ঞান সংরক্ষণ করা হয় এবং প্রয়োজন অনুযায়ী পুনরুদ্ধার করা যায়।
LLM-এ, জ্ঞান ভাণ্ডার হল নিউরাল নেটওয়ার্কের প্যারামিটার। মানুষের ক্ষেত্রে, এটি মস্তিষ্কের দীর্ঘমেয়াদী স্মৃতির সাথে সামঞ্জস্যপূর্ণ।
তৃতীয়টি হল পৃথিবী (World)। এটি মানব বা ALIS-এর মতো শিক্ষণ বুদ্ধিমত্তা সিস্টেম দ্বারা অনুভূত বাহ্যিক পরিবেশকে বোঝায়।
মানুষের জন্য, পৃথিবী নিজেই বাস্তবতা। LLM-এর ক্ষেত্রে, যে প্রক্রিয়াটি LLM থেকে আউটপুট গ্রহণ করে এবং তাতে প্রতিক্রিয়া প্রদান করে, তাকে পৃথিবীর সমতুল্য বলে মনে করা হয়।
চতুর্থটি হল অবস্থা স্মৃতি (State Memory)। এটি একটি অভ্যন্তরীণ অস্থায়ী স্মৃতিকে বোঝায়, যেমন একটি স্ক্র্যাচপ্যাড, যা একটি শিক্ষণ বুদ্ধিমত্তা সিস্টেম অনুমানের সময় ব্যবহার করে।
LLM-এ, এটি অনুমানের সময় ব্যবহৃত স্মৃতি স্থান, যা লুকানো অবস্থা (hidden states) হিসাবে পরিচিত। মানুষের ক্ষেত্রে, এটি স্বল্পমেয়াদী স্মৃতির সাথে সামঞ্জস্যপূর্ণ।
পঞ্চমটি হল কাঠামো (Framework)। এটি তথাকথিত চিন্তার কাঠামো। একটি শিক্ষণ বুদ্ধিমত্তা সিস্টেমের পরিভাষায়, এটি অনুমানের সময় প্রয়োজনীয় জ্ঞান নির্বাচন করার মানদণ্ড এবং অবস্থা স্মৃতিকে সংগঠিত করার জন্য যৌক্তিক অবস্থা স্থান কাঠামোকে বোঝায়।
LLM-এ, এটি লুকানো অবস্থার শব্দার্থিক কাঠামো, এবং সাধারণত, এর বিষয়বস্তু অস্পষ্ট এবং মানুষের কাছে incomprehensible। উপরন্তু, জ্ঞান নির্বাচন মনোযোগ প্রক্রিয়ার সাথে একত্রিত হয়, যা প্রতিটি প্রক্রিয়াকৃত টোকেনের জন্য কোন বিদ্যমান টোকেনগুলি উল্লেখ করতে হবে তা নির্বাচন করে।
মানুষের জন্য, উপরে উল্লিখিত হিসাবে, এটি চিন্তার কাঠামো। একটি নির্দিষ্ট চিন্তার কাঠামো ব্যবহার করে চিন্তা করার সময়, দীর্ঘমেয়াদী স্মৃতি থেকে নির্দিষ্ট কিছু জ্ঞান-পদ্ধতি স্মরণ করা হয় এবং স্বল্পমেয়াদী স্মৃতিতে লোড করা হয়। তারপর, বর্তমান অনুভূত তথ্য চিন্তার কাঠামো অনুযায়ী সংগঠিত করা হয় পরিস্থিতি বোঝার জন্য।
একটি শিক্ষা বুদ্ধিমত্তা সিস্টেমের নীতি
একটি শিক্ষা বুদ্ধিমত্তা সিস্টেম নিম্নোক্তভাবে কাজ করে:
বুদ্ধিমান প্রসেসর বিশ্বের উপর কাজ করে। বিশ্ব সেই কাজের উপর ভিত্তি করে ফলাফল প্রদান করে।
বুদ্ধিমান প্রসেসর এই ফলাফল থেকে পুনরায় ব্যবহারযোগ্য জ্ঞান নিষ্কাশন করে এবং এটি জ্ঞান ভাণ্ডারে সংরক্ষণ করে।
যখন বুদ্ধিমান প্রসেসর বিশ্বের উপর বারবার কাজ করে, তখন এটি জ্ঞান ভাণ্ডার থেকে জ্ঞান নির্বাচন করে এবং তার কাজের ধরণ পরিবর্তন করতে এটি ব্যবহার করে।
এটিই মৌলিক প্রক্রিয়া।
তবে, মৌলিকভাবে, জ্ঞান নিষ্কাশন, সংরক্ষণ, নির্বাচন এবং ব্যবহারের পদ্ধতিগুলিই নির্ধারণ করে যে সিস্টেমটি অর্থপূর্ণ শিক্ষা অর্জন করতে পারে কিনা।
মানুষের এমন প্রক্রিয়া রয়েছে যা কার্যকর জ্ঞান নিষ্কাশন, সংরক্ষণ, নির্বাচন এবং ব্যবহার সক্ষম করে, যা তাদের শিখতে সাহায্য করে।
LLM সহ নিউরাল নেটওয়ার্কগুলির সংরক্ষণ, নির্বাচন এবং ব্যবহারের প্রক্রিয়া রয়েছে, যদিও নিষ্কাশন অংশটি একজন বাহ্যিক শিক্ষক দ্বারা পরিচালিত হয়। এটি তাদের শিখতে দেয় যতক্ষণ একজন শিক্ষক ইনপুট সরবরাহ করেন।
তাছাড়া, একটি শিক্ষা বুদ্ধিমত্তা সিস্টেম কাঠামো নিষ্কাশন, সংরক্ষণ এবং নির্বাচন, এবং জ্ঞান হিসাবে অবস্থা স্মৃতিতে তাদের ব্যবহার শেখার মাধ্যমে আরও জটিল শিক্ষা অর্জন করতে পারে।
জ্ঞানের প্রকারভেদ
এই নীতির উপর ভিত্তি করে, অর্জিত শিক্ষণের নকশা করার সময়, অর্জিত জ্ঞান কী ধরনের তথ্য গ্রহণ করবে তা স্পষ্ট করা প্রয়োজন।
অর্জিত জ্ঞানকে একটি নিউরাল নেটওয়ার্কের প্যারামিটার হিসাবে আলাদাভাবে শেখা সম্ভব।
তবে, অর্জিত জ্ঞানকে শুধুমাত্র নিউরাল নেটওয়ার্ক প্যারামিটারে সীমাবদ্ধ রাখার প্রয়োজন নেই। একটি বাস্তবসম্মত বিকল্প হল প্রাকৃতিক ভাষায় পাঠ্য আকারে রূপান্তর করা জ্ঞান।
যদি জ্ঞান প্রাকৃতিক ভাষায় পাঠ্য আকারে রূপান্তরিত হয়, তাহলে LLM-এর প্রাকৃতিক ভাষা প্রক্রিয়াকরণ ক্ষমতা ব্যবহার করে এটিকে নিষ্কাশন এবং ব্যবহার করা যেতে পারে। উপরন্তু, এটিকে একটি নিয়মিত আইটি সিস্টেমের ডেটা হিসাবে বিবেচনা করা যেতে পারে, যা সংরক্ষণ এবং নির্বাচনকে সহজ করে তোলে।
তাছাড়া, প্রাকৃতিক ভাষায় পাঠ্য আকারে রূপান্তরিত জ্ঞান মানুষ এবং অন্যান্য LLM-এর পক্ষে পরীক্ষা করা, বোঝা এবং কিছু ক্ষেত্রে সম্পাদনা করা সহজ।
এটি অন্যান্য শিক্ষা বুদ্ধি সিস্টেমের সাথেও ভাগ করা যেতে পারে এবং একত্রিত বা বিভক্ত করা যেতে পারে।
এই কারণে, ALIS ধারণার অর্জিত জ্ঞান প্রাথমিকভাবে প্রাকৃতিক ভাষায় পাঠ্য আকারে রূপান্তরিত জ্ঞানকে লক্ষ্য করে ডিজাইন করা হবে।
অর্জিত অবস্থা স্মৃতি এবং ফ্রেমওয়ার্ক
অর্জিত জ্ঞান হিসেবে প্রাকৃতিক ভাষায় লিখিত জ্ঞান বেছে নেওয়ার সুবিধাগুলো আমি ব্যাখ্যা করেছি।
অনুরূপভাবে, প্রাকৃতিক ভাষার পাঠ্য অনুমানের জন্য অবস্থা স্মৃতি (state memory) এবং ফ্রেমওয়ার্ক হিসেবেও ব্যবহার করা যেতে পারে।
ফ্রেমওয়ার্ক, যা একটি ধারণাগত কাঠামো, প্রাকৃতিক ভাষায় লিখিত জ্ঞান হিসেবে জ্ঞান ভান্ডারে সংরক্ষণ ও ব্যবহার করা যেতে পারে।
যখন সেই ফ্রেমওয়ার্ক দ্বারা সংজ্ঞায়িত কাঠামোর উপর ভিত্তি করে অবস্থাগুলি শুরু বা আপডেট করা হয়, তখন পাঠ্য-ভিত্তিক অবস্থা স্মৃতি ব্যবহার করা যেতে পারে।
ALIS কে এমনভাবে ডিজাইন করে যে এটি শুধু অর্জিত জ্ঞানের জন্য নয়, ফ্রেমওয়ার্ক এবং অবস্থা স্মৃতির জন্যও পাঠ্য বিন্যাস ব্যবহার করে, ALIS অর্জিত শিক্ষা এবং সাধারণ অনুমান উভয় ক্ষেত্রেই LLM-এর প্রাকৃতিক ভাষা প্রক্রিয়াকরণ ক্ষমতাকে কাজে লাগাতে পারে।
আনুষ্ঠানিক জ্ঞান
অর্জিত জ্ঞান, কাঠামো এবং অবস্থা স্মৃতি শুধু প্রাকৃতিক ভাষার পাঠ্য দ্বারাই নয়, বরং আরও কঠোর আনুষ্ঠানিক ভাষা বা আনুষ্ঠানিক মডেল দ্বারাও উপস্থাপন করা যেতে পারে।
আমি "নির্বাচন" লিখলেও, ALIS-এর লক্ষ্য হল জন্মগত এবং অর্জিত শিক্ষার একটি হাইব্রিড ব্যবহারকে অনুমতি দেওয়ার জন্য একাধিক অর্জিত জ্ঞান শেখার প্রক্রিয়াকে অন্তর্ভুক্ত করা।
আনুষ্ঠানিক ভাষা বা আনুষ্ঠানিক মডেল দ্বারা উপস্থাপিত জ্ঞান আরও কঠোর এবং অস্পষ্টতা থেকে মুক্ত হতে পারে।
উপরন্তু, যদি একটি কাঠামো একটি আনুষ্ঠানিক ভাষা বা আনুষ্ঠানিক মডেল ব্যবহার করে প্রকাশ করা হয়, এবং একটি প্রাথমিক অবস্থা অবস্থা স্মৃতিতে প্রসারিত হয়, তাহলে একটি আনুষ্ঠানিক মডেল একটি বুদ্ধিমান প্রসেসর (LLM নয়) দ্বারা প্রক্রিয়া করা যেতে পারে কঠোর সিমুলেশন এবং যৌক্তিক যুক্তি সম্পাদন করার জন্য।
এই ধরনের আনুষ্ঠানিক ভাষা এবং আনুষ্ঠানিক মডেলের একটি প্রধান উদাহরণ হল প্রোগ্রামিং ভাষা।
সিস্টেমটি বিশ্ব সম্পর্কে শেখার সাথে সাথে, যদি এটি একটি কাঠামোর মধ্যে প্রোগ্রাম হিসাবে অন্তর্নিহিত আইন এবং ধারণাগুলি প্রকাশ করতে পারে, তবে এগুলি একটি কম্পিউটার দ্বারা সিমুলেট করা যেতে পারে।
কলাম ১: জ্ঞানের প্রকারভেদ
একটি শিক্ষা বুদ্ধি ব্যবস্থায় জ্ঞানকে সংগঠিত করার সময়, এটি স্পষ্ট হয়ে ওঠে যে এটিকে মূলত তিনটি সিস্টেম এবং দুটি প্রকারে শ্রেণীবদ্ধ করা যেতে পারে।
তিনটি সিস্টেম হলো: নিউরাল নেটওয়ার্ক দ্বারা পরিচালিত নেটওয়ার্ক প্যারামিটার জ্ঞান, প্রাকৃতিক ভাষায় প্রাকৃতিক জ্ঞান, এবং আনুষ্ঠানিক ভাষায় আনুষ্ঠানিক জ্ঞান।
দুটি প্রকার হলো স্টেটলেস (stateless) এবং স্টেটফুল (stateful)।
স্টেটলেস নেটওয়ার্ক প্যারামিটার জ্ঞান হলো স্বজ্ঞাত জ্ঞান, যেমনটি গভীর শিক্ষা এআই-এ পাওয়া যায়। বিড়াল এবং কুকুরের বৈশিষ্ট্য, যা মৌখিকভাবে চিন্তা বা চিহ্নিত করা যায় না, তা স্টেটলেস নেটওয়ার্ক প্যারামিটার জ্ঞান হিসাবে শেখা যেতে পারে।
স্টেটফুল নেটওয়ার্ক প্যারামিটার জ্ঞান হলো অস্পষ্ট, পুনরাবৃত্তিমূলক প্রক্রিয়া-ভিত্তিক জ্ঞান, যেমনটি জেনারেটিভ এআই-এ পাওয়া যায়।
স্টেটলেস প্রাকৃতিক জ্ঞান হলো এমন জ্ঞান যা একটি শব্দের অর্থের সাথে সম্পর্কিত।
স্টেটফুল প্রাকৃতিক জ্ঞান হলো এমন জ্ঞান যা একটি বাক্যের মধ্যে পাওয়া প্রসঙ্গ অন্তর্ভুক্ত করে।
কিছু প্রাকৃতিক জ্ঞান সহজাতভাবে স্টেটফুল নেটওয়ার্ক প্যারামিটার জ্ঞানে অন্তর্ভুক্ত থাকে, তবে এমন জ্ঞানও রয়েছে যা প্রাকৃতিক ভাষার পাঠ্য থেকে জন্মগতভাবে পরে অর্জিত হতে পারে।
স্টেটলেস আনুষ্ঠানিক জ্ঞান হলো এমন জ্ঞান যা গাণিতিক সূত্র দ্বারা প্রকাশ করা যায় যেখানে পুনরাবৃত্তি অন্তর্ভুক্ত নয়। স্টেটফুল আনুষ্ঠানিক জ্ঞান হলো এমন জ্ঞান যা প্রোগ্রাম দ্বারা প্রকাশ করা যায়।
নিজের মস্তিষ্কের স্বল্পমেয়াদী স্মৃতি প্রাকৃতিক এবং আনুষ্ঠানিক জ্ঞানের জন্য একটি অবস্থা স্মৃতি হিসাবেও ব্যবহার করা যেতে পারে।
তবে, যেহেতু এটি স্বল্পমেয়াদী স্মৃতি, তাই একটি অবস্থাকে স্থিতিশীলভাবে বজায় রাখা কঠিন হওয়ার একটি সমস্যা রয়েছে। এছাড়াও, এটি জ্ঞানকে একটি আনুষ্ঠানিক, দ্ব্যর্থহীন অবস্থায় ধারণ করতে ভালো নয়।
অন্যদিকে, কাগজ, কম্পিউটার বা স্মার্টফোন প্রাকৃতিক ভাষার পাঠ্য, আনুষ্ঠানিক ভাষা বা আনুষ্ঠানিক মডেল লেখার এবং সম্পাদনা করার জন্য অবস্থা স্মৃতি হিসাবে ব্যবহার করা যেতে পারে।
সাধারণত, কাগজ বা কম্পিউটারের ডেটা প্রায়শই জ্ঞান ভাণ্ডার হিসাবে জ্ঞান সংরক্ষণের জন্য কিছু হিসাবে বিবেচিত হয়, তবে এটি চিন্তা সংগঠিত করার জন্য অবস্থা স্মৃতি হিসাবেও ব্যবহার করা যেতে পারে।
সুতরাং, এটি স্পষ্ট যে মানুষ এই তিনটি সিস্টেম এবং দুটি ধরণের জ্ঞান দক্ষতার সাথে ব্যবহার করে বুদ্ধিবৃত্তিক কার্যক্রম সম্পাদন করে।
ALIS-এরও এই একই তিনটি সিস্টেম এবং দুটি ধরণের জ্ঞানকে কাজে লাগিয়ে বুদ্ধিবৃত্তিক কার্যক্রমকে সক্ষম ও উন্নত করে তার ক্ষমতাকে নাটকীয়ভাবে উন্নত করার সম্ভাবনা রয়েছে।
বিশেষ করে, ALIS-এর বিশাল জ্ঞান ভাণ্ডার এবং অবস্থা স্মৃতি ব্যবহার করার শক্তি রয়েছে। উপরন্তু, এটি সহজেই প্রতিটি একাধিক উদাহরণ প্রস্তুত করতে পারে এবং সেগুলিকে পরিবর্তন বা একত্রিত করে বুদ্ধিবৃত্তিক কাজ সম্পাদন করতে পারে।
কলাম ২: বুদ্ধিবৃত্তিক অর্কেস্ট্রেশন
যদিও জ্ঞান ভাণ্ডারে প্রচুর পরিমাণে জ্ঞান সংরক্ষণের একটি শক্তি আছে, তবে শুধুমাত্র প্রচুর পরিমাণে জ্ঞান থাকা বুদ্ধিবৃত্তিক কার্যকলাপের জন্য সবসময় উপকারী নয়। কারণ জেনারেটিভ এআই একবারে যে সংখ্যক টোকেন ব্যবহার করতে পারে তার সীমাবদ্ধতা রয়েছে এবং অপ্রাসঙ্গিক জ্ঞান গোলমালে পরিণত হওয়ার একটি সীমাবদ্ধতাও আছে।
অন্যদিকে, জ্ঞান ভাণ্ডারকে যথাযথভাবে বিভক্ত করে এবং নির্দিষ্ট বুদ্ধিবৃত্তিক কাজের জন্য প্রয়োজনীয় জ্ঞান সংগ্রহ করে উচ্চ-ঘনত্বের, বিশেষায়িত জ্ঞান ভাণ্ডার তৈরি করার মাধ্যমে টোকেন সীমা এবং গোলমালের সমস্যাগুলো কমানো যেতে পারে।
তবে, বিনিময়ে, এই ধরনের বিশেষায়িত জ্ঞান ভাণ্ডারগুলি কেবল সেই নির্দিষ্ট বুদ্ধিবৃত্তিক কাজগুলির জন্যই ব্যবহারযোগ্য হবে।
অনেক বুদ্ধিবৃত্তিক কার্যকলাপ বিভিন্ন বুদ্ধিবৃত্তিক কাজের জটিল সমন্বয়। অতএব, বুদ্ধিবৃত্তিক কাজের ধরণ অনুসারে জ্ঞানকে বিশেষায়িত জ্ঞান ভাণ্ডারে ভাগ করে এবং বুদ্ধিবৃত্তিক কার্যকলাপকে বুদ্ধিবৃত্তিক কাজগুলিতে উপবিভক্ত করার মাধ্যমে, ALIS বিশেষায়িত জ্ঞান ভাণ্ডারগুলির মধ্যে যথাযথভাবে পরিবর্তন করে সম্পূর্ণ বুদ্ধিবৃত্তিক কার্যকলাপ সম্পাদন করতে পারে।
এটি এমন একটি অর্কেস্ট্রার মতো যেখানে পেশাদার সঙ্গীতজ্ঞরা বিভিন্ন যন্ত্র বাজাচ্ছেন এবং একজন কন্ডাক্টর পুরো দলটিকে পরিচালনা করছেন।
এই সিস্টেম প্রযুক্তির মাধ্যমে, "বুদ্ধিবৃত্তিক অর্কেস্ট্রেশন" ব্যবহার করে ALIS তার বুদ্ধিবৃত্তিক কার্যকলাপগুলি সংগঠিত করতে সক্ষম হবে।
ALIS এর মৌলিক নকশা এবং উন্নয়ন পদ্ধতি
এখান থেকে, আমি ALIS এর উন্নয়ন পদ্ধতিকে সুসংগঠিত করব।
নীতি এবং কলামগুলিতে ইতিমধ্যে বলা হয়েছে, ALIS সহজাতভাবে তার ফাংশন এবং সংস্থানগুলি সহজে প্রসারিত করার জন্য ডিজাইন করা হয়েছে। এর কারণ হল ALIS-এর সারমর্ম নির্দিষ্ট ফাংশনে নিহিত নয়, বরং জ্ঞান নিষ্কাশন, সংরক্ষণ, নির্বাচন এবং ব্যবহারের প্রক্রিয়াগুলির মধ্যে রয়েছে।
উদাহরণস্বরূপ, একাধিক ধরণের জ্ঞান নিষ্কাশন প্রক্রিয়া প্রস্তুত করা যেতে পারে, এবং তারপর সিস্টেম ডিজাইন অনুযায়ী সেগুলি থেকে নির্বাচন করা বা একই সাথে ব্যবহার করা যেতে পারে।
তাছাড়া, ALIS নিজেই এই নির্বাচন করতে সক্ষম হতে পারে।
সংরক্ষণ, নির্বাচন এবং ব্যবহারও একইভাবে অবাধে নির্বাচন বা সমান্তরাল করা যেতে পারে।
অতএব, ALIS জলপ্রপাত পদ্ধতিতে (waterfall manner) সম্পূর্ণ কার্যকারিতা ডিজাইন করার প্রয়োজন ছাড়াই ক্রমবর্ধমানভাবে (incrementally) এবং দ্রুত (agilely) বিকাশ করা যেতে পারে।
ALIS এর সূচনা
এবার, একটি অত্যন্ত সরল ALIS ডিজাইন করা যাক।
মৌলিক ইউজার ইন্টারফেস (UI) হবে পরিচিত চ্যাট এআই। প্রাথমিকভাবে, ব্যবহারকারীর ইনপুট সরাসরি এলএলএম-কে (LLM) পাঠানো হবে। এলএলএম-এর প্রতিক্রিয়া তখন ইউআই-তে প্রদর্শিত হবে এবং সিস্টেম পরবর্তী ব্যবহারকারীর ইনপুটের জন্য অপেক্ষা করবে।
যখন পরবর্তী ইনপুট আসবে, তখন এলএলএম কেবল নতুন ইনপুটই নয়, ব্যবহারকারী এবং এলএলএম-এর মধ্যে সে পর্যন্ত ঘটে যাওয়া সম্পূর্ণ চ্যাট ইতিহাসও গ্রহণ করবে।
এই চ্যাট এআই ইউআই-এর পেছনে, আমরা চ্যাট ইতিহাস থেকে পুনরায় ব্যবহারযোগ্য জ্ঞান নিষ্কাশনের একটি প্রক্রিয়া প্রস্তুত করব।
এটি চ্যাট এআই সিস্টেমে একটি প্রক্রিয়া হিসাবে যুক্ত করা যেতে পারে যা একটি কথোপকথন শেষ হলে বা নিয়মিত বিরতিতে কার্যকর হয়। অবশ্যই, জ্ঞান নিষ্কাশনের জন্য একটি এলএলএম ব্যবহার করা হবে।
এই এলএলএম-কে ALIS ধারণা এবং নীতিগুলি, সাথে জ্ঞান নিষ্কাশন করার কৌশল, সিস্টেম প্রম্পট হিসাবে দেওয়া হবে। যদি উদ্দেশ্য অনুযায়ী জ্ঞান নিষ্কাশন না হয়, তাহলে পরীক্ষা-নিরীক্ষার মাধ্যমে সিস্টেম প্রম্পটগুলি উন্নত করা উচিত।
চ্যাট ইতিহাস থেকে নিষ্কাশিত জ্ঞান সরাসরি একটি নলেজ লেকে (knowledge lake) সংরক্ষণ করা হবে। একটি নলেজ লেক হলো জ্ঞানকে একটি ফ্ল্যাট, অসংগঠিত অবস্থায় কাঠামোবদ্ধ করার আগে কেবল সংরক্ষণের একটি প্রক্রিয়া।
এরপর, নলেজ লেক থেকে জ্ঞান নির্বাচনকে সহজ করার জন্য আমরা একটি কাঠামোবদ্ধকরণ প্রক্রিয়া প্রস্তুত করব।
এর অর্থ হলো সিমেন্টিক সার্চের জন্য এম্বেডিং ভেক্টর স্টোর (যেমন সাধারণত RAG-এ ব্যবহৃত হয়) এবং কিওয়ার্ড ইনডেক্স সহ অন্যান্য জিনিস সরবরাহ করা।
আরও উন্নত বিকল্পগুলির মধ্যে রয়েছে একটি নলেজ গ্রাফ তৈরি করা বা ক্যাটাগরি শ্রেণীবদ্ধকরণ করা।
নলেজ লেকের জন্য এই কাঠামোবদ্ধ তথ্যের সংগ্রহকে একটি নলেজ বেস (knowledge base) বলা হবে। এই সম্পূর্ণ নলেজ বেস এবং নলেজ লেক মিলে জ্ঞান ভাণ্ডার (knowledge store) গঠিত হবে।
এরপর, আমরা চ্যাট ইউআই প্রক্রিয়াকরণে জ্ঞান ভাণ্ডারকে একীভূত করব।
এটি মূলত একটি সাধারণ RAG প্রক্রিয়ার মতোই। ব্যবহারকারীর ইনপুটের জন্য, প্রাসঙ্গিক জ্ঞান জ্ঞান ভাণ্ডার থেকে নির্বাচিত হয় এবং ব্যবহারকারীর ইনপুট সহ এলএলএম-কে পাঠানো হয়।
এটি এলএলএম-কে ব্যবহারকারীর ইনপুট প্রক্রিয়া করার সময় স্বয়ংক্রিয়ভাবে জ্ঞান ব্যবহার করতে দেয়।
এইভাবে, ব্যবহারকারীর সাথে প্রতিটি কথোপকথনের সাথে জ্ঞান জমা হবে, যা একটি সাধারণ ALIS তৈরি করবে যা অতীতের কথোপকথন থেকে সংগৃহীত জ্ঞান ব্যবহার করে।
সরল পরিস্থিতি
উদাহরণস্বরূপ, কল্পনা করুন একজন ব্যবহারকারী এই সাধারণ ALIS ব্যবহার করে একটি ওয়েব অ্যাপ্লিকেশন তৈরি করছেন।
ব্যবহারকারী জানান যে LLM দ্বারা প্রস্তাবিত কোডটিতে একটি ত্রুটি দেখা দিয়েছে। ব্যবহারকারী এবং LLM একসাথে সমস্যা সমাধানের জন্য কাজ করার পর, তারা আবিষ্কার করেন যে LLM এর জানা বাহ্যিক API স্পেসিফিকেশন পুরোনো ছিল এবং সর্বশেষ API স্পেসিফিকেশনের সাথে মানিয়ে নেওয়ার পর প্রোগ্রামটি সঠিকভাবে কাজ করছে।
এই চ্যাট থ্রেড থেকে, ALIS তখন তার জ্ঞান ভাণ্ডারে জ্ঞান জমা করতে পারবে: বিশেষত, LLM এর জানা API স্পেসিফিকেশন পুরোনো এবং সর্বশেষ API স্পেসিফিকেশন কী।
তারপর, একই API ব্যবহার করে যখন পরবর্তী কোনো প্রোগ্রাম তৈরি করা হবে, তখন ALIS এই জ্ঞানকে কাজে লাগিয়ে শুরু থেকেই সর্বশেষ API স্পেসিফিকেশনের উপর ভিত্তি করে একটি প্রোগ্রাম তৈরি করতে পারবে।
প্রাথমিক ALIS-এর উন্নতি
তবে, এটি ঘটার জন্য, এই জ্ঞানকে ব্যবহারকারীর ইনপুটের প্রতিক্রিয়ায় নির্বাচন করতে হবে। এমন হতে পারে যে এই জ্ঞান সরাসরি ব্যবহারকারীর ইনপুটের সাথে সংযুক্ত হবে না, কারণ সমস্যাযুক্ত API নামটি ব্যবহারকারীর ইনপুটে নাও থাকতে পারে।
সেক্ষেত্রে, API নামটি কেবল LLM-এর প্রতিক্রিয়ার সময় আবির্ভূত হবে।
অতএব, আমরা সহজ ALIS-কে সামান্য প্রসারিত করব, প্রাক-বিশ্লেষণ এবং পোস্ট-চেকিংয়ের প্রক্রিয়া যুক্ত করে।
প্রাক-বিশ্লেষণ সাম্প্রতিক LLM-এর "চিন্তা মোড"-এর মতো। পাঠ্যকে অবস্থা স্মৃতি হিসেবে ধারণ করতে সক্ষম একটি স্মৃতি প্রস্তুত করা হবে, এবং সিস্টেম প্রম্পট LLM-কে ব্যবহারকারীর ইনপুট গ্রহণ করার পর প্রাক-বিশ্লেষণ করার নির্দেশ দেবে।
LLM-এর প্রাক-বিশ্লেষণের ফলাফল অবস্থা স্মৃতিতে সংরক্ষিত হবে। এই প্রাক-বিশ্লেষণের ফলাফলের উপর ভিত্তি করে, জ্ঞান ভাণ্ডার থেকে জ্ঞান নির্বাচন করা হবে।
তারপর, চ্যাট ইতিহাস, প্রাক-বিশ্লেষণের ফলাফল, ব্যবহারকারীর ইনপুটের সাথে সম্পর্কিত জ্ঞান, এবং প্রাক-বিশ্লেষণের ফলাফলের সাথে সম্পর্কিত জ্ঞান LLM-কে একটি প্রতিক্রিয়া পাওয়ার জন্য পাঠানো হবে।
উপরন্তু, LLM দ্বারা প্রত্যাবর্তিত ফলাফলও জ্ঞান ভাণ্ডার থেকে জ্ঞান অনুসন্ধানের জন্য ব্যবহৃত হবে। সেখানে প্রাপ্ত জ্ঞান সহ, LLM-কে একটি পোস্ট-চেক করার জন্য বলা হবে।
যদি কোনো সমস্যা পাওয়া যায়, তাহলে সমস্যাযুক্ত পয়েন্ট এবং সমালোচনার কারণগুলি অন্তর্ভুক্ত করা হবে এবং চ্যাট LLM-কে ফেরত পাঠানো হবে।
প্রাক-বিশ্লেষণ এবং পোস্ট-চেকিংয়ের সময় জ্ঞান নির্বাচন করার সুযোগ প্রদানের মাধ্যমে, আমরা সঞ্চিত জ্ঞান ব্যবহার করার সম্ভাবনা বাড়াতে পারি।
দৃষ্টিভঙ্গি
একটি প্রাথমিক ALIS তৈরি করা এবং তারপর এর দুর্বলতাগুলি সমাধানের জন্য উন্নতি যুক্ত করার এই পদ্ধতিটি অ্যাজাইল ডেভেলপমেন্ট এবং ALIS-এর ক্রমবর্ধমান উন্নতিকে পুরোপুরি তুলে ধরে।
তাছাড়া, উদাহরণস্বরূপ, প্রাথমিক ALIS সফটওয়্যার ডেভেলপমেন্টে ব্যবহারের জন্য সবচেয়ে উপযুক্ত। কারণ এটি একটি উচ্চ-চাহিদার ক্ষেত্র এবং এমন একটি ক্ষেত্র যেখানে জ্ঞান সহজে সুস্পষ্টভাবে জমা করা যায়।
এটি এমন একটি ধরন যেখানে বিষয়গুলি স্পষ্টভাবে সাদা বা কালো, তবুও এটি একটি গুরুত্বপূর্ণ ক্ষেত্র যেখানে পরীক্ষা-নিরীক্ষা, পুনরাবৃত্তিমূলক জ্ঞান সঞ্চালন অপরিহার্য এবং গুরুত্বপূর্ণ।
এছাড়াও, যেহেতু ALIS ডেভেলপমেন্ট নিজেই সফটওয়্যার ডেভেলপমেন্ট, তাই ALIS ডেভেলপাররা নিজেরাই ALIS ব্যবহারকারী হতে পারে এটিও আকর্ষণীয়।
এবং, ALIS সিস্টেমের সাথে, জ্ঞান হ্রদ (knowledge lake) GitHub-এর মতো প্ল্যাটফর্মেও উন্মুক্তভাবে শেয়ার করা যেতে পারে।
এটি অনেক লোককে ALIS সিস্টেমের উন্নতি এবং জ্ঞান সঞ্চালনে সহযোগিতা করার সুযোগ দেবে, যেখানে প্রত্যেকে ফলাফল থেকে উপকৃত হবে, যা ALIS ডেভেলপমেন্টকে আরও ত্বরান্বিত করবে।
অবশ্যই, জ্ঞান শেয়ারিং কেবল ALIS ডেভেলপারদের মধ্যে সীমাবদ্ধ নয়, বরং ALIS ব্যবহারকারী সমস্ত সফটওয়্যার ডেভেলপারদের কাছ থেকেও সংগ্রহ করা যেতে পারে।
জ্ঞান প্রাকৃতিক ভাষায় হওয়ার কারণে আরও দুটি সুবিধা রয়েছে:
প্রথম সুবিধা হল, LLM মডেল পরিবর্তন বা আপডেট হলেও জ্ঞান কাজে লাগানো যেতে পারে।
দ্বিতীয় সুবিধা হল, বিশাল সঞ্চিত জ্ঞান হ্রদ LLM-এর জন্য একটি প্রাক-প্রশিক্ষণ ডেটাসেট হিসাবে ব্যবহার করা যেতে পারে। এটি দুটি উপায়ে করা যেতে পারে: ফাইন-টিউনিংয়ের জন্য ব্যবহার করে, অথবা LLM প্রাক-প্রশিক্ষণের জন্যই ব্যবহার করে।
যাইহোক, যদি জ্ঞান হ্রদে সঞ্চিত জ্ঞান সহজাতভাবে শেখা LLM গুলিকে ব্যবহার করা যায়, তাহলে সফটওয়্যার ডেভেলপমেন্ট আরও বেশি কার্যকরী হবে।
তাছাড়া, সফটওয়্যার ডেভেলপমেন্টের মধ্যে বিভিন্ন প্রক্রিয়া যেমন প্রয়োজনীয়তা বিশ্লেষণ, নকশা, বাস্তবায়ন, পরীক্ষা, পরিচালনা, এবং রক্ষণাবেক্ষণ রয়েছে, এবং প্রতিটি সফটওয়্যার ডোমেইন এবং প্ল্যাটফর্মের জন্য বিশেষ জ্ঞান বিদ্যমান। যদি এই দৃষ্টিকোণ থেকে বিশাল সঞ্চিত জ্ঞানকে বিভাজন করার একটি প্রক্রিয়া তৈরি করা হয়, তাহলে একটি ALIS অর্কেস্ট্রাও গঠিত হতে পারে।
সুতরাং, ALIS-এর মৌলিক প্রযুক্তিগুলি এখন কার্যকর। এখন মূল বিষয় হল বিভিন্ন পদ্ধতি—যেমন জ্ঞান নিষ্কাশন কৌশল, উপযুক্ত জ্ঞান নির্বাচন, বিশেষ জ্ঞান বিভাজন, এবং অবস্থা স্মৃতি কিভাবে ব্যবহার করা যায়—বাস্তবিকভাবে চেষ্টা করে কার্যকর পদ্ধতি আবিষ্কার করা। এছাড়াও, জটিলতা বাড়ার সাথে সাথে প্রক্রিয়াকরণের সময় এবং LLM ব্যবহারের খরচ বাড়বে, যার জন্য অপ্টিমাইজেশনের প্রয়োজন হবে।
এই পরীক্ষা-নিরীক্ষা এবং অপ্টিমাইজেশন প্রক্রিয়াগুলি ফ্রেমওয়ার্কগুলির বিকাশ এবং উন্নতির মাধ্যমে অভিযোজিতভাবে অনুসরণ করা যেতে পারে।
প্রাথমিকভাবে, ডেভেলপাররা, ব্যবহারকারী হিসাবে, সম্ভবত পরীক্ষা-নিরীক্ষার মাধ্যমে ফ্রেমওয়ার্কগুলিকে ALIS-এ অন্তর্ভুক্ত করবে। তবে, তখনও, LLM নিজেই ফ্রেমওয়ার্ক ধারণা তৈরি করতে সক্ষম হতে পারে।
এবং, বিশ্ব থেকে প্রাপ্ত ফলাফল এবং নিষ্কাশিত জ্ঞানের উপর ভিত্তি করে ফ্রেমওয়ার্কগুলি উন্নত বা আবিষ্কার করে এমন ফ্রেমওয়ার্কগুলিকে ALIS-এ অন্তর্ভুক্ত করার মাধ্যমে, ALIS নিজেই পরীক্ষা-নিরীক্ষা এবং অপ্টিমাইজেশন অভিযোজিতভাবে সম্পাদন করবে।
বাস্তব জগতে ALIS
একবার ALIS এই পর্যায়ে পরিমার্জিত হলে, এটি কেবল সফটওয়্যার ডেভেলপমেন্টের জগতেই নয়, বরং বিভিন্ন ডোমেনে ব্যাপকভাবে জ্ঞান অর্জন করতে সক্ষম হবে।
সফটওয়্যার ডেভেলপমেন্টের মতোই, ALIS কম্পিউটারের সাহায্যে মানুষের দ্বারা সম্পাদিত বিভিন্ন বুদ্ধিবৃত্তিক কার্যকলাপে তার পরিধি প্রসারিত করবে বলে আশা করা হচ্ছে।
এমন বিশুদ্ধ বুদ্ধিবৃত্তিক কার্যকলাপগুলিতেও, ALIS লক্ষ্য বিশ্বের প্রতি এক ধরণের মূর্ত এআই প্রকৃতি ধারণ করে।
এটি এই কারণে যে, এটি নিজের এবং বিশ্বের মধ্যে সীমানা চিহ্নিত করে, সেই সীমানার মাধ্যমে বিশ্বের উপর কাজ করে এবং বিশ্ব থেকে প্রাপ্ত তথ্য উপলব্ধি করতে পারে।
আমরা সাধারণত যাকে "শরীর" বলি, তা হলো বিশ্বের সাথে একটি সীমানা যা শারীরিকভাবে দৃশ্যমান এবং এক স্থানে স্থানীয়করণ করা হয়।
তবে, যদি সীমানা অদৃশ্য এবং স্থানিকভাবে বিতরণ করা হয়, তবুও একটি সীমানার মাধ্যমে উপলব্ধি এবং কর্মের কাঠামো একটি শারীরিক শরীর থাকার মতোই।
সেই অর্থে, ALIS, যখন বুদ্ধিবৃত্তিক কার্যকলাপ সম্পাদন করে, তখন এটিকে একটি ভার্চুয়াল মূর্ত এআই-এর প্রকৃতি ধারণকারী হিসাবে বিবেচনা করা যেতে পারে।
এবং একবার ALIS এমন একটি পর্যায়ে পরিমার্জিত হয় যেখানে এটি নতুন, অজানা জগতেও যথাযথভাবে শিখতে পারে, তখন ALIS একটি বাস্তব মূর্ত এআই-এর অংশ হিসাবে সংহত হওয়ার সম্ভাবনা থাকে যা একটি শারীরিক শরীর ধারণ করে।
এভাবে, ALIS শেষ পর্যন্ত বাস্তব জগতে প্রয়োগ করা হবে এবং সেখান থেকে শিখতে শুরু করবে।