বর্তমান জেনারেটিভ এআই হল একটি এআই প্রযুক্তি যা ট্রান্সফরমারের আবিষ্কারের ফলে বিকশিত হয়েছে, যা একটি বড় অগ্রগতি ছিল।
অ্যাটেনশন মেকানিজম হল এমন কিছু যা একটি একক বাক্যে ট্রান্সফরমারকে বৈশিষ্ট্যমণ্ডিত করে। ট্রান্সফরমার ঘোষণা করে প্রকাশিত গবেষণাপত্রের শিরোনামে এটি সংক্ষেপে প্রকাশিত হয়েছে: "Attention is All You Need।"
এর মূল কারণ হল সেই সময়ের এআই গবেষকরা এআই-কে মানুষের মতো দক্ষতার সাথে প্রাকৃতিক ভাষা পরিচালনা করতে সক্ষম করার জন্য বিভিন্ন প্রচেষ্টা এবং পরীক্ষা-নিরীক্ষা করছিলেন, এবং বিভিন্ন সফল পদ্ধতির নামকরণ করে গবেষণাপত্র প্রকাশ করছিলেন।
অনেক গবেষক বিশ্বাস করতেন যে এই একাধিক সুচারুভাবে কার্যকারী মেকানিজমকে বিভিন্ন উপায়ে একত্রিত করার মাধ্যমে, এআই ধীরে ধীরে মানুষের মতো প্রাকৃতিক ভাষা পরিচালনা করতে পারবে। তাই তারা নতুন মেকানিজম খুঁজে বের করার জন্য কাজ করছিলেন যা অন্যান্য মেকানিজমের সাথে সমন্বয়ে কাজ করতে পারে, এবং এই মেকানিজমগুলির সর্বোত্তম সমন্বয় আবিষ্কার করছিলেন।
তবে, ট্রান্সফরমার এই প্রচলিত ধারণাকে পাল্টে দিয়েছে। বিভিন্ন মেকানিজম একত্রিত করার প্রয়োজন নেই, এবং যা কিছু প্রয়োজন তা হল অ্যাটেনশন মেকানিজম – এই বার্তাটি গবেষণাপত্রের শিরোনামে প্রকাশ করা হয়েছে।
অবশ্যই, ট্রান্সফরমার নিজেই বিভিন্ন মেকানিজমকে অন্তর্ভুক্ত করে, তবে এর মধ্যে অ্যাটেনশন মেকানিজম বিশেষভাবে যুগান্তকারী এবং স্বতন্ত্র ছিল তাতে কোনো সন্দেহ নেই।
অ্যাটেনশন মেকানিজম-এর সংক্ষিপ্ত বিবরণ
অ্যাটেনশন মেকানিজম এমন একটি ব্যবস্থা যা প্রাকৃতিক ভাষাকে শব্দে শব্দে প্রক্রিয়াকরণের সময় শিখতে পারে যে একটি নির্দিষ্ট শব্দ প্রক্রিয়াকরণের সময় একটি বাক্যে তার আগে থাকা অনেক শব্দের মধ্যে কোন শব্দগুলিতে "মনোযোগ" দিতে হবে।
এটি এটিকে সঠিকভাবে বুঝতে সাহায্য করে যে "এই," "সেই," বা "উপরিউক্ত" (যা পূর্ববর্তী বাক্যগুলিতে থাকা শব্দগুলিকে নির্দেশ করে), বা "উদ্বোধনী বাক্য," "তালিকাভুক্ত দ্বিতীয় উদাহরণ," বা "পূর্ববর্তী অনুচ্ছেদ" (যা পাঠ্যে অবস্থান নির্দেশ করে) এর মতো শব্দগুচ্ছগুলি কী বোঝাতে চাইছে।
তাছাড়া, এটি সঠিকভাবে শব্দগুলিকে ব্যাখ্যা করতে পারে এমনকি যখন সংশোধকগুলি বাক্যের মধ্যে দূরে থাকে, এবং একটি পাঠ্য দীর্ঘ হলেও, এটি অন্যান্য বাক্যের মধ্যে বর্তমান শব্দের প্রসঙ্গ না হারিয়ে ব্যাখ্যা করতে পারে।
এটাই "মনোযোগ" এর উপযোগিতা।
বিপরীতভাবে, এর অর্থ হল যে যখন বর্তমানে প্রক্রিয়াজাত শব্দটিকে ব্যাখ্যা করা হয়, তখন অপ্রয়োজনীয় শব্দগুলিকে মুখোশ পরিয়ে ব্যাখ্যা থেকে সরিয়ে দেওয়া হয়।
একটি প্রদত্ত শব্দের ব্যাখ্যার জন্য কেবলমাত্র প্রয়োজনীয় শব্দগুলি রেখে এবং অপ্রাসঙ্গিক শব্দগুলি সরিয়ে দিয়ে, ব্যাখ্যা করার জন্য শব্দগুলির সেট সীমিত সংখ্যক থাকে, পাঠ্যটি যত দীর্ঘই হোক না কেন, যার ফলে ব্যাখ্যার ঘনত্ব কমে যাওয়া প্রতিরোধ করা যায়।
ভার্চুয়াল ইন্টেলিজেন্স
এখন, বিষয়টি সামান্য পরিবর্তন করে, আমি ভার্চুয়াল ইন্টেলিজেন্সের ধারণা নিয়ে ভাবছি।
বর্তমানে, ব্যবসার জন্য জেনারেটিভ এআই ব্যবহার করার সময়, যদি আপনি একটি কোম্পানির সমস্ত তথ্য একত্রিত করে জেনারেটিভ এআই-কে জ্ঞান হিসাবে দেন, তবে জ্ঞানের বিশাল পরিমাণ আসলে এআই-এর পক্ষে সঠিকভাবে এটি পরিচালনা করা কঠিন করে তুলতে পারে।
এই কারণে, কাজটি অনুযায়ী জ্ঞানকে বিভক্ত করা ভালো কাজ করে, প্রতিটি কাজের জন্য এআই চ্যাট প্রস্তুত করা বা নির্দিষ্ট অপারেশনের জন্য বিশেষায়িত এআই সরঞ্জাম তৈরি করা।
এর অর্থ হল যে জটিল কাজের জন্য, এই খণ্ডিত জ্ঞান-ভিত্তিক এআই চ্যাট এবং সরঞ্জামগুলিকে একত্রিত করা প্রয়োজন হয়ে পড়ে।
এটি জেনারেটিভ এআই ব্যবহার করার সময় একটি বর্তমান সীমাবদ্ধতা, তবে ভবিষ্যতের জেনারেটিভ এআই দিয়েও, নির্দিষ্ট কাজের জন্য, কেবলমাত্র সেই কাজের জন্য প্রয়োজনীয় জ্ঞানের উপর ফোকাস করলে উচ্চতর নির্ভুলতা অর্জন করা উচিত।
পরিবর্তে, আমি বিশ্বাস করি যে ভবিষ্যতের জেনারেটিভ এআই পরিস্থিতি অনুসারে প্রয়োজনীয় জ্ঞানের সেটগুলির মধ্যে অভ্যন্তরীণভাবে স্যুইচ করতে সক্ষম হবে, এমনকি মানুষের জ্ঞানকে বিভক্ত করার প্রয়োজন ছাড়াই।
এই ক্ষমতাটি হল ভার্চুয়াল ইন্টেলিজেন্স। এটি একটি ভার্চুয়াল মেশিনের মতো যা একটি একক কম্পিউটারে একাধিক ভিন্ন অপারেটিং সিস্টেম চালাতে পারে। এর অর্থ হল একটি বুদ্ধিমত্তার মধ্যে, বিভিন্ন বিশেষজ্ঞতা সহ একাধিক ভার্চুয়াল বুদ্ধিমত্তা কাজ করতে পারে।
বর্তমান জেনারেটিভ এআইও একাধিক লোকের মধ্যে আলোচনা অনুকরণ করতে পারে বা একাধিক চরিত্রের বৈশিষ্ট্যযুক্ত গল্প তৈরি করতে পারে। অতএব, ভার্চুয়াল ইন্টেলিজেন্স একটি বিশেষ ক্ষমতা নয়, বরং বর্তমান জেনারেটিভ এআই-এর একটি সম্প্রসারণ।
মাইক্রো ভার্চুয়াল ইন্টেলিজেন্স
ভার্চুয়াল ইন্টেলিজেন্সের প্রক্রিয়া, যা কাজ অনুসারে প্রয়োজনীয় জ্ঞানকে সংকুচিত করে, তা অ্যাটেনশন মেকানিজমের মতো কিছু কাজ করে।
অর্থাৎ, এটি অ্যাটেনশন মেকানিজমের মতো যে এটি বর্তমানে প্রক্রিয়াজাত কাজ অনুসারে শুধুমাত্র প্রাসঙ্গিক জ্ঞানের উপর মনোযোগ দেয়।
বিপরীতভাবে, অ্যাটেনশন মেকানিজমকে এমন একটি প্রক্রিয়া বলা যেতে পারে যা ভার্চুয়াল ইন্টেলিজেন্সের মতো কিছু উপলব্ধি করে। তবে, আমি যে ভার্চুয়াল ইন্টেলিজেন্সের কথা ভাবছি তা হল একটি প্রক্রিয়া যা জ্ঞানের সেট থেকে প্রাসঙ্গিক জ্ঞান নির্বাচন করে, যেখানে অ্যাটেনশন মেকানিজম শব্দের সেটের উপর কাজ করে।
এই কারণে, অ্যাটেনশন মেকানিজমকে মাইক্রো ভার্চুয়াল ইন্টেলিজেন্স বলা যেতে পারে।
এক্সপ্লিসিট অ্যাটেনশন মেকানিজম
যদি আমরা অ্যাটেনশন মেকানিজমকে মাইক্রো ভার্চুয়াল ইন্টেলিজেন্স হিসাবে দেখি, তাহলে বিপরীতভাবে, আমি আগে যে ভার্চুয়াল ইন্টেলিজেন্সের কথা উল্লেখ করেছি তা একটি ম্যাক্রো অ্যাটেনশন মেকানিজম তৈরি করে উপলব্ধি করা যেতে পারে।
এবং এই ম্যাক্রো অ্যাটেনশন মেকানিজমকে বৃহৎ ভাষা মডেলের অভ্যন্তরীণ কাঠামোতে যোগ করার বা নিউরাল নেটওয়ার্ক প্রশিক্ষণের সাথে জড়িত থাকার প্রয়োজন নেই।
এটি কেবল প্রাকৃতিক ভাষায় লেখা একটি সুস্পষ্ট বাক্য হতে পারে, যেমন "কাজ A সম্পাদন করার সময়, জ্ঞান B এবং জ্ঞান C উল্লেখ করুন।"
এটি কাজ A-এর জন্য প্রয়োজনীয় জ্ঞানকে স্পষ্ট করে। এই বাক্যটি নিজেই এক ধরনের জ্ঞান।
এটিকে একটি এক্সপ্লিসিট অ্যাটেনশন মেকানিজম বলা যেতে পারে। এই বাক্যটিকে অ্যাটেনশন জ্ঞান হিসাবে বর্ণনা করা যেতে পারে, যা কাজ A সম্পাদন করার সময় কোন জ্ঞানের উপর মনোযোগ দিতে হবে তা স্পষ্টভাবে উল্লেখ করে।
এছাড়াও, এই অ্যাটেনশন জ্ঞান জেনারেটিভ এআই দ্বারা তৈরি বা আপডেট করা যেতে পারে।
যদি জ্ঞানের অভাবে কোনো কাজ ব্যর্থ হয়, তবে একটি শিক্ষা হিসাবে, সেই কাজের জন্য অতিরিক্ত জ্ঞান যা উল্লেখ করা উচিত তা অন্তর্ভুক্ত করার জন্য অ্যাটেনশন জ্ঞান আপডেট করা যেতে পারে।
উপসংহার
অ্যাটেনশন মেকানিজম জেনারেটিভ এআই-এর ক্ষমতাকে নাটকীয়ভাবে উন্নত করেছে।
এটি কেবল এমন একটি প্রক্রিয়া ছিল না যা ঘটনাক্রমে ভাল কাজ করেছে; যেমনটি আমরা এখানে দেখেছি, প্রতিটি পরিস্থিতিতে তথ্যকে গতিশীলভাবে সংকুচিত করার প্রক্রিয়াটিই উন্নত বুদ্ধিমত্তার সারমর্ম বলে মনে হয়।
এবং ভার্চুয়াল ইন্টেলিজেন্স এবং সুস্পষ্ট অ্যাটেনশন জ্ঞানের মতো, অ্যাটেনশন মেকানিজমও বিভিন্ন স্তরে বুদ্ধিমত্তাকে পুনরাবৃত্তিমূলকভাবে উন্নত করার চাবিকাঠি।