আমার ব্লগে লেখা নিবন্ধগুলি সুসংগঠিত করার জন্য, আমি জেনারেটিভ এআই (জেমিনি) ব্যবহার করে আমার নিজস্ব একটি ওয়েবসাইট তৈরি করেছি।
কাতোশির গবেষণা নোট https://katoshi-mfacet.github.io/
এই সাইটটি আমার জাপানি ভাষায় লেখা ব্লগ নিবন্ধের মূল খসড়া থেকে স্বয়ংক্রিয়ভাবে তৈরি হয়েছে।
এর বৈশিষ্ট্যগুলির মধ্যে রয়েছে:
- নিবন্ধের খসড়া থেকে স্বয়ংক্রিয়ভাবে তৈরি
- শ্রেণীবিন্যাস এবং ট্যাগিংয়ের মাধ্যমে নিবন্ধের বিন্যাস
- ৩০টি ভাষার সমর্থন এবং সহজলভ্যতা
মৌলিক প্রক্রিয়া
মৌলিক প্রক্রিয়ায় অ্যাস্ট্রো ফ্রেমওয়ার্কের উপর ভিত্তি করে তৈরি একটি স্ব-নির্মিত প্রোগ্রাম জড়িত, যা নিবন্ধের খসড়া থেকে স্বয়ংক্রিয়ভাবে HTML ফাইল তৈরি করে।
আমি এই প্রোগ্রামটি গুগলের জেমিনির সাথে চ্যাট করে তৈরি করেছি।
এই প্রক্রিয়ার কারণে, একবার একটি নিবন্ধের খসড়া লেখা এবং পুনঃসৃষ্টি প্রক্রিয়া চালানো হলে, HTML ফাইলগুলি স্বয়ংক্রিয়ভাবে আপডেট হয় এবং এই ওয়েবসাইটে প্রতিফলিত হয়।
শ্রেণীবিন্যাস এবং ট্যাগিং
শ্রেণীবিন্যাস এবং ট্যাগিংয়ের জন্য আমি একটি আলাদা প্রোগ্রামও তৈরি করেছি।
এই প্রোগ্রামটি একটি API এর মাধ্যমে জেমিনিতে নিবন্ধগুলি পাঠায় যাতে স্বয়ংক্রিয়ভাবে সেগুলিকে শ্রেণীবদ্ধ এবং ট্যাগ করা যায়।
নিবন্ধের সাথে বিভাগ এবং ট্যাগগুলির একটি তালিকা সরবরাহ করা হলে, জেমিনি নিবন্ধের অর্থ ব্যাখ্যা করে এবং দক্ষতার সাথে উপযুক্তগুলি প্রস্তাব করে।
উপরন্তু, বিভাগ এবং ট্যাগ তালিকাগুলি নিজেই আরেকটি কাস্টম প্রোগ্রাম দ্বারা নির্ধারিত হয় যা সেগুলিকে পূর্ববর্তী নিবন্ধগুলি থেকে নিষ্কাশন করে। এখানেও আমি জেমিনি ব্যবহার করি।
পূর্ববর্তী নিবন্ধগুলি একটি API এর মাধ্যমে জেমিনিতে ধারাবাহিকভাবে পাঠানো হয়, যা তখন সম্ভাব্য বিভাগ এবং ট্যাগগুলি আউটপুট করে। সমস্ত নিবন্ধ থেকে নিষ্কাশিত এই সম্ভাব্যগুলি তখন জেমিনিতে ফিরিয়ে দেওয়া হয় যাতে ব্যাপক বিভাগ এবং ট্যাগ তালিকাগুলি চূড়ান্ত করা যায়।
এই পুরো প্রক্রিয়াটিও প্রোগ্রাম দ্বারা স্বয়ংক্রিয় করা হয়েছে।
বহুভাষিক অনুবাদ
বহুভাষিকতার জন্য অনুবাদ অপরিহার্য। স্বাভাবিকভাবেই, এই অনুবাদের জন্যও জেমিনি ব্যবহার করা হয়।
অনুবাদের দুটি ধরণ রয়েছে:
একটি হল ওয়েবসাইটের মধ্যে থাকা সাধারণ স্ট্রিংগুলির অনুবাদ, যা নির্দিষ্ট নিবন্ধের উপর নির্ভরশীল নয়, যেমন মেনু আইটেমের নাম এবং আত্মপরিচয়।
অন্যটি হল নিবন্ধের খসড়াগুলির অনুবাদ।
এই উভয় কাজের জন্য, আমি একটি কাস্টম প্রোগ্রাম তৈরি করেছি যা জেমিনির API ব্যবহার করে অনুবাদগুলি সম্পাদন করে।
প্রবেশযোগ্যতা (Accessibility)
দৃষ্টি প্রতিবন্ধী ব্যবহারকারীরা যারা অডিওর মাধ্যমে নিবন্ধের বিষয়বস্তু শোনেন, এবং মাউস ব্যবহারে সমস্যা আছে এমন ব্যবহারকারীরা যারা শুধুমাত্র কীবোর্ড অপারেশনের মাধ্যমে ওয়েবসাইট ব্রাউজ করেন, তাদের কথা বিবেচনা করে HTML ফাইলগুলিতে কিছু উন্নতি যুক্ত করলে প্রবেশযোগ্যতা বৃদ্ধি পায়।
প্রবেশযোগ্যতা সম্পর্কে আমার খুব সামান্য জ্ঞান ছিল; প্রোগ্রামিং চ্যাটের সময় জেমিনিই এই উন্নতির প্রস্তাব করেছিল।
আর প্রবেশযোগ্যতা বাড়ানোর জন্য এই HTML পরিবর্তনগুলি কীভাবে প্রয়োগ করতে হয়, তা আমি জেমিনির সাথে চ্যাট করেই শিখেছিলাম।
প্রাচীরের বিলুপ্তি
এই ওয়েবসাইট তৈরির জন্য জেনারেটিভ এআই বিভিন্ন উপায়ে ব্যবহার করা হয়েছে, যার মধ্যে রয়েছে প্রোগ্রাম ডেভেলপমেন্ট, অনুবাদ এবং ক্যাটাগরি ও ট্যাগ সাজানোর জন্য প্রাকৃতিক ভাষা প্রক্রিয়াকরণ, এমনকি অ্যাক্সেসিবিলিটির মতো সূক্ষ্ম বিষয়গুলির প্রস্তাবনা যা আমি হয়তো উপেক্ষা করতাম।
এছাড়াও, নিবন্ধ যুক্ত করার সাথে সাথে স্বয়ংক্রিয় আপডেটের একটি প্রক্রিয়া তৈরি করার মাধ্যমে, যার মধ্যে HTML জেনারেশন এবং ক্যাটাগরি ও ট্যাগগুলির জন্য প্রাকৃতিক ভাষা প্রক্রিয়াকরণ অন্তর্ভুক্ত রয়েছে, আমি এই ওয়েবসাইটটিকে এমনভাবে তৈরি করতে পেরেছি যা প্রতিটি নতুন নিবন্ধের সাথে বাড়তে থাকবে।
এই ওয়েবসাইট তৈরির মাধ্যমে, আমি সত্যিই অনুভব করেছি যে জেনারেটিভ এআই এর সাহায্যে বিভিন্ন বাধা কতটা সহজে অতিক্রম করা যায়।
প্রথম এবং সবচেয়ে গুরুত্বপূর্ণ হল ভাষার বাধা। ৩০টি ভাষা সমর্থন করা ঐতিহ্যগতভাবে একজন ব্যক্তির পক্ষে সম্পূর্ণরূপে অসম্ভব ছিল, এমনকি অনুবাদের বিষয়টি বিবেচনা করলেও।
এছাড়াও, অনুবাদিত ব্লগগুলি উদ্দিষ্ট সূক্ষ্ম অর্থ প্রকাশ করে কিনা এবং অভিব্যক্তিগুলি স্থানীয় ভাষাভাষীদের কাছে অপ্রাকৃতিক বা আপত্তিকর কিনা তা নিয়েও উদ্বেগ রয়েছে।
জেনারেটিভ এআই এর অনুবাদ ঐতিহ্যগত মেশিন অনুবাদের চেয়ে সূক্ষ্ম অর্থ আরও সঠিকভাবে বোঝাতে পারে এবং আরও স্বাভাবিক অভিব্যক্তি ব্যবহার করতে পারে। এছাড়াও, অনুবাদিত আউটপুট জেনারেটিভ এআইতে পুনরায় প্রবেশ করিয়ে অপ্রাকৃতিক বা অনুপযুক্ত শব্দবন্ধ আছে কিনা তা পরীক্ষা করা যেতে পারে।
ওয়েবসাইটের বহুভাষিকতার দৃষ্টিকোণ থেকে, ভাষাভেদে প্রকাশের ধরন ভিন্ন হয় এমন উপাদান, যেমন তারিখ এবং একক, সঠিকভাবে পরিচালনা করা আরেকটি কঠিন বিষয় ছিল।
উদাহরণস্বরূপ, যদি তিনটি ভিন্ন ক্যাটাগরিতে ১, ২ এবং ১০টি নিবন্ধ থাকে, তাহলে জাপানি ভাষায় কেবল সংখ্যাটির পরে "記事" (কিজি - নিবন্ধ/আইটেম) এককটি যুক্ত করলেই যথেষ্ট, যেমন "1記事" (১টি নিবন্ধ), "2記事" (২টি নিবন্ধ), "10記事" (১০টি নিবন্ধ)।
তবে, ইংরেজিতে একবচন এবং বহুবচন ফর্মের মধ্যে পার্থক্য করা প্রয়োজন, যেমন "1 article," "2 articles," "10 articles।" উপরন্তু, কিছু ভাষায়, এমনকি ছোট বা বড় বহুবচনের জন্যও অভিব্যক্তি পরিবর্তিত হতে পারে বলে জানা গেছে।
তাছাড়া, আরবি-এর মতো যেসব ভাষা ডান থেকে বামে লেখা হয়, সেগুলির জন্য পুরো ওয়েবসাইটের বিন্যাস পাঠকের ডান থেকে বাম দিকের দৃষ্টিপথ অনুসরণ করে প্রাকৃতিক হতে হবে। যদি পাঠ্য বা ছবিতে তীর চিহ্ন ব্যবহার করা হয়, তবে সেগুলিকে অনুভূমিকভাবে উল্টানোর প্রয়োজনীয়তাও বিবেচনা করতে হবে। জেনারেটিভ এআই দ্বারা এই বিষয়গুলিও পরীক্ষা করে সমাধান করা হয়েছে।
জেনারেটিভ এআই এর সাথে ওয়েবসাইট বহুভাষিকতার কাজ করার মাধ্যমে, আমি এমন বিস্তারিত বিষয়গুলি যত্ন সহকারে সমাধান করতে সক্ষম হয়েছি যা ঐতিহ্যগত পদ্ধতিতে আমি হয়তো উপেক্ষা করতাম এবং হিসাব করতে পারতাম না।
প্রবেশযোগ্যতার (accessibility) ক্ষেত্রেও একই কথা প্রযোজ্য। এর আগে, আমি কেবল আমার মতোই ওয়েবসাইট দেখতে সক্ষম ব্যক্তিদের জন্য বিবেচনা করতে পারতাম।
তবে, জেনারেটিভ এআই এমন বিবেচনাগুলি সহজেই অন্তর্ভুক্ত করে যা আমি হয়তো লক্ষ্য করতাম না, বা যেগুলির জন্য প্রচেষ্টার কারণে আমি হয়তো তা সমাধান করতে দ্বিধা করতাম।
যদিও বহুভাষিকতা এবং প্রবেশযোগ্যতা এখনও নিখুঁত নাও হতে পারে, আমি বিশ্বাস করি যে এর গুণমান আমি নিজে চিন্তা করে বা গবেষণা করে যা অর্জন করতে পারতাম তার চেয়ে অনেক বেশি।
এভাবেই জেনারেটিভ এআই ব্লগ নিবন্ধের মাধ্যমে তথ্য প্রচারের প্রচেষ্টার অনেক বাধা দূর করেছে।
উপসংহার
আমি একজন সিস্টেম ইঞ্জিনিয়ার এবং আমার প্রোগ্রামিংয়ে ব্যাপক অভিজ্ঞতা আছে। যদিও আমি কাজের জন্য ওয়েবসাইট তৈরি করি না, তবে অতীতে শখ হিসেবে আমি বেশ কয়েকটি হোমপেজ তৈরি করেছি।
এই অভিজ্ঞতা এবং জেনারেটিভ এআই এর সাথে আমার মিথস্ক্রিয়াকে কাজে লাগিয়ে, আমি প্রায় দুই সপ্তাহের মধ্যে এই বহুভাষিক ব্লগ সাইটের স্বয়ংক্রিয় জেনারেশন সিস্টেমটি তৈরি করতে পেরেছি।
জেনারেটিভ এআই ছাড়া, আমি বহুভাষিক সহায়তার কথা প্রথম স্থানে চিন্তাও করতাম না। এই অর্থে, বলা যায় যে আমি কল্পনার বাধাও অতিক্রম করেছি।
এছাড়াও, প্রতিবার নিবন্ধ যুক্ত করার সময় সেগুলিকে শ্রেণীবদ্ধ এবং ট্যাগ করার প্রচেষ্টার কথা বিবেচনা করলে, সাইটটি প্রাথমিকভাবে তৈরি করার পর আপডেট করা বন্ধ করার সম্ভাবনা বেশি ছিল। জেনারেটিভ এআই এর প্রাকৃতিক ভাষা প্রক্রিয়াকরণ দ্বারা প্রদত্ত স্বয়ংক্রিয়করণের সাহায্যে, আমি রক্ষণাবেক্ষণ এবং আপডেটের বাধাও অতিক্রম করতে পেরেছি।
তাছাড়া, আমার মতো প্রোগ্রামিং বা ওয়েবসাইট তৈরির অভিজ্ঞতা নেই এমন ব্যক্তিরাও এই সিস্টেমটি তৈরি করতে পারে। আপনি যদি এই নিবন্ধটি জেমিনির মতো একটি জেনারেটিভ এআইকে দেন এবং একই রকম কিছু তৈরি করার ইচ্ছা প্রকাশ করেন, তবে এটি আপনাকে প্রক্রিয়াটির মাধ্যমে গাইড করতে সক্ষম হবে।
যদিও আমি আমার তৈরি প্রোগ্রামটি ব্যাপক ব্যবহারের জন্য প্রকাশ করতে পারতাম, তবে জেনারেটিভ এআই যখন একজন পূর্ণাঙ্গ সফটওয়্যার ইঞ্জিনিয়ার হয়ে উঠছে, তখন সম্ভবত এখন সবচেয়ে মূল্যবান তথ্য হল প্রোগ্রামটির চেয়েও এই নিবন্ধে উপস্থাপিত ধারণা এবং প্রক্রিয়াগুলির ব্যাখ্যা। ধারণা এবং মৌলিক প্রক্রিয়াগুলি প্রোগ্রামগুলির চেয়েও সহজে পরিবর্তন, উন্নত বা একত্রিত করা সম্ভব।
এটি ইঙ্গিত দেয় যে সফটওয়্যার ডেভেলপমেন্ট এবং ওয়েবসাইট তৈরির বাধাগুলি যেমন অদৃশ্য হয়ে যাচ্ছে, তেমনি ব্যক্তিগত তথ্য প্রচারের বাধাও অদৃশ্য হয়ে যাচ্ছে।
প্রযুক্তিগতভাবে, ইন্টারনেট তথ্যের আদান-প্রদানের বাধাগুলি কার্যত দূর করেছে, তবুও আমরা ভাষা এবং অ্যাক্সেসিবিলিটির মতো বাধা দ্বারা এখনও বাধাগ্রস্ত।
যদিও প্রাপকরা মেশিন অনুবাদ এবং টেক্সট-টু-স্পিচের মতো নিজস্ব প্রচেষ্টার মাধ্যমে কিছু বাধা অতিক্রম করতে পারে, তবে কিছু অংশ এমনও আছে যা তথ্য প্রেরণকারী সহায়তা এবং বিবেচনা না দিলে অতিক্রম করা যায় না।
ঠিক এই বাধাই তথ্য প্রেরণকারীদের অতিক্রম করতে হয়, যা জেনারেটিভ এআই দূর করে।
ভাষা এবং অ্যাক্সেসিবিলিটির বাধাগুলি অদৃশ্য হয়ে গেলেও, নিঃসন্দেহে সংস্কৃতি, রীতিনীতি এবং মূল্যবোধের পার্থক্যের মতো আরও বাধা থাকবে। এগুলি অতিক্রম করা আরও কঠিন হতে পারে।
তবে, এই কঠিন বাধাগুলি অতিক্রম করার জন্য, আমাদের প্রথমে সেগুলির সামনে থাকা বাধাগুলি অতিক্রম করতে হবে। একবার আমরা সেই প্রাচীরগুলির পাদদেশে পৌঁছে গেলে, সেগুলিকে অতিক্রম করার নতুন ধারণা এবং কৌশলগুলি অবশ্যই উদ্ভূত হবে।
এমনকি এমনও হতে পারে যে আমরা এমন এক যুগে প্রবেশ করছি যেখানে পৃথিবী থেকে প্রাচীরগুলি অদৃশ্য হয়ে যাচ্ছে। এই ওয়েবসাইট তৈরির মাধ্যমে, ঠিক এই অনুভূতিই আমার হয়েছিল।