مواد پر جائیں
یہ مضمون AI کا استعمال کرتے ہوئے جاپانی سے ترجمہ کیا گیا ہے۔
جاپانی میں پڑھیں
یہ مضمون پبلک ڈومین (CC0) میں ہے۔ اسے آزادانہ طور پر استعمال کرنے کے لیے آزاد محسوس کریں۔ CC0 1.0 Universal

مائیکرو ورچوئل انٹیلیجنس کے طور پر اٹینشن میکانزم

موجودہ جنریٹو AI ایک AI ٹیکنالوجی ہے جو ٹرانسفارمرز کی ایجاد کی بدولت پروان چڑھی، جو ایک بڑی پیش رفت تھی۔

اٹینشن میکانزم ہی ٹرانسفارمر کو ایک جملے میں نمایاں کرتا ہے۔ یہ ٹرانسفارمر کا اعلان کرنے والے مقالے کے عنوان میں اختصار کے ساتھ بیان کیا گیا ہے: "اٹينشن وہ سب کچھ ہے جس کی آپ کو ضرورت ہے۔"

اس کی جڑیں اس حقیقت میں پیوست ہیں کہ اس وقت کے AI محققین AI کو قدرتی زبان کو انسانوں کی طرح مہارت سے ہینڈل کرنے کے قابل بنانے کے لیے مختلف کوششیں اور تجربات کر رہے تھے، اور مختلف کامیاب طریقوں پر مقالے لکھ اور شائع کر رہے تھے۔

بہت سے محققین کا خیال تھا کہ ان متعدد اچھے کام کرنے والے میکانزم کو متنوع طریقوں سے یکجا کرنے سے، AI جو انسانوں کی طرح قدرتی زبان کو ہینڈل کر سکتا ہے، آہستہ آہستہ ابھرے گا۔ اس طرح وہ نئے میکانزم تلاش کرنے پر کام کر رہے تھے جو دیگر میکانزم کے ساتھ مل کر کام کر سکیں، اور ان میکانزم کے بہترین امتزاج کو دریافت کر رہے تھے۔

تاہم، ٹرانسفارمر نے اس روایتی حکمت کو الٹ دیا۔ یہ پیغام کہ مختلف میکانزم کو یکجا کرنا غیر ضروری ہے، اور یہ کہ صرف اٹینشن میکانزم کی ضرورت ہے، مقالے کے عنوان میں ظاہر ہوتا ہے۔

یقیناً، ٹرانسفارمر خود مختلف میکانزم کو شامل کرتا ہے، لیکن اس میں کوئی شک نہیں کہ ان میں سے، اٹینشن میکانزم خاص طور پر انقلابی اور امتیازی تھا۔

اٹینشن میکانزم کا جائزہ

اٹینشن میکانزم ایک ایسا نظام ہے جو قدرتی زبان کو لفظ بہ لفظ پروسیس کرنے کے دوران یہ سیکھ سکتا ہے کہ کسی مخصوص لفظ کو پروسیس کرتے وقت جملے میں موجود پچھلے کئی الفاظ میں سے کس پر "توجہ" دینی چاہیے۔

یہ اسے درست طور پر سمجھنے کی صلاحیت دیتا ہے کہ "یہ،" "وہ،" یا "مذکورہ بالا" (جو پچھلے جملوں میں موجود الفاظ کا حوالہ دیتے ہیں) جیسے الفاظ، یا "ابتدائی جملہ،" "فہرست میں دوسری مثال،" یا "پچھلا پیراگراف" (جو متن میں پوزیشنز کی نشاندہی کرتے ہیں) جیسی عبارات کس چیز کا حوالہ دے رہی ہیں۔

مزید برآں، یہ الفاظ کی صحیح تشریح کر سکتا ہے چاہے جملے میں ترمیمی الفاظ دور ہوں، اور یہاں تک کہ جب کوئی متن طویل ہو جائے، تب بھی یہ دوسرے جملوں کے درمیان موجودہ لفظ کے سیاق و سباق کو کھوئے بغیر تشریح کر سکتا ہے۔

یہی "اٹینشن" کا فائدہ ہے۔

اس کے برعکس، اس کا مطلب یہ بھی ہے کہ جب موجودہ زیرِ عمل لفظ کی تشریح کی جاتی ہے تو غیر ضروری الفاظ کو چھپا دیا جاتا ہے اور تشریح سے ہٹا دیا جاتا ہے۔

کسی مخصوص لفظ کی تشریح کے لیے صرف ضروری الفاظ کو برقرار رکھ کر اور غیر متعلقہ الفاظ کو ہٹا کر، تشریح کیے جانے والے الفاظ کا مجموعہ ایک چھوٹی تعداد تک محدود رہتا ہے، خواہ متن کتنا ہی طویل کیوں نہ ہو، اس طرح تشریح کی کثافت کو کم ہونے سے روکا جا سکتا ہے۔

ورچوئل انٹیلیجنس

اب، موضوع کو تھوڑا تبدیل کرتے ہوئے، میں ورچوئل انٹیلیجنس کے تصور کے بارے میں سوچ رہا ہوں۔

فی الحال، جب کاروباری مقاصد کے لیے جنریٹو AI کا استعمال کیا جاتا ہے، اگر آپ کمپنی کے اندر کی تمام معلومات کو یکجا کر کے اسے جنریٹو AI کو بطور علم فراہم کرتے ہیں، تو علم کی بہت زیادہ مقدار درحقیقت AI کے لیے اسے مناسب طریقے سے ہینڈل کرنا مشکل بنا سکتی ہے۔

اس وجہ سے، علم کو ٹاسک کے لحاظ سے تقسیم کرنا بہتر کام کرتا ہے، ہر ٹاسک کے لیے AI چیٹس تیار کرنا یا مخصوص آپریشنز کے لیے خصوصی AI ٹولز بنانا۔

اس کا مطلب یہ ہے کہ پیچیدہ ٹاسکس کے لیے، ان تقسیم شدہ علم پر مبنی AI چیٹس اور ٹولز کو یکجا کرنا ضروری ہو جاتا ہے۔

یہ جنریٹو AI استعمال کرتے وقت ایک موجودہ حد ہے، لیکن مستقبل کے جنریٹو AI کے ساتھ بھی، مخصوص ٹاسکس کے لیے، صرف اس ٹاسک کے لیے درکار علم پر توجہ مرکوز کرنے سے زیادہ درستگی حاصل ہونی چاہیے۔

اس کے بجائے، میرا خیال ہے کہ مستقبل کا جنریٹو AI اندرونی طور پر صورتحال کے لحاظ سے ضروری علم کے سیٹوں کے درمیان سوئچ کرنے کے قابل ہو گا، یہاں تک کہ انسانوں کو علم کو تقسیم کرنے کی ضرورت کے بغیر بھی۔

یہ صلاحیت ورچوئل انٹیلیجنس ہے۔ یہ ایک ورچوئل مشین کی طرح ہے جو ایک ہی کمپیوٹر پر متعدد مختلف آپریٹنگ سسٹم چلا سکتی ہے۔ اس کا مطلب یہ ہے کہ ایک ذہانت کے اندر، مختلف خصوصیات کے ساتھ متعدد ورچوئل انٹیلیجنس کام کر سکتی ہیں۔

موجودہ جنریٹو AI بھی پہلے سے ہی متعدد افراد کے درمیان مباحثوں کی نقل کر سکتا ہے یا متعدد کرداروں والی کہانیاں بنا سکتا ہے۔ لہذا، ورچوئل انٹیلیجنس کوئی خاص صلاحیت نہیں ہے، بلکہ موجودہ جنریٹو AI کی ہی ایک توسیع ہے۔

مائیکرو ورچوئل انٹیلیجنس

ورچوئل انٹیلیجنس کا میکانزم، جو کام کے مطابق ضروری علم کو محدود کرتا ہے، اٹینشن میکانزم سے ملتی جلتی چیز انجام دیتا ہے۔

یعنی، یہ اٹینشن میکانزم سے اس لحاظ سے مماثل ہے کہ یہ موجودہ زیرِ عمل کام کے لحاظ سے صرف متعلقہ علم پر توجہ مرکوز کرتا ہے۔

اس کے برعکس، اٹینشن میکانزم کو ایک ایسا میکانزم کہا جا سکتا ہے جو ورچوئل انٹیلیجنس جیسی چیز کو حقیقت کا روپ دیتا ہے۔ تاہم، جو ورچوئل انٹیلیجنس میں زیرِ غور لایا جا رہا ہوں وہ ایک ایسا میکانزم ہے جو علم کے مجموعے سے متعلقہ علم کا انتخاب کرتا ہے، جبکہ اٹینشن میکانزم الفاظ کے مجموعے پر کام کرتا ہے۔

اس وجہ سے، اٹینشن میکانزم کو مائیکرو ورچوئل انٹیلیجنس کہا جا سکتا ہے۔

واضح اٹینشن میکانزم

اگر ہم اٹینشن میکانزم کو مائیکرو ورچوئل انٹیلیجنس کے طور پر دیکھتے ہیں، تو اس کے برعکس، جو ورچوئل انٹیلیجنس میں نے پہلے ذکر کی تھی اسے ایک میکرو اٹینشن میکانزم کی تشکیل سے حاصل کیا جا سکتا ہے۔

اور اس میکرو اٹینشن میکانزم کو بڑے لسانی ماڈلز کی اندرونی ساخت میں شامل کرنے یا نیورل نیٹ ورک کی تربیت میں شامل کرنے کی ضرورت نہیں ہے۔

یہ صرف قدرتی زبان میں لکھا ہوا ایک واضح جملہ ہو سکتا ہے، جیسے کہ "ٹاسک A کو انجام دیتے وقت، نالج B اور نالج C سے رجوع کریں۔"

اس سے ٹاسک A کے لیے درکار نالج واضح ہو جاتی ہے۔ یہ جملہ خود ایک قسم کا نالج ہے۔

اسے ایک واضح اٹینشن میکانزم کہا جا سکتا ہے۔ اس جملے کو اٹینشن نالج کے طور پر بیان کیا جا سکتا ہے، جو واضح طور پر اس نالج کو بیان کرتا ہے جس پر ٹاسک A کو انجام دیتے وقت توجہ دی جانی چاہیے۔

مزید برآں، اس اٹینشن نالج کو جنریٹو AI کے ذریعے تیار یا اپ ڈیٹ کیا جا سکتا ہے۔

اگر کسی کام میں نالج کی کمی کی وجہ سے ناکامی ہوتی ہے، تو ایک سبق کے طور پر، اٹینشن نالج کو اپ ڈیٹ کیا جا سکتا ہے تاکہ اس کام کے لیے حوالہ دی جانے والی اضافی نالج شامل کی جا سکے۔

نتیجہ

اٹینشن میکانزم نے جنریٹو AI کی صلاحیتوں کو ڈرامائی طور پر بہتر کیا ہے۔

یہ محض ایک ایسا میکانزم نہیں تھا جو اتفاق سے اچھی طرح کام کر گیا؛ جیسا کہ ہم نے یہاں دیکھا ہے، ہر صورت حال میں حوالہ دینے کے لیے معلومات کو متحرک طور پر محدود کرنے کا یہ طریقہ کار ہی اعلیٰ ذہانت کا جوہر معلوم ہوتا ہے۔

اور ورچوئل انٹیلیجنس اور واضح اٹینشن نالج کی طرح، اٹینشن میکانزم بھی مختلف سطحوں پر ذہانت کو بار بار آگے بڑھانے کی کلید ہے۔