يُعد الذكاء الاصطناعي التوليدي الحالي تقنية ذكاء اصطناعي ازدهرت باختراع Transformer كإنجاز كبير.
يمكن وصف آلية الانتباه بأنها السمة المميزة لـ Transformer. وقد تم التعبير عن ذلك بإيجاز في عنوان الورقة البحثية التي أعلنت عن Transformer: "Attention Is All You Need" (كل ما تحتاجه هو الانتباه).
كانت الخلفية لذلك هي أن باحثي الذكاء الاصطناعي في ذلك الوقت كانوا يبذلون جهودًا مختلفة وينخرطون في التجربة والخطأ لتمكين الذكاء الاصطناعي من التعامل مع اللغة الطبيعية بمهارة مثل البشر، وتسمية الأساليب الناجحة ونشر أوراق بحثية عنها.
اعتقد العديد من الباحثين أنه من خلال الجمع بين هذه الآليات الفعالة المتعددة بطرق متنوعة، يمكنهم تدريجيًا إنشاء ذكاء اصطناعي قادر على التعامل مع اللغة الطبيعية مثل البشر. وقد ركزوا على اكتشاف آليات جديدة يمكن أن تعمل بالاشتراك مع آليات أخرى، وإيجاد التركيبات المثلى لهذه الآليات.
ومع ذلك، قلب Transformer هذه الحكمة التقليدية رأسًا على عقب. فقد كانت الرسالة التي مفادها أنه لا توجد حاجة للجمع بين آليات مختلفة، وأن آلية الانتباه وحدها هي المطلوبة، واضحة في عنوان الورقة البحثية.
بينما يشتمل Transformer نفسه بالتأكيد على آليات مختلفة، لا شك أن آلية الانتباه كانت رائدة ومميزة بشكل خاص من بينها.
نظرة عامة على آلية الانتباه
آلية الانتباه هي نظام يتيح للذكاء الاصطناعي تعلم الكلمات التي يجب أن يركز عليها، من بين العديد من الكلمات الموجودة في الجمل السابقة، عند معالجة كلمة معينة في اللغة الطبيعية.
يمكّن هذا الذكاء الاصطناعي من فهم دقيق لما تشير إليه الكلمة، على سبيل المثال، عند التعامل مع الكلمات الإشارية مثل "هذا"، "ذاك"، أو "المذكور آنفاً" (التي تشير إلى كلمة في جملة سابقة)، أو المراجع الموضعية مثل "الجملة الافتتاحية"، "المثال الثاني المذكور"، أو "الفقرة السابقة".
علاوة على ذلك، يمكنها تفسير الصفات بشكل صحيح حتى لو كانت متباعدة في الجملة، وحتى في النصوص الطويلة، يمكنها تفسير الكلمات دون أن تفقد السياق الذي تشير إليه الكلمة الحالية، مما يمنعها من الضياع بين الجمل الأخرى.
هذه هي فائدة "الانتباه".
على العكس من ذلك، هذا يعني أنه عند تفسير الكلمة التي تتم معالجتها حاليًا، يتم إخفاء الكلمات غير الضرورية وإزالتها من التفسير.
من خلال الاحتفاظ فقط بالكلمات الضرورية لتفسير كلمة معينة وإزالة الكلمات غير ذات الصلة، تظل مجموعة الكلمات المراد تفسيرها مقتصرة على عدد قليل، بغض النظر عن طول النص، وبالتالي منع كثافة التفسير من التخفيف.
الذكاء الافتراضي
الآن، بالانتقال إلى موضوع مختلف قليلاً، كنت أتأمل في مفهوم الذكاء الافتراضي.
حاليًا، عند استخدام الذكاء الاصطناعي التوليدي للأعمال، إذا تم دمج جميع المعلومات داخل الشركة وتقديمها كقاعدة معرفية واحدة للذكاء الاصطناعي، فإن الحجم الهائل للمعرفة يمكن أن يصبح طاغيًا، مما يؤدي إلى ظاهرة عدم قدرة الذكاء الاصطناعي على معالجتها بشكل صحيح.
لهذا السبب، من الأكثر فعالية فصل المعرفة حسب المهمة، وإعداد محادثات ذكاء اصطناعي لكل مهمة أو إنشاء أدوات ذكاء اصطناعي متخصصة لعمليات محددة.
ونتيجة لذلك، عند أداء مهام معقدة، يصبح من الضروري دمج محادثات أو أدوات الذكاء الاصطناعي هذه، كل منها بمعرفته المنفصلة.
بينما يمثل هذا قيدًا حاليًا للذكاء الاصطناعي التوليدي، إلا أنه أساسًا، حتى مع الذكاء الاصطناعي التوليدي المستقبلي، فإن التركيز فقط على المعرفة المطلوبة لمهمة معينة يجب أن يؤدي إلى دقة أعلى.
بدلاً من ذلك، أعتقد أن الذكاء الاصطناعي التوليدي المستقبلي سيكون قادرًا على التمييز الداخلي واستخدام المعرفة الضرورية وفقًا للموقف، حتى بدون الحاجة إلى تقسيم البشر لهذه المعرفة.
هذه القدرة هي الذكاء الافتراضي. إنها مثل آلة افتراضية يمكنها تشغيل أنظمة تشغيل متعددة ومختلفة على جهاز كمبيوتر واحد. وهذا يعني أنه ضمن ذكاء واحد، يمكن أن تعمل ذكاءات افتراضية متعددة ذات تخصصات مختلفة.
حتى الذكاء الاصطناعي التوليدي الحالي يمكنه بالفعل محاكاة المناقشات بين عدة أشخاص أو توليد قصص تتضمن شخصيات متعددة. لذلك، فإن الذكاء الافتراضي ليس قدرة خاصة، بل هو امتداد للذكاء الاصطناعي التوليدي الحالي.
الذكاء الافتراضي المصغر
تؤدي آلية الذكاء الافتراضي، التي تحدد المعرفة الضرورية وفقًا للمهمة، شيئًا مشابهًا لآلية الانتباه.
بمعنى آخر، إنها مماثلة لآلية الانتباه من حيث أنها تركز على المعرفة ذات الصلة فقط وتعالجها بناءً على المهمة التي يتم تنفيذها حاليًا.
على العكس من ذلك، يمكن القول إن آلية الانتباه هي آلية تحقق شيئًا يشبه الذكاء الافتراضي. ومع ذلك، بينما يختار الذكاء الافتراضي الذي أتخيله المعرفة ذات الصلة من مجموعة من المعارف، تعمل آلية الانتباه على وحدة مجموعة من الكلمات.
لهذا السبب، يمكن تسمية آلية الانتباه بالذكاء الافتراضي المصغر.
آلية الانتباه الصريحة
إذا نظرنا إلى آلية الانتباه على أنها ذكاء افتراضي مصغر، فإن الذكاء الافتراضي الذي ذكرته سابقًا يمكن تحقيقه، على العكس من ذلك، من خلال بناء آلية انتباه كلية.
ولا تحتاج آلية الانتباه الكلية هذه إلى إضافتها إلى البنية الداخلية لنماذج اللغة الكبيرة أو أن تتضمن تعلم الشبكات العصبية.
يمكن أن تكون ببساطة بيانًا صريحًا مكتوبًا باللغة الطبيعية، مثل: "عند تنفيذ المهمة أ، ارجع إلى المعرفة ب والمعرفة ج."
يوضح هذا المعرفة المطلوبة للمهمة أ. وهذا البيان نفسه هو نوع من المعرفة.
يمكن تسمية هذا بآلية الانتباه الصريحة. ويمكن اعتبار هذا البيان "معرفة الانتباه"، التي توضح صراحة المعرفة التي يجب التركيز عليها عند تنفيذ المهمة أ.
علاوة على ذلك، يمكن إنشاء معرفة الانتباه هذه أو تحديثها بواسطة الذكاء الاصطناعي التوليدي.
إذا فشلت مهمة ما بسبب نقص المعرفة، فيمكن تحديث معرفة الانتباه لتشمل معرفة إضافية كمرجع لتلك المهمة، بناءً على هذا التفكير.
الخاتمة
لقد طوّرت آلية الانتباه بشكل كبير قدرات الذكاء الاصطناعي التوليدي.
لم تكن مجرد آلية عملت بشكل جيد بالصدفة؛ بل، كما رأينا هنا، يبدو أن الآلية نفسها لتضييق نطاق المعلومات التي يجب الرجوع إليها ديناميكيًا لكل موقف هي جوهر الذكاء المتقدم.
وكما هو الحال مع الذكاء الافتراضي ومعرفة الانتباه الصريحة، فإن آلية الانتباه هي أيضًا المفتاح لتعزيز الذكاء بشكل متكرر عبر طبقات مختلفة.