يُعد الذكاء الاصطناعي التوليدي الحالي تقنية ذكاء اصطناعي ازدهرت بفضل اختراع المحولات (Transformers)، الذي كان بمثابة إنجاز كبير.
آلية الانتباه هي ما يميز المحولات في عبارة واحدة. وهذا معبر عنه بإيجاز في عنوان الورقة البحثية التي أعلنت عن المحولات: "الانتباه هو كل ما تحتاجه" (Attention is All You Need).
يعود هذا إلى حقيقة أن باحثي الذكاء الاصطناعي في ذلك الوقت كانوا يبذلون جهودًا وتجارب مختلفة لتمكين الذكاء الاصطناعي من التعامل مع اللغة الطبيعية بمهارة مثل البشر، وتسمية ونشر أوراق بحثية حول الأساليب الناجحة المختلفة.
اعتقد العديد من الباحثين أنه من خلال الجمع بين هذه الآليات المتعددة التي تعمل بشكل جيد بطرق متنوعة، سيتطور تدريجياً ذكاء اصطناعي يمكنه التعامل مع اللغة الطبيعية مثل البشر. وهكذا، كانوا يعملون على إيجاد آليات جديدة يمكن أن تعمل بالاشتراك مع آليات أخرى، واكتشاف التركيبات المثلى لهذه الآليات.
ومع ذلك، قلبت المحولات هذه الحكمة التقليدية رأسًا على عقب. الرسالة التي مفادها أنه لا داعي لدمج آليات مختلفة، وأن كل ما هو مطلوب هو آلية الانتباه، معبر عنها في عنوان الورقة البحثية.
بالطبع، تتضمن المحولات نفسها آليات مختلفة، ولكن لا شك أن آلية الانتباه كانت من بينها رائدة ومميزة بشكل خاص.
نظرة عامة على آلية الانتباه
آلية الانتباه هي نظام يمكنه، أثناء عملية معالجة اللغة الطبيعية كلمة بكلمة، تعلم أي من الكلمات الكثيرة السابقة في الجملة يجب "الانتباه إليها" عند معالجة كلمة معينة.
يسمح هذا لها بفهم ما تشير إليه بدقة كلمات مثل "هذا"، "ذلك"، أو "المذكور آنفًا" (التي تشير إلى كلمات واردة في جمل سابقة)، أو عبارات مثل "الجملة الافتتاحية"، "المثال الثاني المدرج"، أو "الفقرة السابقة" (التي تشير إلى مواضع في النص).
علاوة على ذلك، يمكنها تفسير الكلمات بشكل صحيح حتى عندما تكون المحددات بعيدة داخل الجملة، وحتى عندما يصبح النص طويلاً، يمكنها التفسير دون فقدان سياق الكلمة الحالية بين الجمل الأخرى.
هذه هي فائدة "الانتباه".
على العكس من ذلك، يعني هذا أيضًا أنه عند تفسير الكلمة التي تتم معالجتها حاليًا، يتم إخفاء الكلمات غير الضرورية وإزالتها من التفسير.
من خلال الاحتفاظ بالكلمات الضرورية فقط لتفسير كلمة معينة وإزالة الكلمات غير ذات الصلة، تظل مجموعة الكلمات التي سيتم تفسيرها محدودة بعدد قليل، بغض النظر عن طول النص، مما يمنع كثافة التفسير من أن تصبح مخففة.
الذكاء الافتراضي
الآن، بتغيير الموضوع قليلاً، كنت أفكر في مفهوم الذكاء الافتراضي.
حاليًا، عند استخدام الذكاء الاصطناعي التوليدي للأعمال، إذا قمت بدمج جميع المعلومات داخل الشركة وتقديمها كمعرفة للذكاء الاصطناعي التوليدي، فإن الحجم الهائل للمعرفة يمكن أن يجعل من الصعب على الذكاء الاصطناعي التعامل معها بشكل مناسب.
لهذا السبب، من الأفضل تقسيم المعرفة حسب المهمة، وإعداد محادثات ذكاء اصطناعي لكل مهمة أو إنشاء أدوات ذكاء اصطناعي متخصصة لعمليات معينة.
هذا يعني أنه بالنسبة للمهام المعقدة، يصبح من الضروري دمج محادثات وأدوات الذكاء الاصطناعي القائمة على المعرفة المجزأة هذه.
هذا قيد حالي عند استخدام الذكاء الاصطناعي التوليدي، ولكن حتى مع الذكاء الاصطناعي التوليدي المستقبلي، بالنسبة لمهام محددة، يجب أن يؤدي التركيز فقط على المعرفة المطلوبة لتلك المهمة إلى دقة أعلى.
بدلاً من ذلك، أعتقد أن الذكاء الاصطناعي التوليدي المستقبلي سيكون قادرًا على التبديل داخليًا بين مجموعات المعرفة الضرورية اعتمادًا على الموقف، حتى بدون أن يضطر البشر إلى تقسيم المعرفة.
هذه القدرة هي الذكاء الافتراضي. إنها تشبه الجهاز الافتراضي الذي يمكنه تشغيل أنظمة تشغيل متعددة ومختلفة على جهاز كمبيوتر واحد. هذا يعني أنه ضمن ذكاء واحد، يمكن لذكاءات افتراضية متعددة ذات تخصصات مختلفة أن تعمل.
حتى الذكاء الاصطناعي التوليدي الحالي يمكنه بالفعل محاكاة مناقشات بين عدة أشخاص أو توليد قصص تضم شخصيات متعددة. لذلك، فإن الذكاء الافتراضي ليس قدرة خاصة، بل هو امتداد للذكاء الاصطناعي التوليدي الحالي.
الذكاء الافتراضي المصغر
إن آلية الذكاء الافتراضي، التي تضيّق نطاق المعرفة الضرورية وفقًا للمهمة، تؤدي شيئًا مشابهًا لآلية الانتباه.
أي أنها تشبه آلية الانتباه في أنها تركز فقط على المعرفة ذات الصلة اعتمادًا على المهمة التي تتم معالجتها حاليًا.
على العكس من ذلك، يمكن القول إن آلية الانتباه هي آلية تحقق شيئًا يشبه الذكاء الافتراضي. ومع ذلك، فإن الذكاء الافتراضي الذي أبحث فيه هو آلية تختار المعرفة ذات الصلة من مجموعة من المعارف، في حين أن آلية الانتباه تعمل على مجموعة من الكلمات.
لهذا السبب، يمكن تسمية آلية الانتباه بالذكاء الافتراضي المصغر.
آلية الانتباه الصريحة
إذا نظرنا إلى آلية الانتباه كذكاء افتراضي مصغر، فإن الذكاء الافتراضي الذي ذكرته سابقًا يمكن تحقيقه، على العكس من ذلك، من خلال بناء آلية انتباه كلية (macro).
ولا تحتاج آلية الانتباه الكلية هذه إلى إضافتها إلى البنية الداخلية لنماذج اللغة الكبيرة أو أن تتضمن تدريب شبكة عصبية.
يمكن أن تكون ببساطة جملة صريحة مكتوبة باللغة الطبيعية، مثل "عند أداء المهمة أ، ارجع إلى المعرفة ب والمعرفة ج".
هذا يوضح المعرفة اللازمة للمهمة أ. هذه الجملة نفسها هي نوع من المعرفة.
يمكن أن يطلق على هذا آلية الانتباه الصريحة. يمكن وصف هذه الجملة بأنها معرفة انتباهية، والتي تنص صراحة على المعرفة التي يجب التركيز عليها عند أداء المهمة أ.
علاوة على ذلك، يمكن للذكاء الاصطناعي التوليدي إنشاء أو تحديث معرفة الانتباه هذه.
إذا فشلت مهمة بسبب نقص المعرفة، فعلى سبيل الدرس المستفاد، يمكن تحديث معرفة الانتباه لتشمل معرفة إضافية يجب الرجوع إليها لتلك المهمة.
الخلاصة
لقد حسنت آلية الانتباه بشكل كبير من قدرات الذكاء الاصطناعي التوليدي.
لم تكن مجرد آلية عملت بشكل جيد بالصدفة؛ فكما رأينا هنا، يبدو أن آلية تضييق نطاق المعلومات التي يجب الرجوع إليها في كل موقف هي جوهر الذكاء المتقدم.
ومثل الذكاء الافتراضي والمعرفة الانتباهية الصريحة، تعد آلية الانتباه أيضًا مفتاحًا للتقدم المتكرر للذكاء على طبقات مختلفة.