ปัญญาประดิษฐ์เชิงกำเนิด (Generative AI) ในปัจจุบันเป็นเทคโนโลยี AI ที่เฟื่องฟูขึ้นมาได้ด้วยการประดิษฐ์ทรานส์ฟอร์เมอร์ส (Transformers) ซึ่งถือเป็นความก้าวหน้าครั้งสำคัญ
กลไกความใส่ใจ (Attention Mechanism) คือสิ่งที่บ่งบอกถึงลักษณะเฉพาะของทรานส์ฟอร์เมอร์สในวลีเดียว ซึ่งแสดงออกมาอย่างกระชับในชื่อบทความที่ประกาศเปิดตัวทรานส์ฟอร์เมอร์สว่า "Attention is All You Need"
สิ่งนี้มีรากฐานมาจากความจริงที่ว่านักวิจัย AI ในขณะนั้นได้พยายามและทดลองหลากหลายวิธีเพื่อทำให้ AI สามารถจัดการกับภาษามนุษย์ได้อย่างเชี่ยวชาญเหมือนมนุษย์ โดยมีการตั้งชื่อและตีพิมพ์บทความเกี่ยวกับวิธีการที่ประสบความสำเร็จต่างๆ
นักวิจัยจำนวนมากเชื่อว่าด้วยการรวมกลไกที่ทำงานได้ดีเหล่านี้เข้าด้วยกันอย่างหลากหลาย AI ที่สามารถจัดการกับภาษามนุษย์ได้เหมือนมนุษย์จะค่อยๆ ถือกำเนิดขึ้น ดังนั้นพวกเขาจึงทำงานเพื่อค้นหากลไกใหม่ๆ ที่สามารถทำงานร่วมกับกลไกอื่นๆ ได้ และค้นพบการรวมกันที่เหมาะสมที่สุดของกลไกเหล่านี้
อย่างไรก็ตาม ทรานส์ฟอร์เมอร์สได้พลิกโฉมแนวคิดดั้งเดิมนี้ ข้อความที่ว่าไม่จำเป็นต้องรวมกลไกต่างๆ เข้าด้วยกัน และสิ่งที่จำเป็นทั้งหมดคือกลไกความใส่ใจนั้นแสดงออกอยู่ในชื่อบทความ
แน่นอนว่าทรานส์ฟอร์เมอร์สเองก็รวมกลไกต่างๆ เข้าไว้ด้วยกัน แต่ก็ปฏิเสธไม่ได้เลยว่าในบรรดากลไกเหล่านั้น กลไกความใส่ใจมีความก้าวหน้าและโดดเด่นเป็นพิเศษ
ภาพรวมของกลไกความใส่ใจ
กลไกความใส่ใจคือระบบที่ในระหว่างกระบวนการประมวลผลภาษาธรรมชาติทีละคำ สามารถเรียนรู้ได้ว่าจากคำหลายคำที่อยู่ข้างหน้าในประโยคนั้น ควรจะ "ให้ความสนใจ" กับคำใดเมื่อประมวลผลคำที่กำหนด
สิ่งนี้ช่วยให้สามารถเข้าใจได้อย่างแม่นยำว่าคำต่างๆ เช่น "สิ่งนี้," "สิ่งนั้น," หรือ "ที่กล่าวมาข้างต้น" (ซึ่งอ้างถึงคำที่อยู่ในประโยคก่อนหน้า) หรือวลีต่างๆ เช่น "ประโยคเปิดเรื่อง," "ตัวอย่างที่สองที่ระบุไว้," หรือ "ย่อหน้าก่อนหน้า" (ซึ่งบ่งบอกตำแหน่งในข้อความ) กำลังอ้างถึงอะไร
ยิ่งไปกว่านั้น ยังสามารถตีความคำได้อย่างถูกต้องแม้ว่าคำขยายจะอยู่ห่างออกไปในประโยค และแม้ว่าข้อความจะยาวขึ้น ก็ยังสามารถตีความได้โดยไม่สูญเสียบริบทของคำปัจจุบันที่อยู่ท่ามกลางประโยคอื่นๆ
นี่คือประโยชน์ของ "ความใส่ใจ"
ในทางกลับกัน สิ่งนี้ยังหมายความว่าเมื่อตีความคำที่กำลังประมวลผลอยู่ คำที่ไม่จำเป็นจะถูกปิดบังและลบออกจากการตีความ
โดยการเก็บเฉพาะคำที่จำเป็นสำหรับการตีความคำที่กำหนดและลบคำที่ไม่เกี่ยวข้องออก ชุดของคำที่จะถูกตีความจะยังคงถูกจำกัดไว้ที่จำนวนน้อย ไม่ว่าข้อความจะยาวแค่ไหนก็ตาม ซึ่งช่วยป้องกันไม่ให้ความหนาแน่นของการตีความเจือจางลง
ปัญญาประดิษฐ์เสมือน
ตอนนี้ ขอเปลี่ยนเรื่องเล็กน้อย ผมกำลังคิดเกี่ยวกับแนวคิดของปัญญาประดิษฐ์เสมือน (virtual intelligence)
ปัจจุบัน เมื่อใช้ Generative AI สำหรับธุรกิจ หากคุณรวมข้อมูลทั้งหมดภายในบริษัทและให้เป็นความรู้แก่ Generative AI ปริมาณความรู้ที่มหาศาลอาจทำให้ AI จัดการข้อมูลได้อย่างเหมาะสมได้ยาก
ด้วยเหตุผลนี้ การแบ่งความรู้ตามงาน การเตรียม AI Chat สำหรับแต่ละงาน หรือการสร้างเครื่องมือ AI ที่เชี่ยวชาญสำหรับการดำเนินงานเฉพาะ จะทำงานได้ดีกว่า
นั่นหมายความว่าสำหรับงานที่ซับซ้อน จะจำเป็นต้องรวม AI Chat และเครื่องมือที่ใช้ความรู้ที่ถูกแบ่งส่วนเหล่านี้เข้าด้วยกัน
นี่คือข้อจำกัดปัจจุบันเมื่อใช้ Generative AI แต่แม้แต่กับ Generative AI ในอนาคต สำหรับงานเฉพาะ การมุ่งเน้นเฉพาะความรู้ที่จำเป็นสำหรับงานนั้นๆ ก็ควรจะให้ความแม่นยำที่สูงขึ้น
แต่ผมเชื่อว่า Generative AI ในอนาคตจะสามารถสลับชุดความรู้ที่จำเป็นภายในได้เองตามสถานการณ์ แม้ว่ามนุษย์จะไม่ต้องแบ่งส่วนความรู้ก็ตาม
ความสามารถนี้คือปัญญาประดิษฐ์เสมือน มันเหมือนกับเครื่องเสมือน (virtual machine) ที่สามารถรันระบบปฏิบัติการหลายตัวบนคอมพิวเตอร์เครื่องเดียวได้ หมายความว่าภายในปัญญาเดียว สามารถมีปัญญาเสมือนหลายตัวที่มีความเชี่ยวชาญแตกต่างกันทำงานได้
แม้แต่ Generative AI ในปัจจุบันก็สามารถจำลองการสนทนาระหว่างคนหลายคน หรือสร้างเรื่องราวที่มีตัวละครหลายตัวได้แล้ว ดังนั้นปัญญาประดิษฐ์เสมือนจึงไม่ใช่ความสามารถพิเศษ แต่เป็นการต่อยอดจาก Generative AI ในปัจจุบันนั่นเอง
ปัญญาประดิษฐ์เสมือนขนาดเล็ก
กลไกของปัญญาประดิษฐ์เสมือน ซึ่งจำกัดความรู้ที่จำเป็นตามภารกิจนั้น ทำหน้าที่คล้ายกับกลไกความใส่ใจ
กล่าวคือ คล้ายกับกลไกความใส่ใจตรงที่มุ่งเน้นเฉพาะความรู้ที่เกี่ยวข้องตามภารกิจที่กำลังประมวลผลอยู่
ในทางกลับกัน กลไกความใส่ใจอาจกล่าวได้ว่าเป็นกลไกที่ทำให้เกิดสิ่งคล้ายปัญญาประดิษฐ์เสมือน อย่างไรก็ตาม ปัญญาประดิษฐ์เสมือนที่ผมกำลังพิจารณาอยู่เป็นกลไกที่เลือกความรู้ที่เกี่ยวข้องจากชุดของความรู้ ในขณะที่กลไกความใส่ใจทำงานกับชุดของคำ
ด้วยเหตุนี้ กลไกความใส่ใจจึงสามารถเรียกว่าปัญญาประดิษฐ์เสมือนขนาดเล็กได้
กลไกความใส่ใจแบบชัดเจน
หากเรามองว่ากลไกความใส่ใจเป็นปัญญาประดิษฐ์เสมือนขนาดเล็ก ในทางกลับกัน ปัญญาประดิษฐ์เสมือนที่ผมกล่าวถึงก่อนหน้านี้สามารถเกิดขึ้นได้ด้วยการสร้างกลไกความใส่ใจแบบมหภาค
และกลไกความใส่ใจแบบมหภาคนี้ไม่จำเป็นต้องถูกเพิ่มเข้าไปในโครงสร้างภายในของแบบจำลองภาษาขนาดใหญ่ หรือเกี่ยวข้องกับการฝึกฝนโครงข่ายประสาทเทียม
มันสามารถเป็นเพียงประโยคที่ชัดเจนที่เขียนด้วยภาษาธรรมชาติ เช่น "เมื่อทำงาน A ให้ดูความรู้ B และความรู้ C"
สิ่งนี้จะช่วยให้ความรู้ที่จำเป็นสำหรับงาน A ชัดเจนขึ้น ประโยคนี้เองก็เป็นความรู้ประเภทหนึ่ง
สิ่งนี้อาจเรียกว่ากลไกความใส่ใจแบบชัดเจน ประโยคนี้สามารถอธิบายได้ว่าเป็นความรู้ความใส่ใจ (attention knowledge) ซึ่งระบุไว้อย่างชัดเจนถึงความรู้ที่ควรให้ความสนใจเมื่อทำงาน A
นอกจากนี้ ความรู้ความใส่ใจนี้สามารถถูกสร้างหรืออัปเดตโดย AI เชิงกำเนิด
หากงานล้มเหลวเนื่องจากขาดความรู้ บทเรียนที่ได้รับคือความรู้ความใส่ใจสามารถถูกอัปเดตเพื่อรวมความรู้เพิ่มเติมที่ควรใช้อ้างอิงสำหรับงานนั้นๆ
บทสรุป
กลไกความใส่ใจได้ยกระดับความสามารถของ AI เชิงกำเนิดขึ้นอย่างมาก
มันไม่ได้เป็นเพียงกลไกที่ทำงานได้ดีโดยบังเอิญเท่านั้น ดังที่เราได้เห็นในที่นี้ กลไกของการจำกัดข้อมูลที่ใช้อ้างอิงในแต่ละสถานการณ์แบบไดนามิกดูเหมือนจะเป็นแก่นแท้ของความฉลาดขั้นสูง
และเช่นเดียวกับปัญญาประดิษฐ์เสมือนและความรู้ความใส่ใจที่ชัดเจน กลไกความใส่ใจยังเป็นกุญแจสำคัญในการพัฒนาความฉลาดในระดับต่างๆ อย่างต่อเนื่องด้วย