ปัจจุบัน AI เชิงสร้างสรรค์เป็นเทคโนโลยี AI ที่เบ่งบานจากการประดิษฐ์ Transformer ซึ่งเป็นความก้าวหน้าครั้งสำคัญ
กลไกความใส่ใจ (Attention Mechanism) สามารถอธิบายได้ว่าเป็นคุณสมบัติที่โดดเด่นของ Transformer ซึ่งแสดงออกอย่างกระชับในชื่อบทความที่ประกาศเปิดตัว Transformer ว่า “Attention Is All You Need”
ภูมิหลังของเรื่องนี้คือในเวลานั้น นักวิจัย AI ได้พยายามและลองผิดลองถูกหลายครั้งเพื่อให้ AI สามารถจัดการภาษาธรรมชาติได้อย่างเชี่ยวชาญเหมือนมนุษย์ โดยตั้งชื่อวิธีการที่ประสบความสำเร็จและตีพิมพ์บทความเกี่ยวกับเรื่องเหล่านั้น
นักวิจัยหลายคนเชื่อว่าด้วยการรวมกลไกที่มีประสิทธิภาพหลายอย่างเข้าด้วยกันในวิธีที่หลากหลาย พวกเขาสามารถสร้าง AI ที่สามารถจัดการภาษาธรรมชาติได้เหมือนมนุษย์ ซึ่งพวกเขาให้ความสำคัญกับการค้นพบกลไกใหม่ๆ ที่สามารถทำงานร่วมกับกลไกอื่นๆ และการค้นหาการผสมผสานกลไกเหล่านี้ที่เหมาะสมที่สุด
อย่างไรก็ตาม Transformer ได้ล้มล้างภูมิปัญญาดั้งเดิมนี้ ข้อความที่ว่าไม่จำเป็นต้องรวมกลไกต่างๆ เข้าด้วยกัน และมีเพียงกลไกความใส่ใจเท่านั้นที่จำเป็นนั้นปรากฏชัดเจนในชื่อบทความ
แม้ว่า Transformer เองจะรวมกลไกต่างๆ ไว้มากมาย แต่ก็ไม่ต้องสงสัยเลยว่ากลไกความใส่ใจนั้นเป็นกลไกที่ก้าวล้ำและโดดเด่นเป็นพิเศษในบรรดาเหล่านั้น
ภาพรวมของกลไกความใส่ใจ
กลไกความใส่ใจเป็นระบบที่ช่วยให้ AI สามารถเรียนรู้ได้ว่าคำใดบ้างในจำนวนมากที่อยู่ในประโยคก่อนหน้า ที่ควรให้ความสนใจเมื่อประมวลผลคำเฉพาะคำหนึ่งในภาษาธรรมชาติ
สิ่งนี้ช่วยให้ AI สามารถเข้าใจได้อย่างแม่นยำว่าคำใดหมายถึงอะไร เช่น เมื่อจัดการกับคำชี้เฉพาะ เช่น "นี่", "นั่น", หรือ "ที่กล่าวมาข้างต้น" (ชี้ไปยังคำในประโยคก่อนหน้า) หรือการอ้างอิงตำแหน่ง เช่น "ประโยคเปิด", "ตัวอย่างที่สองที่กล่าวมา", หรือ "ย่อหน้าก่อนหน้า"
นอกจากนี้ ยังสามารถตีความคำขยายได้อย่างถูกต้องแม้ว่าจะอยู่ห่างกันในประโยค และแม้ในข้อความยาวๆ ก็สามารถตีความคำได้โดยไม่สูญเสียบริบทที่คำปัจจุบันอ้างถึง ซึ่งช่วยป้องกันไม่ให้ข้อความนั้นหลงหายไปในประโยคอื่นๆ
นี่คือประโยชน์ของ "ความใส่ใจ"
ในทางกลับกัน สิ่งนี้หมายความว่าเมื่อตีความคำที่กำลังประมวลผล คำที่ไม่จำเป็นจะถูกปิดบังและลบออกจากการตีความ
ด้วยการเก็บเฉพาะคำที่จำเป็นสำหรับการตีความคำที่กำหนด และลบคำที่ไม่เกี่ยวข้องออกไป ชุดของคำที่จะถูกตีความจะยังคงจำกัดอยู่เพียงไม่กี่คำ ไม่ว่าข้อความจะยาวแค่ไหนก็ตาม ซึ่งจะช่วยป้องกันไม่ให้ความหนาแน่นของการตีความลดลง
ปัญญาเสมือน
มาเปลี่ยนหัวข้อกันเล็กน้อย ผมได้พิจารณาแนวคิดเรื่องปัญญาเสมือน
ปัจจุบัน เมื่อใช้ AI เชิงสร้างสรรค์สำหรับธุรกิจ หากข้อมูลทั้งหมดภายในบริษัทถูกรวบรวมและจัดหาเป็นฐานความรู้เดียวให้กับ AI ปริมาณความรู้ที่มหาศาลอาจกลายเป็นเรื่องที่มากเกินไป นำไปสู่ปรากฏการณ์ที่ AI ไม่สามารถประมวลผลได้อย่างเหมาะสม
ด้วยเหตุผลนี้ การแยกความรู้ตามงาน จึงมีประสิทธิภาพมากกว่า โดยการเตรียม AI แชทสำหรับแต่ละงาน หรือสร้างเครื่องมือ AI ที่เชี่ยวชาญสำหรับการดำเนินงานเฉพาะ
ดังนั้น เมื่อทำงานที่ซับซ้อน จึงจำเป็นต้องรวม AI แชทหรือเครื่องมือ AI เหล่านี้เข้าด้วยกัน ซึ่งแต่ละตัวมีความรู้ที่แบ่งแยกไว้
แม้ว่าสิ่งนี้จะเป็นข้อจำกัดปัจจุบันของ AI เชิงสร้างสรรค์ แต่โดยพื้นฐานแล้ว แม้แต่กับ AI เชิงสร้างสรรค์ในอนาคต การมุ่งเน้นไปที่ความรู้ที่จำเป็นสำหรับงานเฉพาะเท่านั้นก็ควรนำไปสู่ความแม่นยำที่สูงขึ้น
แต่ผมเชื่อว่า AI เชิงสร้างสรรค์ในอนาคตจะสามารถแยกแยะและใช้ความรู้ที่จำเป็นภายในองค์กรได้ตามสถานการณ์ แม้ว่ามนุษย์จะไม่ต้องแบ่งแยกความรู้นั้นก็ตาม
ความสามารถนี้คือปัญญาเสมือน มันเหมือนกับเครื่องเสมือนที่สามารถรันระบบปฏิบัติการที่แตกต่างกันหลายระบบบนคอมพิวเตอร์เครื่องเดียว หมายความว่าภายในปัญญาเดียว ปัญญาเสมือนหลายตัวที่มีความเชี่ยวชาญแตกต่างกันสามารถทำงานได้
แม้แต่ AI เชิงสร้างสรรค์ในปัจจุบันก็ยังสามารถจำลองการสนทนาระหว่างคนหลายคน หรือสร้างเรื่องราวที่มีตัวละครหลายตัวได้ ดังนั้น ปัญญาเสมือนจึงไม่ใช่ความสามารถพิเศษ แต่เป็นส่วนขยายของ AI เชิงสร้างสรรค์ในปัจจุบัน
ปัญญาเสมือนไมโคร
กลไกของปัญญาเสมือนที่ช่วยจำกัดความรู้ที่จำเป็นตามภารกิจนั้นทำงานคล้ายกับกลไกความใส่ใจ
กล่าวอีกนัยหนึ่งคือ มันคล้ายคลึงกับกลไกความใส่ใจตรงที่มันมุ่งเน้นและประมวลผลเฉพาะความรู้ที่เกี่ยวข้องตามภารกิจที่กำลังดำเนินอยู่
ในทางกลับกัน กลไกความใส่ใจอาจกล่าวได้ว่าเป็นกลไกที่ทำให้เกิดสิ่งคล้ายกับปัญญาเสมือน อย่างไรก็ตาม ในขณะที่ปัญญาเสมือนที่ผมจินตนาการไว้เลือกความรู้ที่เกี่ยวข้องจากชุดความรู้ กลไกความใส่ใจจะทำงานในหน่วยของชุดคำศัพท์
ด้วยเหตุผลนี้ กลไกความใส่ใจจึงสามารถเรียกว่าปัญญาเสมือนไมโครได้
กลไกความใส่ใจแบบชัดแจ้ง
หากเรามองกลไกความใส่ใจเป็นปัญญาเสมือนไมโคร ในทางกลับกัน ปัญญาเสมือนที่ผมกล่าวถึงก่อนหน้านี้ก็สามารถทำได้โดยการสร้างกลไกความใส่ใจแบบมหภาค
และกลไกความใส่ใจแบบมหภาคนี้ไม่จำเป็นต้องเพิ่มเข้าไปในโครงสร้างภายในของแบบจำลองภาษาขนาดใหญ่ หรือเกี่ยวข้องกับการเรียนรู้ของโครงข่ายประสาทเทียม
มันสามารถเป็นเพียงข้อความที่ระบุไว้อย่างชัดแจ้งซึ่งเขียนด้วยภาษาธรรมชาติ เช่น: "เมื่อดำเนินการงาน A ให้ดูที่ความรู้ B และความรู้ C"
สิ่งนี้จะทำให้ความรู้ที่จำเป็นสำหรับงาน A ชัดเจนขึ้น ข้อความนี้เป็นความรู้ประเภทหนึ่ง
สิ่งนี้สามารถเรียกว่ากลไกความใส่ใจแบบชัดแจ้งได้ ข้อความนี้สามารถถือเป็นความรู้ที่ต้องใส่ใจ ซึ่งระบุความรู้ที่ควรให้ความสำคัญเมื่อดำเนินการงาน A อย่างชัดแจ้ง
นอกจากนี้ ความรู้ที่ต้องใส่ใจนี้ยังสามารถสร้างหรืออัปเดตได้โดย AI เชิงสร้างสรรค์
หากงานล้มเหลวเนื่องจากขาดความรู้ ความรู้ที่ต้องใส่ใจสามารถอัปเดตเพื่อรวมความรู้เพิ่มเติมเป็นข้อมูลอ้างอิงสำหรับงานนั้น โดยอิงจากการสะท้อนนี้
บทสรุป
กลไกความใส่ใจได้ยกระดับความสามารถของ AI เชิงสร้างสรรค์อย่างมาก
มันไม่ใช่เพียงแค่กลไกที่บังเอิญทำงานได้ดีเท่านั้น แต่ดังที่เราได้เห็นมาแล้ว กลไกของการจำกัดข้อมูลที่จะอ้างอิงสำหรับแต่ละสถานการณ์แบบไดนามิกนั้นดูเหมือนจะเป็นแก่นแท้ของปัญญาขั้นสูง
และเช่นเดียวกับปัญญาเสมือนและความรู้ที่ต้องใส่ใจแบบชัดแจ้ง กลไกความใส่ใจยังเป็นกุญแจสำคัญในการเสริมสร้างปัญญาซ้ำๆ ในหลายระดับอีกด้วย