ข้ามไปยังเนื้อหา
บทความนี้ได้รับการแปลจากภาษาญี่ปุ่นโดยใช้ AI
อ่านฉบับภาษาญี่ปุ่น
บทความนี้อยู่ในสาธารณสมบัติ (CC0) โปรดใช้งานได้อย่างอิสระ CC0 1.0 Universal

กลไกความใส่ใจในฐานะปัญญาเสมือนไมโคร

ปัจจุบัน AI เชิงสร้างสรรค์เป็นเทคโนโลยี AI ที่เบ่งบานจากการประดิษฐ์ Transformer ซึ่งเป็นความก้าวหน้าครั้งสำคัญ

กลไกความใส่ใจ (Attention Mechanism) สามารถอธิบายได้ว่าเป็นคุณสมบัติที่โดดเด่นของ Transformer ซึ่งแสดงออกอย่างกระชับในชื่อบทความที่ประกาศเปิดตัว Transformer ว่า “Attention Is All You Need”

ภูมิหลังของเรื่องนี้คือในเวลานั้น นักวิจัย AI ได้พยายามและลองผิดลองถูกหลายครั้งเพื่อให้ AI สามารถจัดการภาษาธรรมชาติได้อย่างเชี่ยวชาญเหมือนมนุษย์ โดยตั้งชื่อวิธีการที่ประสบความสำเร็จและตีพิมพ์บทความเกี่ยวกับเรื่องเหล่านั้น

นักวิจัยหลายคนเชื่อว่าด้วยการรวมกลไกที่มีประสิทธิภาพหลายอย่างเข้าด้วยกันในวิธีที่หลากหลาย พวกเขาสามารถสร้าง AI ที่สามารถจัดการภาษาธรรมชาติได้เหมือนมนุษย์ ซึ่งพวกเขาให้ความสำคัญกับการค้นพบกลไกใหม่ๆ ที่สามารถทำงานร่วมกับกลไกอื่นๆ และการค้นหาการผสมผสานกลไกเหล่านี้ที่เหมาะสมที่สุด

อย่างไรก็ตาม Transformer ได้ล้มล้างภูมิปัญญาดั้งเดิมนี้ ข้อความที่ว่าไม่จำเป็นต้องรวมกลไกต่างๆ เข้าด้วยกัน และมีเพียงกลไกความใส่ใจเท่านั้นที่จำเป็นนั้นปรากฏชัดเจนในชื่อบทความ

แม้ว่า Transformer เองจะรวมกลไกต่างๆ ไว้มากมาย แต่ก็ไม่ต้องสงสัยเลยว่ากลไกความใส่ใจนั้นเป็นกลไกที่ก้าวล้ำและโดดเด่นเป็นพิเศษในบรรดาเหล่านั้น

ภาพรวมของกลไกความใส่ใจ

กลไกความใส่ใจเป็นระบบที่ช่วยให้ AI สามารถเรียนรู้ได้ว่าคำใดบ้างในจำนวนมากที่อยู่ในประโยคก่อนหน้า ที่ควรให้ความสนใจเมื่อประมวลผลคำเฉพาะคำหนึ่งในภาษาธรรมชาติ

สิ่งนี้ช่วยให้ AI สามารถเข้าใจได้อย่างแม่นยำว่าคำใดหมายถึงอะไร เช่น เมื่อจัดการกับคำชี้เฉพาะ เช่น "นี่", "นั่น", หรือ "ที่กล่าวมาข้างต้น" (ชี้ไปยังคำในประโยคก่อนหน้า) หรือการอ้างอิงตำแหน่ง เช่น "ประโยคเปิด", "ตัวอย่างที่สองที่กล่าวมา", หรือ "ย่อหน้าก่อนหน้า"

นอกจากนี้ ยังสามารถตีความคำขยายได้อย่างถูกต้องแม้ว่าจะอยู่ห่างกันในประโยค และแม้ในข้อความยาวๆ ก็สามารถตีความคำได้โดยไม่สูญเสียบริบทที่คำปัจจุบันอ้างถึง ซึ่งช่วยป้องกันไม่ให้ข้อความนั้นหลงหายไปในประโยคอื่นๆ

นี่คือประโยชน์ของ "ความใส่ใจ"

ในทางกลับกัน สิ่งนี้หมายความว่าเมื่อตีความคำที่กำลังประมวลผล คำที่ไม่จำเป็นจะถูกปิดบังและลบออกจากการตีความ

ด้วยการเก็บเฉพาะคำที่จำเป็นสำหรับการตีความคำที่กำหนด และลบคำที่ไม่เกี่ยวข้องออกไป ชุดของคำที่จะถูกตีความจะยังคงจำกัดอยู่เพียงไม่กี่คำ ไม่ว่าข้อความจะยาวแค่ไหนก็ตาม ซึ่งจะช่วยป้องกันไม่ให้ความหนาแน่นของการตีความลดลง

ปัญญาเสมือน

มาเปลี่ยนหัวข้อกันเล็กน้อย ผมได้พิจารณาแนวคิดเรื่องปัญญาเสมือน

ปัจจุบัน เมื่อใช้ AI เชิงสร้างสรรค์สำหรับธุรกิจ หากข้อมูลทั้งหมดภายในบริษัทถูกรวบรวมและจัดหาเป็นฐานความรู้เดียวให้กับ AI ปริมาณความรู้ที่มหาศาลอาจกลายเป็นเรื่องที่มากเกินไป นำไปสู่ปรากฏการณ์ที่ AI ไม่สามารถประมวลผลได้อย่างเหมาะสม

ด้วยเหตุผลนี้ การแยกความรู้ตามงาน จึงมีประสิทธิภาพมากกว่า โดยการเตรียม AI แชทสำหรับแต่ละงาน หรือสร้างเครื่องมือ AI ที่เชี่ยวชาญสำหรับการดำเนินงานเฉพาะ

ดังนั้น เมื่อทำงานที่ซับซ้อน จึงจำเป็นต้องรวม AI แชทหรือเครื่องมือ AI เหล่านี้เข้าด้วยกัน ซึ่งแต่ละตัวมีความรู้ที่แบ่งแยกไว้

แม้ว่าสิ่งนี้จะเป็นข้อจำกัดปัจจุบันของ AI เชิงสร้างสรรค์ แต่โดยพื้นฐานแล้ว แม้แต่กับ AI เชิงสร้างสรรค์ในอนาคต การมุ่งเน้นไปที่ความรู้ที่จำเป็นสำหรับงานเฉพาะเท่านั้นก็ควรนำไปสู่ความแม่นยำที่สูงขึ้น

แต่ผมเชื่อว่า AI เชิงสร้างสรรค์ในอนาคตจะสามารถแยกแยะและใช้ความรู้ที่จำเป็นภายในองค์กรได้ตามสถานการณ์ แม้ว่ามนุษย์จะไม่ต้องแบ่งแยกความรู้นั้นก็ตาม

ความสามารถนี้คือปัญญาเสมือน มันเหมือนกับเครื่องเสมือนที่สามารถรันระบบปฏิบัติการที่แตกต่างกันหลายระบบบนคอมพิวเตอร์เครื่องเดียว หมายความว่าภายในปัญญาเดียว ปัญญาเสมือนหลายตัวที่มีความเชี่ยวชาญแตกต่างกันสามารถทำงานได้

แม้แต่ AI เชิงสร้างสรรค์ในปัจจุบันก็ยังสามารถจำลองการสนทนาระหว่างคนหลายคน หรือสร้างเรื่องราวที่มีตัวละครหลายตัวได้ ดังนั้น ปัญญาเสมือนจึงไม่ใช่ความสามารถพิเศษ แต่เป็นส่วนขยายของ AI เชิงสร้างสรรค์ในปัจจุบัน

ปัญญาเสมือนไมโคร

กลไกของปัญญาเสมือนที่ช่วยจำกัดความรู้ที่จำเป็นตามภารกิจนั้นทำงานคล้ายกับกลไกความใส่ใจ

กล่าวอีกนัยหนึ่งคือ มันคล้ายคลึงกับกลไกความใส่ใจตรงที่มันมุ่งเน้นและประมวลผลเฉพาะความรู้ที่เกี่ยวข้องตามภารกิจที่กำลังดำเนินอยู่

ในทางกลับกัน กลไกความใส่ใจอาจกล่าวได้ว่าเป็นกลไกที่ทำให้เกิดสิ่งคล้ายกับปัญญาเสมือน อย่างไรก็ตาม ในขณะที่ปัญญาเสมือนที่ผมจินตนาการไว้เลือกความรู้ที่เกี่ยวข้องจากชุดความรู้ กลไกความใส่ใจจะทำงานในหน่วยของชุดคำศัพท์

ด้วยเหตุผลนี้ กลไกความใส่ใจจึงสามารถเรียกว่าปัญญาเสมือนไมโครได้

กลไกความใส่ใจแบบชัดแจ้ง

หากเรามองกลไกความใส่ใจเป็นปัญญาเสมือนไมโคร ในทางกลับกัน ปัญญาเสมือนที่ผมกล่าวถึงก่อนหน้านี้ก็สามารถทำได้โดยการสร้างกลไกความใส่ใจแบบมหภาค

และกลไกความใส่ใจแบบมหภาคนี้ไม่จำเป็นต้องเพิ่มเข้าไปในโครงสร้างภายในของแบบจำลองภาษาขนาดใหญ่ หรือเกี่ยวข้องกับการเรียนรู้ของโครงข่ายประสาทเทียม

มันสามารถเป็นเพียงข้อความที่ระบุไว้อย่างชัดแจ้งซึ่งเขียนด้วยภาษาธรรมชาติ เช่น: "เมื่อดำเนินการงาน A ให้ดูที่ความรู้ B และความรู้ C"

สิ่งนี้จะทำให้ความรู้ที่จำเป็นสำหรับงาน A ชัดเจนขึ้น ข้อความนี้เป็นความรู้ประเภทหนึ่ง

สิ่งนี้สามารถเรียกว่ากลไกความใส่ใจแบบชัดแจ้งได้ ข้อความนี้สามารถถือเป็นความรู้ที่ต้องใส่ใจ ซึ่งระบุความรู้ที่ควรให้ความสำคัญเมื่อดำเนินการงาน A อย่างชัดแจ้ง

นอกจากนี้ ความรู้ที่ต้องใส่ใจนี้ยังสามารถสร้างหรืออัปเดตได้โดย AI เชิงสร้างสรรค์

หากงานล้มเหลวเนื่องจากขาดความรู้ ความรู้ที่ต้องใส่ใจสามารถอัปเดตเพื่อรวมความรู้เพิ่มเติมเป็นข้อมูลอ้างอิงสำหรับงานนั้น โดยอิงจากการสะท้อนนี้

บทสรุป

กลไกความใส่ใจได้ยกระดับความสามารถของ AI เชิงสร้างสรรค์อย่างมาก

มันไม่ใช่เพียงแค่กลไกที่บังเอิญทำงานได้ดีเท่านั้น แต่ดังที่เราได้เห็นมาแล้ว กลไกของการจำกัดข้อมูลที่จะอ้างอิงสำหรับแต่ละสถานการณ์แบบไดนามิกนั้นดูเหมือนจะเป็นแก่นแท้ของปัญญาขั้นสูง

และเช่นเดียวกับปัญญาเสมือนและความรู้ที่ต้องใส่ใจแบบชัดแจ้ง กลไกความใส่ใจยังเป็นกุญแจสำคัญในการเสริมสร้างปัญญาซ้ำๆ ในหลายระดับอีกด้วย