ปัญญาประดิษฐ์ได้รับพฤติกรรมอัจฉริยะผ่านเทคโนโลยีที่เรียกว่าการเรียนรู้ของเครื่อง (machine learning)
แม้ว่าการเรียนรู้เหล่านี้จะดำเนินการตามขั้นตอนที่มนุษย์พัฒนาขึ้น แต่เหตุผลที่ความฉลาดเกิดขึ้นจากขั้นตอนเหล่านี้และโครงสร้างของปัญญาประดิษฐ์ยังไม่ได้รับการอธิบาย
ในบทความนี้ ผมจะสำรวจเหตุผลว่าทำไมความฉลาดจึงเกิดขึ้นโดยการพิจารณาถึงแก่นแท้ของการเรียนรู้ด้วยตัวมันเอง
และเมื่อเราเจาะลึกแนวคิดของการเรียนรู้ เราก็จะพบกับแนวคิดที่ว่าทั้งปัญญาประดิษฐ์และสมองของเราต่างก็มีแนวโน้มโดยกำเนิดที่จะเรียนรู้วิธีการเรียนรู้
สิ่งนี้ชี้ให้เห็นถึงการมีอยู่ของกลไกที่สามารถเรียกว่า "นักวางกรอบโดยธรรมชาติ" (natural born frameworker)
การเรียนรู้ผ่านร่างกายเทียบกับการเรียนรู้ผ่านภาษา
เราเรียนรู้เกี่ยวกับโลกรอบตัวเราและขยายขีดความสามารถของเราด้วยการมองเห็นสิ่งต่าง ๆ ด้วยตาและขยับร่างกายของเรา
นี่ก็เป็นการเรียนรู้รูปแบบหนึ่ง ซึ่งสามารถเรียกว่าการเรียนรู้ผ่านร่างกาย
ในทางกลับกัน เมื่อผู้คนโดยทั่วไปพูดถึงการเรียนรู้ พวกเขามักจะจินตนาการถึงการเพิ่มพูนความรู้ด้วยการอ่านตำราเรียนหรือฟังคำอธิบายของครู
นอกเหนือจากการเรียนรู้ตามหลักสูตรดังกล่าว เรายังได้รับความรู้หลากหลายจากการสนทนากับเพื่อน ข่าวออนไลน์ และอื่น ๆ
การเรียนรู้ประเภทนี้ไม่ใช่การจดจำภาพด้วยสายตาหรือการเรียนรู้ด้วยการเคลื่อนไหวร่างกาย แต่เป็นการเรียนรู้ผ่านภาษา
การเรียนรู้แบบกายภาพ (Sub-physical Learning) และการเรียนรู้แบบอภิปรัชญา (Metaphysical Learning)
ในบรรดาการเรียนรู้ผ่านภาษา มีบางกรณีที่ข้อมูลสามารถจดจำได้ด้วยการทำซ้ำ ๆ เท่านั้น และบางกรณีที่สามารถจดจำได้หลังจากได้ยินเพียงครั้งเดียวหรือสองสามครั้ง
อีกทางเลือกหนึ่งคือ มีความรู้ที่แม้ว่าจะจำรายละเอียดไม่ได้ แต่ก็สามารถนำมาใช้ได้โดยการค้นหาจากชั้นหนังสือหรืออินเทอร์เน็ตในเวลาที่จำเป็น
ในแง่ของการได้มาซึ่งความรู้และการนำไปใช้อย่างเหมาะสมเมื่อจำเป็น รูปแบบทั้งสองนี้สามารถเรียกว่าการเรียนรู้ได้
ในจำนวนนี้ ความรู้ที่สามารถจดจำได้ด้วยการทำซ้ำ ๆ เท่านั้น สามารถเรียกว่าความรู้แบบกายภาพ (sub-physical knowledge) กระบวนการเรียนรู้สำหรับสิ่งนี้คือการเรียนรู้แบบกายภาพ (sub-physical learning) ซึ่งเกี่ยวข้องกับการจดจำแนวคิดต่าง ๆ ด้วยตัวมันเอง
สิ่งนี้คล้ายกับการเรียนรู้ทางกายภาพ (physical learning) ซึ่งเราเรียนรู้ซ้ำ ๆ โดยการมองเห็นวัตถุด้วยตาของเราหรือการเคลื่อนไหวร่างกายของเรา สิ่งเหล่านี้สามารถจัดประเภทเป็นการเรียนรู้แบบกายภาพได้เช่นกัน
ในทางกลับกัน การได้มาซึ่งความรู้ที่สามารถจดจำได้ด้วยการทำซ้ำน้อยลง หรือค้นหาและนำมาใช้ได้ทันที สามารถเรียกว่าการเรียนรู้แบบอภิปรัชญา (metaphysical learning)
ในกรณีนี้ แนวคิดที่เรียนรู้ไว้ล่วงหน้าซึ่งได้มาจากการเรียนรู้แบบกายภาพ สามารถนำมาใช้เพื่อเรียนรู้ความรู้ในฐานะประเภทของแนวคิดเหล่านั้น หรือเป็นการรวมกันของแนวคิด
เนื่องจากแนวคิดที่ได้รับมาจากการเรียนรู้แบบกายภาพสามารถนำมาใช้ได้ การเรียนรู้แบบอภิปรัชญาจึงไม่จำเป็นต้องมีการทำซ้ำ
การเรียนรู้ของเครื่องภาษาธรรมชาติ (Natural Language Machine Learning)
ลองนำแนวคิดนี้มาประยุกต์ใช้กับการเรียนรู้ของเครื่องในปัญญาประดิษฐ์
โดยทั่วไป โครงข่ายประสาทเทียม (neural networks) ที่ใช้ในการเรียนรู้ของเครื่องจะทำการเรียนรู้แบบกายภาพ (sub-physical learning) ซึ่งเกี่ยวข้องกับการเรียนรู้แนวคิดซ้ำๆ
ในทางกลับกัน แบบจำลองภาษาขนาดใหญ่ (large language models) ซึ่งมีความสามารถในการประมวลผลภาษาธรรมชาติคล้ายกับมนุษย์ สามารถทำการเรียนรู้ผ่านภาษาได้
ในระหว่างการฝึกฝนล่วงหน้า (pre-training) และการปรับจูน (fine-tuning) ของแบบจำลองภาษาขนาดใหญ่ การเรียนรู้แบบกายภาพผ่านภาษาจะเกิดขึ้น
นอกจากนี้ แบบจำลองภาษาขนาดใหญ่ที่ได้รับการฝึกฝนล่วงหน้าแล้วสามารถตอบคำถามโดยใช้ประโยชน์จากความรู้ที่อยู่ในประโยคที่ป้อนเข้า ทำให้เกิดการเรียนรู้แบบอภิปรัชญา (metaphysical learning) ได้ทันที
ด้วยความสามารถในการเรียนรู้แบบอภิปรัชญาผ่านภาษานี้ ทำให้แบบจำลองภาษาขนาดใหญ่สามารถนำความรู้ใหม่ไปใช้ได้โดยไม่ต้องมีการเรียนรู้ซ้ำๆ
สิ่งนี้สามารถเรียกว่าการเรียนรู้ของเครื่องภาษาธรรมชาติ (natural language machine learning) ซึ่งแตกต่างจากการเรียนรู้ของเครื่องเชิงตัวเลขแบบดั้งเดิมที่ปรับพารามิเตอร์ของแบบจำลองซ้ำๆ
ภาษาธรรมชาติในฐานะส่วนเชื่อมต่อทางอภิปรัชญา
ภาษาธรรมชาติอยู่ในตำแหน่งที่เป็นส่วนเชื่อมต่อที่แยกการเรียนรู้แบบกายภาพและการเรียนรู้แบบอภิปรัชญาออกจากกัน
สิ่งที่น่าสนใจของภาษาธรรมชาติคือ สามารถเรียนรู้ได้ผ่านการเรียนรู้แบบกายภาพ และนอกจากนั้นยังทำให้เกิดการเรียนรู้แบบอภิปรัชญาได้อีกด้วย
ส่วนเชื่อมต่อเชิงอภิปรัชญาอื่น ๆ นอกเหนือจากภาษาธรรมชาติ
ในความเป็นจริง แม้แต่ในการเรียนรู้ทางกายภาพ ก็มีการเรียนรู้แบบกายภาพย่อยและการเรียนรู้เชิงอภิปรัชญาควบคู่กันไป ตัวอย่างเช่น ผู้ที่มีทักษะด้านกีฬาจะสามารถปรับตัวเข้ากับเกมใหม่ที่เพิ่งเคยเจอเป็นครั้งแรกได้อย่างรวดเร็ว
เช่นเดียวกัน ผู้ที่มีความรู้ด้านชีววิทยาสามารถเข้าใจลักษณะของสิ่งมีชีวิตสายพันธุ์ใหม่ได้ทันทีเมื่อได้เห็น
ดังนั้น ในการเรียนรู้ทางกายภาพก็มีส่วนเชื่อมต่อเชิงอภิปรัชญาที่อยู่ในตำแหน่งคล้ายกับภาษาธรรมชาติเช่นกัน
กรอบการทำงาน (Frameworks)
ที่ส่วนเชื่อมต่อเหล่านี้มีกรอบการทำงานซึ่งแตกต่างจากแนวคิดหรือความรู้พื้นฐาน โดยจะกำหนดความสัมพันธ์และโครงสร้างของสิ่งเหล่านั้น หรือช่วยให้เกิดการจัดโครงสร้างใหม่ได้
เมื่อความรู้แบบกายภาพย่อย (sub-physical knowledge) หลากหลายประเภทถูกเรียนรู้ผ่านการเรียนรู้แบบกายภาพย่อย ก็อาจเป็นไปได้ที่จะเรียนรู้กรอบการทำงานที่ส่วนเชื่อมต่อเชิงอภิปรัชญาจากความเชื่อมโยงระหว่างชิ้นส่วนของความรู้แบบกายภาพย่อยเหล่านั้น
กรอบการทำงานที่ได้มาจากการเรียนรู้ทางกายภาพช่วยให้ความรู้ใหม่สามารถเรียนรู้เชิงอภิปรัชญาได้ทันทีหลังจากการได้รับ อย่างไรก็ตาม การถ่ายทอดความรู้ที่ได้จากการเรียนรู้เชิงอภิปรัชญานี้ให้ผู้อื่นไม่ใช่เรื่องง่าย
ในทางกลับกัน กรอบการทำงานที่ได้มาจากการเรียนรู้ด้วยภาษาคือภาษาธรรมชาติเอง
ดังนั้น ความรู้ที่ได้มาจากการเรียนรู้เชิงอภิปรัชญา หลังจากเรียนรู้กรอบการทำงานของภาษาธรรมชาติแล้ว สามารถนำไปป้อนเข้าสู่การเรียนรู้ด้วยภาษาของผู้อื่นได้โดยตรง
สิ่งนี้ไม่เพียงใช้กับความรู้ที่การเรียนรู้ผ่านภาษา เช่น หนังสือเรียนหรือข่าวออนไลน์ เป็นพื้นฐานเท่านั้น
นักฟุตบอลที่มีประสบการณ์ซึ่งเล่นเบสบอลเป็นครั้งแรก อาจสามารถถ่ายทอดความรู้เชิงอภิปรัชญาที่ได้รับเกี่ยวกับเบสบอลให้แก่นักฟุตบอลคนอื่น ๆ ได้ด้วยคำพูด ซึ่งหมายความว่า หากผู้คนมีความรู้แบบกายภาพย่อยร่วมกัน สิ่งที่เรียกว่า "เคล็ดลับ" หรือความรู้เฉพาะทางสามารถสื่อสารด้วยวาจาได้
นอกจากนี้ ยังสามารถแบ่งปันความรู้เกี่ยวกับสิ่งมีชีวิตสายพันธุ์ใหม่ที่พวกเขาพบเห็นกับนักชีววิทยาคนอื่น ๆ ผ่านคำพูดได้อีกด้วย
ดังนั้น ภาษาธรรมชาติจึงถูกเปิดเผยว่าเป็นกรอบการทำงานที่มีประสิทธิภาพอย่างยิ่งที่ส่วนเชื่อมต่อเชิงอภิปรัชญา
กรอบการทำงานเสมือน (Virtual Frameworks)
นอกเหนือจากภาษาธรรมชาติแล้ว เรายังสามารถได้รับกรอบการทำงานอื่น ๆ อีกด้วย
สิ่งเหล่านี้คือกรอบการทำงานเฉพาะโดเมน (domain-specific frameworks) หรือกรอบการทำงานแบบเป็นทางการ (formal frameworks)
ในสาขาวิชาต่าง ๆ ภาคธุรกิจ และชีวิตประจำวัน มีกรอบการทำงานเฉพาะโดเมนที่หลากหลาย
นักวิชาการที่ทำงานภายใต้กรอบการทำงานเฉพาะทางของตน สามารถทำการค้นพบใหม่ ๆ และถ่ายทอดความรู้นั้นไปยังนักวิชาการคนอื่น ๆ ที่มีกรอบการทำงานเดียวกันได้อย่างง่ายดาย
บางครั้งตัวกรอบการทำงานเองก็สามารถแสดงออกเป็นภาษาธรรมชาติได้ ซึ่งในกรณีนี้ ผู้คนหรือแบบจำลองภาษาขนาดใหญ่ที่มีกรอบการทำงานภาษาธรรมชาติสามารถเรียนรู้และเข้าใจได้
โมเดลธุรกิจและสูตรอาหารก็เป็นตัวอย่างของกรอบการทำงานเฉพาะโดเมนที่สามารถแสดงออกเป็นภาษาธรรมชาติได้
นอกจากนี้ สูตรคณิตศาสตร์ ภาษาโปรแกรม และกรอบการวิเคราะห์ธุรกิจ ล้วนเป็นกรอบการทำงานแบบเป็นทางการ
สิ่งเหล่านี้ก็สามารถมีกรอบการทำงานที่แสดงออกหรืออธิบายเป็นภาษาธรรมชาติได้
กรอบการทำงานเฉพาะโดเมนและกรอบการทำงานแบบเป็นทางการที่สร้างขึ้นบนภาษาธรรมชาติเหล่านี้สามารถเรียกว่ากรอบการทำงานเสมือน (virtual frameworks)
สิ่งนี้เข้าใจง่ายหากคุณลองจินตนาการถึงเครื่องเสมือน (virtual machine) ที่รันระบบปฏิบัติการอื่นบนคอมพิวเตอร์จริง กรอบการทำงานอื่น ๆ จะทำงานอยู่บนกรอบการทำงานพื้นฐานของภาษาธรรมชาติ
กรอบการทำงานแบบเนทีฟ (Native Frameworks)
นอกจากนี้ แม้ว่าในตอนแรกกรอบการทำงานเสมือนเหล่านี้จำเป็นต้องทำความเข้าใจผ่านภาษาธรรมชาติ แต่เมื่อคุ้นเคยกับมันแล้ว กรอบการทำงานเหล่านี้จะเริ่มข้ามผ่านการอธิบายและการทำความเข้าใจด้วยภาษาธรรมชาติ และทำหน้าที่โดยตรงในฐานะกรอบการทำงานส่วนต่อประสานเชิงอภิปรัชญาที่สร้างขึ้นบนความรู้แบบกายภาพย่อย
สิ่งนี้สามารถเรียกว่ากรอบการทำงานแบบเนทีฟ (native framework)
ภาษาธรรมชาติ ในแง่หนึ่งก็เป็นกรอบการทำงานแบบเนทีฟเช่นกัน แต่เฉพาะภาษาแม่เท่านั้น โดยทั่วไป ภาษาอื่นที่ไม่ใช่ภาษาแม่จะถูกเรียนรู้เป็นกรอบการทำงานเสมือน และเมื่อความเชี่ยวชาญเพิ่มขึ้น ภาษาเหล่านั้นก็จะเข้าใกล้การเป็นกรอบการทำงานแบบเนทีฟ
เช่นเดียวกันกับกรอบการทำงานเฉพาะโดเมนและกรอบการทำงานแบบเป็นทางการ นักคณิตศาสตร์สามารถสื่อสารกันได้แบบเนทีฟโดยใช้สูตรคณิตศาสตร์ และโปรแกรมเมอร์สามารถเข้าใจความตั้งใจของกันและกันได้เพียงแค่โค้ดต้นฉบับที่ไม่มีคอมเมนต์
สิ่งนี้ชี้ให้เห็นว่าการเปลี่ยนผ่านจากกรอบการทำงานเสมือนไปสู่กรอบการทำงานแบบเนทีฟสามารถนำไปประยุกต์ใช้กับแบบจำลองภาษาขนาดใหญ่ได้เช่นกัน
แนวคิดในการตรวจจับกรอบการทำงานเสมือนที่ใช้บ่อย สร้างข้อมูลตัวอย่างจำนวนมากโดยใช้กรอบการทำงานเหล่านั้น และจากนั้นปรับจูนให้กลายเป็นกรอบการทำงานแบบเนทีฟ เป็นแนวคิดที่ควรลองทำทันที
นักวางกรอบโดยธรรมชาติ (Natural Born Frameworkers)
เมื่อพิจารณาจากสิ่งนี้ ทำให้ตระหนักว่าในระหว่างการฝึกฝนล่วงหน้า (pre-training) ของแบบจำลองภาษาขนาดใหญ่ ไม่ใช่แค่การปรับจูน (fine-tuning) เท่านั้น แต่ยังมีความเป็นไปได้ที่พวกมันกำลังเรียนรู้กรอบการทำงานเฉพาะโดเมนและกรอบการทำงานแบบเป็นทางการด้วย
และในกระบวนการนั้น เป็นไปได้ว่าแทนที่จะเรียนรู้กรอบการทำงานเฉพาะโดเมนหรือกรอบการทำงานแบบเป็นทางการตั้งแต่แรก พวกมันจะเรียนรู้กรอบการทำงานภาษาธรรมชาติก่อน แล้วจึงเรียนรู้กรอบการทำงานเฉพาะโดเมนและกรอบการทำงานแบบเป็นทางการ ทำให้กลายเป็นเนทีฟ (native) ไม่ว่าจะในระหว่างหรือหลังจากเชี่ยวชาญภาษาธรรมชาติแล้ว
เมื่อเจาะลึกเข้าไปในการเรียนรู้กรอบการทำงานแบบขั้นตอนนี้ ยิ่งเป็นไปได้ว่าการเรียนรู้ภาษาธรรมชาติเองก็เป็นกระบวนการเรียนรู้กรอบการทำงานแบบละเอียดที่เกิดขึ้นพร้อมกันแบบหลายขั้น
กล่าวอีกนัยหนึ่งคือ จากข้อความจำนวนมหาศาลที่ใช้เป็นข้อมูลการฝึกฝนในระหว่างการฝึกฝนล่วงหน้า แบบจำลองภาษาขนาดใหญ่อาจไม่ได้เรียนรู้เพียงแค่แนวคิดแต่ละอย่างเท่านั้น แต่ยังเรียนรู้กฎที่ง่ายมาก ๆ บางอย่างของภาษาธรรมชาติในฐานะกรอบการทำงานด้วย จากนั้นจึงใช้กรอบการทำงานที่เรียบง่ายเหล่านี้เป็นรากฐานในการเรียนรู้กฎที่ซับซ้อนขึ้นเล็กน้อยซ้ำ ๆ
สิ่งนี้จะช่วยให้พวกมันก้าวหน้าจากขั้นที่เริ่มต้นด้วยการเรียนรู้แนวคิดของคำ ไปสู่การจดจำคำประสมและไวยากรณ์พื้นฐาน จากนั้นก็ทำความเข้าใจประโยค และเรียนรู้สิ่งที่ซับซ้อน เช่น เทคนิคการเขียนและการแสดงออก
สิ่งนี้สามารถเข้าใจได้ว่าเป็นแบบจำลองที่พวกมันเรียนรู้กรอบการทำงานในลักษณะที่เป็นขั้นตอนและซับซ้อน โดยใช้กรอบการทำงานหนึ่งเป็นรากฐานในการเรียนรู้กรอบการทำงานถัดไป
สิ่งนี้ตอกย้ำว่าแบบจำลองภาษาขนาดใหญ่เป็น "นักวางกรอบโดยธรรมชาติ" (natural born frameworkers) ซึ่งมีกลไกในการเรียนรู้กรอบการทำงานตั้งแต่เริ่มต้น
กลไกความสนใจ (Attention Mechanism)
เทคโนโลยีที่ทำให้แนวคิดของนักวางกรอบโดยธรรมชาติ (natural-born frameworker) เป็นจริงขึ้นมา คือ กลไกความสนใจ (attention mechanism)
กลไกความสนใจเปรียบเสมือนการเลือกโทเค็นที่เกี่ยวข้องจากบริบท และมันช่วยให้ความสัมพันธ์ระหว่างโทเค็นชัดเจนขึ้น ซึ่งนี่คือธรรมชาติของกรอบการทำงานอย่างแท้จริง: การสรุปสาระสำคัญโดยคงแนวคิดที่สำคัญไว้ พร้อมทั้งทำให้ความสัมพันธ์ระหว่างแนวคิดเหล่านั้นชัดเจนขึ้น
ด้วยการสลับการเลือกนี้สำหรับแต่ละโทเค็น ทำให้สามารถสลับกรอบการทำงานได้อย่างเป็นพลวัต
สิ่งนี้ช่วยให้เราสามารถอธิบายได้ว่าทำไมกลไกความสนใจจึงเป็นเทคโนโลยีที่กำหนดวิวัฒนาการของแบบจำลองภาษาขนาดใหญ่ โดยใช้แบบจำลองของนักวางกรอบโดยธรรมชาติ
บทสรุป
หากกลไกนี้เกิดขึ้นจริงในระหว่างกระบวนการฝึกอบรมล่วงหน้า (pre-training) ของแบบจำลองภาษาขนาดใหญ่ กลไกอันลึกลับของแบบจำลองภาษาขนาดใหญ่ที่เคยมีมาก่อนหน้านี้ก็สามารถอธิบายได้
ซึ่งรวมถึงการเรียนรู้แบบกายภาพย่อยและอภิปรัชญาที่ได้กล่าวถึงในที่นี้, กรอบการทำงานในฐานะส่วนเชื่อมต่อเชิงอภิปรัชญา, ภาษาธรรมชาติที่ช่วยให้เกิดการเรียนรู้ผ่านภาษาและกรอบการทำงานเสมือน, และกลไกความสนใจที่ทำให้เกิดนักวางกรอบโดยธรรมชาติ
นอกจากนี้ ยังมีข้อเสนอแนะเพิ่มเติมอีกสองประเด็นจากสิ่งนี้
ประการแรก ภาษาธรรมชาติมีโครงสร้างที่เหมาะสมอย่างยิ่งสำหรับการนำกรอบการทำงานที่ซับซ้อนเข้ามาภายในทีละน้อยจากกรอบการทำงานที่เรียบง่ายกว่า
หากภาษาธรรมชาติเริ่มแรกปรากฏในสังคมมนุษย์ในรูปแบบที่เรียบง่ายและค่อยๆ พัฒนาไปสู่โครงสร้างที่ซับซ้อนและสมบูรณ์ยิ่งขึ้น นี่ก็เป็นผลลัพธ์ที่เป็นธรรมชาติ
ยิ่งไปกว่านั้น การมีโครงสร้างที่เอื้อต่อการเรียนรู้ที่รวดเร็วย่อมเป็นประโยชน์ หากสมมติว่ามีหลายสังคมที่มีภาษาธรรมชาติที่แตกต่างกันกำลังแข่งขันกันอยู่ สมมติฐานที่ว่าภาษาธรรมชาติที่เหมาะสมกับการเรียนรู้มากกว่าจะอยู่รอดในปัจจุบันจึงสามารถเกิดขึ้นได้โดยง่าย
การพิจารณาธรรมชาติของภาษาธรรมชาตินี้ นำไปสู่ข้อเสนอแนะที่สอง: ว่าพวกเรามนุษย์ก็เป็นนักวางกรอบโดยธรรมชาติเช่นกัน
แม้ว่าพื้นฐานและกลไกเฉพาะจะแตกต่างกัน สมองของเราก็ต้องมีกลไกที่คล้ายกับกลไกความสนใจ ซึ่งช่วยให้สามารถเรียนรู้กรอบการทำงานทีละขั้นตอนและปรับตัวเข้ากับกรอบการทำงานได้อย่างยืดหยุ่น