ข้ามไปยังเนื้อหา
บทความนี้ได้รับการแปลจากภาษาญี่ปุ่นโดยใช้ AI
อ่านฉบับภาษาญี่ปุ่น
บทความนี้อยู่ในสาธารณสมบัติ (CC0) โปรดใช้งานได้อย่างอิสระ CC0 1.0 Universal

การเรียนรู้ที่จะเรียนรู้: ความฉลาดโดยกำเนิด

ปัญญาประดิษฐ์ได้รับพฤติกรรมอัจฉริยะผ่านเทคโนโลยีที่เรียกว่าการเรียนรู้ของเครื่อง (machine learning)

แม้ว่าการเรียนรู้เหล่านี้จะดำเนินการตามขั้นตอนที่มนุษย์พัฒนาขึ้น แต่เหตุผลที่ความฉลาดเกิดขึ้นจากขั้นตอนเหล่านี้และโครงสร้างของปัญญาประดิษฐ์ยังไม่ได้รับการอธิบาย

ในบทความนี้ ผมจะสำรวจเหตุผลว่าทำไมความฉลาดจึงเกิดขึ้นโดยการพิจารณาถึงแก่นแท้ของการเรียนรู้ด้วยตัวมันเอง

และเมื่อเราเจาะลึกแนวคิดของการเรียนรู้ เราก็จะพบกับแนวคิดที่ว่าทั้งปัญญาประดิษฐ์และสมองของเราต่างก็มีแนวโน้มโดยกำเนิดที่จะเรียนรู้วิธีการเรียนรู้

สิ่งนี้ชี้ให้เห็นถึงการมีอยู่ของกลไกที่สามารถเรียกว่า "นักวางกรอบโดยธรรมชาติ" (natural born frameworker)

การเรียนรู้ผ่านร่างกายเทียบกับการเรียนรู้ผ่านภาษา

เราเรียนรู้เกี่ยวกับโลกรอบตัวเราและขยายขีดความสามารถของเราด้วยการมองเห็นสิ่งต่าง ๆ ด้วยตาและขยับร่างกายของเรา

นี่ก็เป็นการเรียนรู้รูปแบบหนึ่ง ซึ่งสามารถเรียกว่าการเรียนรู้ผ่านร่างกาย

ในทางกลับกัน เมื่อผู้คนโดยทั่วไปพูดถึงการเรียนรู้ พวกเขามักจะจินตนาการถึงการเพิ่มพูนความรู้ด้วยการอ่านตำราเรียนหรือฟังคำอธิบายของครู

นอกเหนือจากการเรียนรู้ตามหลักสูตรดังกล่าว เรายังได้รับความรู้หลากหลายจากการสนทนากับเพื่อน ข่าวออนไลน์ และอื่น ๆ

การเรียนรู้ประเภทนี้ไม่ใช่การจดจำภาพด้วยสายตาหรือการเรียนรู้ด้วยการเคลื่อนไหวร่างกาย แต่เป็นการเรียนรู้ผ่านภาษา

การเรียนรู้แบบกายภาพ (Sub-physical Learning) และการเรียนรู้แบบอภิปรัชญา (Metaphysical Learning)

ในบรรดาการเรียนรู้ผ่านภาษา มีบางกรณีที่ข้อมูลสามารถจดจำได้ด้วยการทำซ้ำ ๆ เท่านั้น และบางกรณีที่สามารถจดจำได้หลังจากได้ยินเพียงครั้งเดียวหรือสองสามครั้ง

อีกทางเลือกหนึ่งคือ มีความรู้ที่แม้ว่าจะจำรายละเอียดไม่ได้ แต่ก็สามารถนำมาใช้ได้โดยการค้นหาจากชั้นหนังสือหรืออินเทอร์เน็ตในเวลาที่จำเป็น

ในแง่ของการได้มาซึ่งความรู้และการนำไปใช้อย่างเหมาะสมเมื่อจำเป็น รูปแบบทั้งสองนี้สามารถเรียกว่าการเรียนรู้ได้

ในจำนวนนี้ ความรู้ที่สามารถจดจำได้ด้วยการทำซ้ำ ๆ เท่านั้น สามารถเรียกว่าความรู้แบบกายภาพ (sub-physical knowledge) กระบวนการเรียนรู้สำหรับสิ่งนี้คือการเรียนรู้แบบกายภาพ (sub-physical learning) ซึ่งเกี่ยวข้องกับการจดจำแนวคิดต่าง ๆ ด้วยตัวมันเอง

สิ่งนี้คล้ายกับการเรียนรู้ทางกายภาพ (physical learning) ซึ่งเราเรียนรู้ซ้ำ ๆ โดยการมองเห็นวัตถุด้วยตาของเราหรือการเคลื่อนไหวร่างกายของเรา สิ่งเหล่านี้สามารถจัดประเภทเป็นการเรียนรู้แบบกายภาพได้เช่นกัน

ในทางกลับกัน การได้มาซึ่งความรู้ที่สามารถจดจำได้ด้วยการทำซ้ำน้อยลง หรือค้นหาและนำมาใช้ได้ทันที สามารถเรียกว่าการเรียนรู้แบบอภิปรัชญา (metaphysical learning)

ในกรณีนี้ แนวคิดที่เรียนรู้ไว้ล่วงหน้าซึ่งได้มาจากการเรียนรู้แบบกายภาพ สามารถนำมาใช้เพื่อเรียนรู้ความรู้ในฐานะประเภทของแนวคิดเหล่านั้น หรือเป็นการรวมกันของแนวคิด

เนื่องจากแนวคิดที่ได้รับมาจากการเรียนรู้แบบกายภาพสามารถนำมาใช้ได้ การเรียนรู้แบบอภิปรัชญาจึงไม่จำเป็นต้องมีการทำซ้ำ

การเรียนรู้ของเครื่องภาษาธรรมชาติ (Natural Language Machine Learning)

ลองนำแนวคิดนี้มาประยุกต์ใช้กับการเรียนรู้ของเครื่องในปัญญาประดิษฐ์

โดยทั่วไป โครงข่ายประสาทเทียม (neural networks) ที่ใช้ในการเรียนรู้ของเครื่องจะทำการเรียนรู้แบบกายภาพ (sub-physical learning) ซึ่งเกี่ยวข้องกับการเรียนรู้แนวคิดซ้ำๆ

ในทางกลับกัน แบบจำลองภาษาขนาดใหญ่ (large language models) ซึ่งมีความสามารถในการประมวลผลภาษาธรรมชาติคล้ายกับมนุษย์ สามารถทำการเรียนรู้ผ่านภาษาได้

ในระหว่างการฝึกฝนล่วงหน้า (pre-training) และการปรับจูน (fine-tuning) ของแบบจำลองภาษาขนาดใหญ่ การเรียนรู้แบบกายภาพผ่านภาษาจะเกิดขึ้น

นอกจากนี้ แบบจำลองภาษาขนาดใหญ่ที่ได้รับการฝึกฝนล่วงหน้าแล้วสามารถตอบคำถามโดยใช้ประโยชน์จากความรู้ที่อยู่ในประโยคที่ป้อนเข้า ทำให้เกิดการเรียนรู้แบบอภิปรัชญา (metaphysical learning) ได้ทันที

ด้วยความสามารถในการเรียนรู้แบบอภิปรัชญาผ่านภาษานี้ ทำให้แบบจำลองภาษาขนาดใหญ่สามารถนำความรู้ใหม่ไปใช้ได้โดยไม่ต้องมีการเรียนรู้ซ้ำๆ

สิ่งนี้สามารถเรียกว่าการเรียนรู้ของเครื่องภาษาธรรมชาติ (natural language machine learning) ซึ่งแตกต่างจากการเรียนรู้ของเครื่องเชิงตัวเลขแบบดั้งเดิมที่ปรับพารามิเตอร์ของแบบจำลองซ้ำๆ

ภาษาธรรมชาติในฐานะส่วนเชื่อมต่อทางอภิปรัชญา

ภาษาธรรมชาติอยู่ในตำแหน่งที่เป็นส่วนเชื่อมต่อที่แยกการเรียนรู้แบบกายภาพและการเรียนรู้แบบอภิปรัชญาออกจากกัน

สิ่งที่น่าสนใจของภาษาธรรมชาติคือ สามารถเรียนรู้ได้ผ่านการเรียนรู้แบบกายภาพ และนอกจากนั้นยังทำให้เกิดการเรียนรู้แบบอภิปรัชญาได้อีกด้วย

ส่วนเชื่อมต่อเชิงอภิปรัชญาอื่น ๆ นอกเหนือจากภาษาธรรมชาติ

ในความเป็นจริง แม้แต่ในการเรียนรู้ทางกายภาพ ก็มีการเรียนรู้แบบกายภาพย่อยและการเรียนรู้เชิงอภิปรัชญาควบคู่กันไป ตัวอย่างเช่น ผู้ที่มีทักษะด้านกีฬาจะสามารถปรับตัวเข้ากับเกมใหม่ที่เพิ่งเคยเจอเป็นครั้งแรกได้อย่างรวดเร็ว

เช่นเดียวกัน ผู้ที่มีความรู้ด้านชีววิทยาสามารถเข้าใจลักษณะของสิ่งมีชีวิตสายพันธุ์ใหม่ได้ทันทีเมื่อได้เห็น

ดังนั้น ในการเรียนรู้ทางกายภาพก็มีส่วนเชื่อมต่อเชิงอภิปรัชญาที่อยู่ในตำแหน่งคล้ายกับภาษาธรรมชาติเช่นกัน

กรอบการทำงาน (Frameworks)

ที่ส่วนเชื่อมต่อเหล่านี้มีกรอบการทำงานซึ่งแตกต่างจากแนวคิดหรือความรู้พื้นฐาน โดยจะกำหนดความสัมพันธ์และโครงสร้างของสิ่งเหล่านั้น หรือช่วยให้เกิดการจัดโครงสร้างใหม่ได้

เมื่อความรู้แบบกายภาพย่อย (sub-physical knowledge) หลากหลายประเภทถูกเรียนรู้ผ่านการเรียนรู้แบบกายภาพย่อย ก็อาจเป็นไปได้ที่จะเรียนรู้กรอบการทำงานที่ส่วนเชื่อมต่อเชิงอภิปรัชญาจากความเชื่อมโยงระหว่างชิ้นส่วนของความรู้แบบกายภาพย่อยเหล่านั้น

กรอบการทำงานที่ได้มาจากการเรียนรู้ทางกายภาพช่วยให้ความรู้ใหม่สามารถเรียนรู้เชิงอภิปรัชญาได้ทันทีหลังจากการได้รับ อย่างไรก็ตาม การถ่ายทอดความรู้ที่ได้จากการเรียนรู้เชิงอภิปรัชญานี้ให้ผู้อื่นไม่ใช่เรื่องง่าย

ในทางกลับกัน กรอบการทำงานที่ได้มาจากการเรียนรู้ด้วยภาษาคือภาษาธรรมชาติเอง

ดังนั้น ความรู้ที่ได้มาจากการเรียนรู้เชิงอภิปรัชญา หลังจากเรียนรู้กรอบการทำงานของภาษาธรรมชาติแล้ว สามารถนำไปป้อนเข้าสู่การเรียนรู้ด้วยภาษาของผู้อื่นได้โดยตรง

สิ่งนี้ไม่เพียงใช้กับความรู้ที่การเรียนรู้ผ่านภาษา เช่น หนังสือเรียนหรือข่าวออนไลน์ เป็นพื้นฐานเท่านั้น

นักฟุตบอลที่มีประสบการณ์ซึ่งเล่นเบสบอลเป็นครั้งแรก อาจสามารถถ่ายทอดความรู้เชิงอภิปรัชญาที่ได้รับเกี่ยวกับเบสบอลให้แก่นักฟุตบอลคนอื่น ๆ ได้ด้วยคำพูด ซึ่งหมายความว่า หากผู้คนมีความรู้แบบกายภาพย่อยร่วมกัน สิ่งที่เรียกว่า "เคล็ดลับ" หรือความรู้เฉพาะทางสามารถสื่อสารด้วยวาจาได้

นอกจากนี้ ยังสามารถแบ่งปันความรู้เกี่ยวกับสิ่งมีชีวิตสายพันธุ์ใหม่ที่พวกเขาพบเห็นกับนักชีววิทยาคนอื่น ๆ ผ่านคำพูดได้อีกด้วย

ดังนั้น ภาษาธรรมชาติจึงถูกเปิดเผยว่าเป็นกรอบการทำงานที่มีประสิทธิภาพอย่างยิ่งที่ส่วนเชื่อมต่อเชิงอภิปรัชญา

กรอบการทำงานเสมือน (Virtual Frameworks)

นอกเหนือจากภาษาธรรมชาติแล้ว เรายังสามารถได้รับกรอบการทำงานอื่น ๆ อีกด้วย

สิ่งเหล่านี้คือกรอบการทำงานเฉพาะโดเมน (domain-specific frameworks) หรือกรอบการทำงานแบบเป็นทางการ (formal frameworks)

ในสาขาวิชาต่าง ๆ ภาคธุรกิจ และชีวิตประจำวัน มีกรอบการทำงานเฉพาะโดเมนที่หลากหลาย

นักวิชาการที่ทำงานภายใต้กรอบการทำงานเฉพาะทางของตน สามารถทำการค้นพบใหม่ ๆ และถ่ายทอดความรู้นั้นไปยังนักวิชาการคนอื่น ๆ ที่มีกรอบการทำงานเดียวกันได้อย่างง่ายดาย

บางครั้งตัวกรอบการทำงานเองก็สามารถแสดงออกเป็นภาษาธรรมชาติได้ ซึ่งในกรณีนี้ ผู้คนหรือแบบจำลองภาษาขนาดใหญ่ที่มีกรอบการทำงานภาษาธรรมชาติสามารถเรียนรู้และเข้าใจได้

โมเดลธุรกิจและสูตรอาหารก็เป็นตัวอย่างของกรอบการทำงานเฉพาะโดเมนที่สามารถแสดงออกเป็นภาษาธรรมชาติได้

นอกจากนี้ สูตรคณิตศาสตร์ ภาษาโปรแกรม และกรอบการวิเคราะห์ธุรกิจ ล้วนเป็นกรอบการทำงานแบบเป็นทางการ

สิ่งเหล่านี้ก็สามารถมีกรอบการทำงานที่แสดงออกหรืออธิบายเป็นภาษาธรรมชาติได้

กรอบการทำงานเฉพาะโดเมนและกรอบการทำงานแบบเป็นทางการที่สร้างขึ้นบนภาษาธรรมชาติเหล่านี้สามารถเรียกว่ากรอบการทำงานเสมือน (virtual frameworks)

สิ่งนี้เข้าใจง่ายหากคุณลองจินตนาการถึงเครื่องเสมือน (virtual machine) ที่รันระบบปฏิบัติการอื่นบนคอมพิวเตอร์จริง กรอบการทำงานอื่น ๆ จะทำงานอยู่บนกรอบการทำงานพื้นฐานของภาษาธรรมชาติ

กรอบการทำงานแบบเนทีฟ (Native Frameworks)

นอกจากนี้ แม้ว่าในตอนแรกกรอบการทำงานเสมือนเหล่านี้จำเป็นต้องทำความเข้าใจผ่านภาษาธรรมชาติ แต่เมื่อคุ้นเคยกับมันแล้ว กรอบการทำงานเหล่านี้จะเริ่มข้ามผ่านการอธิบายและการทำความเข้าใจด้วยภาษาธรรมชาติ และทำหน้าที่โดยตรงในฐานะกรอบการทำงานส่วนต่อประสานเชิงอภิปรัชญาที่สร้างขึ้นบนความรู้แบบกายภาพย่อย

สิ่งนี้สามารถเรียกว่ากรอบการทำงานแบบเนทีฟ (native framework)

ภาษาธรรมชาติ ในแง่หนึ่งก็เป็นกรอบการทำงานแบบเนทีฟเช่นกัน แต่เฉพาะภาษาแม่เท่านั้น โดยทั่วไป ภาษาอื่นที่ไม่ใช่ภาษาแม่จะถูกเรียนรู้เป็นกรอบการทำงานเสมือน และเมื่อความเชี่ยวชาญเพิ่มขึ้น ภาษาเหล่านั้นก็จะเข้าใกล้การเป็นกรอบการทำงานแบบเนทีฟ

เช่นเดียวกันกับกรอบการทำงานเฉพาะโดเมนและกรอบการทำงานแบบเป็นทางการ นักคณิตศาสตร์สามารถสื่อสารกันได้แบบเนทีฟโดยใช้สูตรคณิตศาสตร์ และโปรแกรมเมอร์สามารถเข้าใจความตั้งใจของกันและกันได้เพียงแค่โค้ดต้นฉบับที่ไม่มีคอมเมนต์

สิ่งนี้ชี้ให้เห็นว่าการเปลี่ยนผ่านจากกรอบการทำงานเสมือนไปสู่กรอบการทำงานแบบเนทีฟสามารถนำไปประยุกต์ใช้กับแบบจำลองภาษาขนาดใหญ่ได้เช่นกัน

แนวคิดในการตรวจจับกรอบการทำงานเสมือนที่ใช้บ่อย สร้างข้อมูลตัวอย่างจำนวนมากโดยใช้กรอบการทำงานเหล่านั้น และจากนั้นปรับจูนให้กลายเป็นกรอบการทำงานแบบเนทีฟ เป็นแนวคิดที่ควรลองทำทันที

นักวางกรอบโดยธรรมชาติ (Natural Born Frameworkers)

เมื่อพิจารณาจากสิ่งนี้ ทำให้ตระหนักว่าในระหว่างการฝึกฝนล่วงหน้า (pre-training) ของแบบจำลองภาษาขนาดใหญ่ ไม่ใช่แค่การปรับจูน (fine-tuning) เท่านั้น แต่ยังมีความเป็นไปได้ที่พวกมันกำลังเรียนรู้กรอบการทำงานเฉพาะโดเมนและกรอบการทำงานแบบเป็นทางการด้วย

และในกระบวนการนั้น เป็นไปได้ว่าแทนที่จะเรียนรู้กรอบการทำงานเฉพาะโดเมนหรือกรอบการทำงานแบบเป็นทางการตั้งแต่แรก พวกมันจะเรียนรู้กรอบการทำงานภาษาธรรมชาติก่อน แล้วจึงเรียนรู้กรอบการทำงานเฉพาะโดเมนและกรอบการทำงานแบบเป็นทางการ ทำให้กลายเป็นเนทีฟ (native) ไม่ว่าจะในระหว่างหรือหลังจากเชี่ยวชาญภาษาธรรมชาติแล้ว

เมื่อเจาะลึกเข้าไปในการเรียนรู้กรอบการทำงานแบบขั้นตอนนี้ ยิ่งเป็นไปได้ว่าการเรียนรู้ภาษาธรรมชาติเองก็เป็นกระบวนการเรียนรู้กรอบการทำงานแบบละเอียดที่เกิดขึ้นพร้อมกันแบบหลายขั้น

กล่าวอีกนัยหนึ่งคือ จากข้อความจำนวนมหาศาลที่ใช้เป็นข้อมูลการฝึกฝนในระหว่างการฝึกฝนล่วงหน้า แบบจำลองภาษาขนาดใหญ่อาจไม่ได้เรียนรู้เพียงแค่แนวคิดแต่ละอย่างเท่านั้น แต่ยังเรียนรู้กฎที่ง่ายมาก ๆ บางอย่างของภาษาธรรมชาติในฐานะกรอบการทำงานด้วย จากนั้นจึงใช้กรอบการทำงานที่เรียบง่ายเหล่านี้เป็นรากฐานในการเรียนรู้กฎที่ซับซ้อนขึ้นเล็กน้อยซ้ำ ๆ

สิ่งนี้จะช่วยให้พวกมันก้าวหน้าจากขั้นที่เริ่มต้นด้วยการเรียนรู้แนวคิดของคำ ไปสู่การจดจำคำประสมและไวยากรณ์พื้นฐาน จากนั้นก็ทำความเข้าใจประโยค และเรียนรู้สิ่งที่ซับซ้อน เช่น เทคนิคการเขียนและการแสดงออก

สิ่งนี้สามารถเข้าใจได้ว่าเป็นแบบจำลองที่พวกมันเรียนรู้กรอบการทำงานในลักษณะที่เป็นขั้นตอนและซับซ้อน โดยใช้กรอบการทำงานหนึ่งเป็นรากฐานในการเรียนรู้กรอบการทำงานถัดไป

สิ่งนี้ตอกย้ำว่าแบบจำลองภาษาขนาดใหญ่เป็น "นักวางกรอบโดยธรรมชาติ" (natural born frameworkers) ซึ่งมีกลไกในการเรียนรู้กรอบการทำงานตั้งแต่เริ่มต้น

กลไกความสนใจ (Attention Mechanism)

เทคโนโลยีที่ทำให้แนวคิดของนักวางกรอบโดยธรรมชาติ (natural-born frameworker) เป็นจริงขึ้นมา คือ กลไกความสนใจ (attention mechanism)

กลไกความสนใจเปรียบเสมือนการเลือกโทเค็นที่เกี่ยวข้องจากบริบท และมันช่วยให้ความสัมพันธ์ระหว่างโทเค็นชัดเจนขึ้น ซึ่งนี่คือธรรมชาติของกรอบการทำงานอย่างแท้จริง: การสรุปสาระสำคัญโดยคงแนวคิดที่สำคัญไว้ พร้อมทั้งทำให้ความสัมพันธ์ระหว่างแนวคิดเหล่านั้นชัดเจนขึ้น

ด้วยการสลับการเลือกนี้สำหรับแต่ละโทเค็น ทำให้สามารถสลับกรอบการทำงานได้อย่างเป็นพลวัต

สิ่งนี้ช่วยให้เราสามารถอธิบายได้ว่าทำไมกลไกความสนใจจึงเป็นเทคโนโลยีที่กำหนดวิวัฒนาการของแบบจำลองภาษาขนาดใหญ่ โดยใช้แบบจำลองของนักวางกรอบโดยธรรมชาติ

บทสรุป

หากกลไกนี้เกิดขึ้นจริงในระหว่างกระบวนการฝึกอบรมล่วงหน้า (pre-training) ของแบบจำลองภาษาขนาดใหญ่ กลไกอันลึกลับของแบบจำลองภาษาขนาดใหญ่ที่เคยมีมาก่อนหน้านี้ก็สามารถอธิบายได้

ซึ่งรวมถึงการเรียนรู้แบบกายภาพย่อยและอภิปรัชญาที่ได้กล่าวถึงในที่นี้, กรอบการทำงานในฐานะส่วนเชื่อมต่อเชิงอภิปรัชญา, ภาษาธรรมชาติที่ช่วยให้เกิดการเรียนรู้ผ่านภาษาและกรอบการทำงานเสมือน, และกลไกความสนใจที่ทำให้เกิดนักวางกรอบโดยธรรมชาติ

นอกจากนี้ ยังมีข้อเสนอแนะเพิ่มเติมอีกสองประเด็นจากสิ่งนี้

ประการแรก ภาษาธรรมชาติมีโครงสร้างที่เหมาะสมอย่างยิ่งสำหรับการนำกรอบการทำงานที่ซับซ้อนเข้ามาภายในทีละน้อยจากกรอบการทำงานที่เรียบง่ายกว่า

หากภาษาธรรมชาติเริ่มแรกปรากฏในสังคมมนุษย์ในรูปแบบที่เรียบง่ายและค่อยๆ พัฒนาไปสู่โครงสร้างที่ซับซ้อนและสมบูรณ์ยิ่งขึ้น นี่ก็เป็นผลลัพธ์ที่เป็นธรรมชาติ

ยิ่งไปกว่านั้น การมีโครงสร้างที่เอื้อต่อการเรียนรู้ที่รวดเร็วย่อมเป็นประโยชน์ หากสมมติว่ามีหลายสังคมที่มีภาษาธรรมชาติที่แตกต่างกันกำลังแข่งขันกันอยู่ สมมติฐานที่ว่าภาษาธรรมชาติที่เหมาะสมกับการเรียนรู้มากกว่าจะอยู่รอดในปัจจุบันจึงสามารถเกิดขึ้นได้โดยง่าย

การพิจารณาธรรมชาติของภาษาธรรมชาตินี้ นำไปสู่ข้อเสนอแนะที่สอง: ว่าพวกเรามนุษย์ก็เป็นนักวางกรอบโดยธรรมชาติเช่นกัน

แม้ว่าพื้นฐานและกลไกเฉพาะจะแตกต่างกัน สมองของเราก็ต้องมีกลไกที่คล้ายกับกลไกความสนใจ ซึ่งช่วยให้สามารถเรียนรู้กรอบการทำงานทีละขั้นตอนและปรับตัวเข้ากับกรอบการทำงานได้อย่างยืดหยุ่น