ข้ามไปยังเนื้อหา
บทความนี้ได้รับการแปลจากภาษาญี่ปุ่นโดยใช้ AI
อ่านฉบับภาษาญี่ปุ่น
บทความนี้อยู่ในสาธารณสมบัติ (CC0) โปรดใช้งานได้อย่างอิสระ CC0 1.0 Universal

ระบบปัญญาประดิษฐ์เพื่อการเรียนรู้: แนวคิด ALIS

ในที่นี้ ผมมีเป้าหมายที่จะจัดระเบียบระบบปัญญาประดิษฐ์เพื่อการเรียนรู้ (Artificial Learning Intelligence System: ALIS) โดยครอบคลุมตั้งแต่แนวคิดและหลักการ ไปจนถึงการออกแบบพื้นฐานและวิธีการพัฒนา

แนวคิด

AI เชิงกำเนิดในปัจจุบัน ซึ่งส่วนใหญ่เป็นแบบจำลองภาษาขนาดใหญ่ (LLMs) ได้รับการฝึกฝนโดยอิงจากการเรียนรู้แบบมีผู้สอนโดยใช้โครงข่ายประสาทเทียม

เราจัดกระบวนการฝึกฝนโครงข่ายประสาทเทียมนี้ให้เป็นการเรียนรู้แบบ "โดยกำเนิด" (Innate Learning)

ALIS คือระบบที่ช่วยให้การอนุมานเป็นไปอย่างครอบคลุม โดยการบูรณาการกระบวนการเรียนรู้แบบ "โดยกำเนิด" และ "ภายหลังการเกิด" (Acquired Learning) เข้าด้วยกัน ผ่านการผนวกกระบวนการเรียนรู้ภายหลังการเกิดที่แยกต่างหากจากการเรียนรู้โดยกำเนิด

ในการเรียนรู้ภายหลังการเกิดนี้ ความรู้ที่เรียนรู้จะถูกจัดเก็บภายนอกโครงข่ายประสาทเทียมและนำไปใช้ในระหว่างการอนุมาน

ดังนั้น แกนหลักทางเทคนิคของ ALIS จึงอยู่ที่การสกัด การจัดเก็บความรู้ที่นำกลับมาใช้ใหม่ได้ และการเลือกใช้ความรู้ในระหว่างการอนุมาน

นอกจากนี้ ALIS ไม่ได้เป็นเพียงเทคโนโลยีองค์ประกอบเดียว แต่ยังเป็นเทคโนโลยีระบบที่รวมการเรียนรู้โดยกำเนิดและการเรียนรู้ภายหลังการเกิดเข้าไว้ด้วยกัน

องค์ประกอบของระบบปัญญาเพื่อการเรียนรู้

ALIS ปฏิบัติกับการเรียนรู้โดยกำเนิดที่มีอยู่และการเรียนรู้ภายหลังการเกิดในอนาคตว่าเป็นไปตามหลักการเดียวกันภายใต้กรอบการเรียนรู้และการอนุมาน

เพื่ออธิบายหลักการเรียนรู้ใน ALIS เรากำหนดองค์ประกอบห้าประการของระบบปัญญาเพื่อการเรียนรู้:

อย่างแรกคือ หน่วยประมวลผลอัจฉริยะ (Intelligent Processor) ซึ่งหมายถึงระบบประมวลผลที่ทำการอนุมานโดยใช้ความรู้และสกัดความรู้เพื่อการเรียนรู้

ตัวอย่างที่เด่นชัดของหน่วยประมวลผลอัจฉริยะ ได้แก่ LLMs และบางส่วนของสมองมนุษย์

อย่างที่สองคือ คลังความรู้ (Knowledge Store) ซึ่งหมายถึงตำแหน่งจัดเก็บที่ความรู้ที่สกัดออกมาจะถูกบันทึกและสามารถเรียกใช้ได้ตามต้องการ

ใน LLMs คลังความรู้คือพารามิเตอร์ของโครงข่ายประสาทเทียม ในมนุษย์ มันสอดคล้องกับความทรงจำระยะยาวในสมอง

อย่างที่สามคือ โลก (World) ซึ่งหมายถึงสภาพแวดล้อมภายนอกตามที่รับรู้โดยระบบปัญญาเพื่อการเรียนรู้ เช่น มนุษย์หรือ ALIS

สำหรับมนุษย์ โลกคือความเป็นจริงนั่นเอง ในกรณีของ LLMs กลไกที่รับเอาต์พุตจาก LLM และให้ข้อเสนอแนะกลับไปยัง LLM ถือเป็นสิ่งที่เทียบเท่ากับโลก

อย่างที่สี่คือ หน่วยความจำสถานะ (State Memory) ซึ่งหมายถึงหน่วยความจำชั่วคราวภายใน คล้ายกับสมุดร่าง ที่ระบบปัญญาเพื่อการเรียนรู้ใช้ในระหว่างการอนุมาน

ใน LLMs นี่คือพื้นที่หน่วยความจำที่ใช้ระหว่างการอนุมาน ซึ่งเรียกว่าสถานะซ่อนเร้น (hidden states) ในมนุษย์ มันสอดคล้องกับความทรงจำระยะสั้น

อย่างที่ห้าคือ กรอบแนวคิด (Framework) ซึ่งเป็นสิ่งที่เรียกว่ากรอบความคิด ในคำศัพท์ของระบบปัญญาเพื่อการเรียนรู้ มันหมายถึงเกณฑ์สำหรับการเลือกความรู้ที่จำเป็นในระหว่างการอนุมาน และโครงสร้างพื้นที่สถานะเชิงตรรกะสำหรับการจัดระเบียบหน่วยความจำสถานะ

ใน LLMs มันคือโครงสร้างความหมายของสถานะซ่อนเร้น และโดยทั่วไปแล้ว เนื้อหาของมันจะคลุมเครือและมนุษย์ไม่สามารถเข้าใจได้ นอกจากนี้ การเลือกความรู้ยังถูกรวมเข้ากับกลไกความสนใจ (attention mechanism) ซึ่งจะเลือกว่าจะอ้างอิงโทเค็นที่มีอยู่ใดสำหรับแต่ละโทเค็นที่กำลังประมวลผล

สำหรับมนุษย์ ดังที่กล่าวไปข้างต้น มันคือกรอบความคิด เมื่อคิดโดยใช้กรอบความคิดเฉพาะ ชุดของความรู้เฉพาะทางจะถูกดึงออกมาจากความทรงจำระยะยาวและโหลดเข้าสู่ความทรงจำระยะสั้น จากนั้นข้อมูลที่รับรู้ในปัจจุบันจะถูกจัดระเบียบตามกรอบความคิดเพื่อทำความเข้าใจสถานการณ์

หลักการของระบบปัญญาเพื่อการเรียนรู้

ระบบปัญญาเพื่อการเรียนรู้ทำงานดังนี้:

ตัวประมวลผลอัจฉริยะ (intelligent processor) จะกระทำการกับโลก (world) โลกจะตอบสนองด้วยผลลัพธ์ตามการกระทำนั้น

ตัวประมวลผลอัจฉริยะจะสกัดความรู้ที่สามารถนำกลับมาใช้ใหม่ได้จากผลลัพธ์เหล่านี้และจัดเก็บไว้ในคลังความรู้ (knowledge store)

เมื่อตัวประมวลผลอัจฉริยะกระทำการกับโลกซ้ำๆ มันจะเลือกความรู้จากคลังความรู้และใช้มันเพื่อปรับเปลี่ยนรูปแบบการกระทำของมัน

นี่คือกลไกพื้นฐาน

อย่างไรก็ตาม โดยพื้นฐานแล้ว วิธีการสกัด จัดเก็บ เลือก และใช้ความรู้ จะเป็นตัวกำหนดว่าระบบจะสามารถเรียนรู้ได้อย่างมีความหมายหรือไม่

มนุษย์มีกลไกที่ช่วยให้การสกัด จัดเก็บ เลือก และใช้ความรู้เป็นไปอย่างมีประสิทธิภาพ ซึ่งทำให้พวกเขาสามารถเรียนรู้ได้

โครงข่ายประสาทเทียม รวมถึง LLMs มีกลไกสำหรับการจัดเก็บ เลือก และใช้ความรู้ แม้ว่าส่วนของการสกัดจะถูกจัดการโดยผู้สอนภายนอก สิ่งนี้ช่วยให้พวกเขาสามารถเรียนรู้ได้ตราบเท่าที่ผู้สอนป้อนข้อมูลให้

นอกจากนี้ ระบบปัญญาเพื่อการเรียนรู้ยังสามารถเรียนรู้ที่ซับซ้อนยิ่งขึ้นได้ โดยการเรียนรู้การสกัด จัดเก็บ และเลือกกรอบแนวคิด (frameworks) และการนำไปใช้ในหน่วยความจำสถานะ (state memory) ในฐานะที่เป็นความรู้ด้วยเช่นกัน

ประเภทของความรู้

จากหลักการนี้ เมื่อออกแบบการเรียนรู้แบบภายหลังการเกิด จำเป็นต้องระบุให้ชัดเจนว่าความรู้ที่ได้มานั้นจะอยู่ในรูปแบบข้อมูลใด

เป็นไปได้ที่จะเรียนรู้ความรู้ที่ได้มาแยกต่างหากในฐานะพารามิเตอร์ของโครงข่ายประสาทเทียม

อย่างไรก็ตาม ความรู้ที่ได้มาไม่จำเป็นต้องจำกัดอยู่แค่พารามิเตอร์ของโครงข่ายประสาทเทียมเท่านั้น ผู้สมัครที่สมจริงคือความรู้ที่ถูกแปลงเป็นข้อความในภาษาธรรมชาติ

หากความรู้ถูกแปลงเป็นข้อความในภาษาธรรมชาติ จะสามารถสกัดและนำไปใช้ได้โดยใช้ประโยชน์จากความสามารถในการประมวลผลภาษาธรรมชาติของ LLM นอกจากนี้ ยังสามารถถือเป็นข้อมูลในระบบ IT ทั่วไป ทำให้การจัดเก็บและการเลือกเป็นเรื่องง่าย

ยิ่งไปกว่านั้น ความรู้ที่ถูกแปลงเป็นข้อความในภาษาธรรมชาติยังง่ายสำหรับมนุษย์และ LLM อื่นๆ ในการตรวจสอบ ทำความเข้าใจ และในบางกรณีก็สามารถแก้ไขได้

นอกจากนี้ยังสามารถแบ่งปันกับระบบปัญญาเพื่อการเรียนรู้อื่นๆ และสามารถรวมหรือแยกได้

ด้วยเหตุผลเหล่านี้ ความรู้ที่ได้มาในแนวคิด ALIS จะถูกออกแบบมาเพื่อมุ่งเป้าไปที่ความรู้ที่ถูกแปลงเป็นข้อความในภาษาธรรมชาติในเบื้องต้น

หน่วยความจำสถานะภายหลังการเกิดและกรอบแนวคิด

ผมได้อธิบายถึงข้อดีของการเลือกความรู้ที่ถูกแปลงเป็นข้อความในภาษาธรรมชาติเป็นความรู้ภายหลังการเกิดไปแล้ว

ในทำนองเดียวกัน ข้อความภาษาธรรมชาติก็สามารถนำมาใช้สำหรับหน่วยความจำสถานะ (state memory) และกรอบแนวคิด (framework) สำหรับการอนุมานได้เช่นกัน

กรอบแนวคิด ซึ่งเป็นโครงสร้างทางความคิด ก็สามารถจัดเก็บและนำไปใช้ในคลังความรู้ (knowledge store) ในรูปแบบความรู้ที่ถูกแปลงเป็นข้อความในภาษาธรรมชาติได้

เมื่อเริ่มต้นหรืออัปเดตสถานะโดยอิงตามโครงสร้างที่กำหนดโดยกรอบแนวคิดนั้น หน่วยความจำสถานะแบบข้อความสามารถนำมาใช้ได้

โดยการออกแบบ ALIS ให้ใช้รูปแบบข้อความไม่เพียงแต่สำหรับความรู้ภายหลังการเกิดเท่านั้น แต่ยังรวมถึงกรอบแนวคิดและหน่วยความจำสถานะด้วย ทำให้ ALIS สามารถใช้ประโยชน์จากความสามารถในการประมวลผลภาษาธรรมชาติของ LLM สำหรับทั้งการเรียนรู้ภายหลังการเกิดและการอนุมานทั่วไปได้

ความรู้เชิงรูปแบบ

ความรู้ที่ได้รับมา กรอบแนวคิด และหน่วยความจำสถานะ ไม่เพียงแต่สามารถแสดงด้วยข้อความภาษาธรรมชาติเท่านั้น แต่ยังสามารถแสดงด้วยภาษาเชิงรูปแบบ (formal languages) หรือแบบจำลองเชิงรูปแบบ (formal models) ที่เข้มงวดยิ่งขึ้นได้

แม้ผมจะเขียนว่า "เลือก" แต่เป้าหมายของ ALIS คือการรวมกลไกการเรียนรู้ความรู้ที่ได้รับมาหลายแบบเข้าด้วยกัน เพื่อให้สามารถใช้ประโยชน์จากการเรียนรู้แบบโดยกำเนิดและการเรียนรู้ที่ได้รับมาในลักษณะผสมผสาน

ความรู้ที่แสดงด้วยภาษาเชิงรูปแบบหรือแบบจำลองเชิงรูปแบบจะมีความเข้มงวดมากกว่าและปราศจากความกำกวม

นอกจากนี้ หากกรอบแนวคิดถูกแสดงโดยใช้ภาษาเชิงรูปแบบหรือแบบจำลองเชิงรูปแบบ และสถานะเริ่มต้นถูกขยายในหน่วยความจำสถานะ แบบจำลองเชิงรูปแบบก็สามารถประมวลผลโดยหน่วยประมวลผลอัจฉริยะ (ไม่ใช่ LLM) เพื่อทำการจำลองที่เข้มงวดและการให้เหตุผลเชิงตรรกะ

ตัวอย่างสำคัญของภาษาเชิงรูปแบบและแบบจำลองเชิงรูปแบบดังกล่าวคือภาษาโปรแกรม

เมื่อระบบเรียนรู้เกี่ยวกับโลก หากมันสามารถแสดงกฎและแนวคิดพื้นฐานเป็นโปรแกรมภายในกรอบแนวคิด สิ่งเหล่านี้ก็สามารถจำลองได้ด้วยคอมพิวเตอร์

คอลัมน์ 1: ประเภทของความรู้

เมื่อเราจัดระเบียบความรู้ภายในระบบปัญญาประดิษฐ์เพื่อการเรียนรู้ จะเห็นได้ชัดเจนว่าสามารถแบ่งออกเป็น 3 ระบบ และ 2 ประเภทได้อย่างกว้างๆ

สามระบบคือ: ความรู้พารามิเตอร์เครือข่ายที่จัดการโดยโครงข่ายประสาทเทียม (network parameter knowledge), ความรู้ธรรมชาติในภาษาธรรมชาติ (natural knowledge), และความรู้เชิงรูปแบบในภาษาเชิงรูปแบบ (formal knowledge)

สองประเภทคือ แบบไร้สถานะ (stateless) และแบบมีสถานะ (stateful)

ความรู้พารามิเตอร์เครือข่ายแบบไร้สถานะ คือความรู้ที่เกิดจากการหยั่งรู้ เช่นเดียวกับที่พบใน AI การเรียนรู้เชิงลึก ลักษณะของแมวและสุนัข ซึ่งไม่สามารถคิดหรือระบุได้ด้วยคำพูด สามารถเรียนรู้ได้ในฐานะความรู้พารามิเตอร์เครือข่ายแบบไร้สถานะ

ความรู้พารามิเตอร์เครือข่ายแบบมีสถานะ คือความรู้ที่ได้จากกระบวนการทำซ้ำแบบคลุมเครือ เช่นเดียวกับที่พบใน AI สร้างสรรค์

ความรู้ธรรมชาติแบบไร้สถานะ คือความรู้ เช่น ความหมายที่เกี่ยวข้องกับคำ

ความรู้ธรรมชาติแบบมีสถานะ คือความรู้ที่รวมบริบทที่พบในประโยค

ความรู้ธรรมชาติบางอย่างถูกรวมอยู่ในความรู้พารามิเตอร์เครือข่ายแบบมีสถานะโดยธรรมชาติ แต่ก็มีความรู้ที่สามารถเรียนรู้ได้ภายหลังจากการเกิดจากข้อความภาษาธรรมชาติ

ความรู้เชิงรูปแบบแบบไร้สถานะ คือความรู้ที่สามารถแสดงด้วยสูตรคณิตศาสตร์ที่ไม่รวมการทำซ้ำ ความรู้เชิงรูปแบบแบบมีสถานะ คือความรู้ที่สามารถแสดงด้วยโปรแกรม

ความทรงจำระยะสั้นของสมองคนเราเองก็สามารถใช้เป็นหน่วยความจำสถานะสำหรับความรู้ธรรมชาติและความรู้เชิงรูปแบบได้

อย่างไรก็ตาม เนื่องจากเป็นความทรงจำระยะสั้น จึงมีปัญหาที่ยากต่อการรักษาสถานะให้คงที่ นอกจากนี้ยังไม่ดีในการเก็บความรู้ในสถานะที่เป็นทางการและไม่คลุมเครือ

ในทางกลับกัน กระดาษ คอมพิวเตอร์ หรือสมาร์ทโฟน สามารถใช้เป็นหน่วยความจำสถานะสำหรับจดบันทึกและแก้ไขข้อความภาษาธรรมชาติ ภาษาเชิงรูปแบบ หรือแบบจำลองเชิงรูปแบบได้

โดยทั่วไป ข้อมูลบนกระดาษหรือคอมพิวเตอร์มักถูกมองว่าเป็นสิ่งที่ใช้สำหรับจัดเก็บความรู้ในฐานะคลังความรู้ แต่ก็สามารถใช้เป็นหน่วยความจำสถานะสำหรับการจัดระเบียบความคิดได้เช่นกัน

ดังนั้น จึงเห็นได้ชัดว่ามนุษย์ดำเนินการกิจกรรมทางปัญญาโดยใช้ประโยชน์จากระบบทั้งสามและประเภทความรู้ทั้งสองนี้อย่างชำนาญ

ALIS ก็มีศักยภาพที่จะปรับปรุงความสามารถของตนเองได้อย่างมาก โดยการเปิดใช้งานและเสริมสร้างกิจกรรมทางปัญญาที่ใช้ประโยชน์จากระบบทั้งสามและประเภทความรู้ทั้งสองนี้เช่นกัน

โดยเฉพาะอย่างยิ่ง ALIS มีจุดแข็งในการใช้คลังความรู้และหน่วยความจำสถานะที่มีขนาดใหญ่มาก นอกจากนี้ยังสามารถเตรียมอินสแตนซ์ของแต่ละอย่างได้หลายชุด และดำเนินงานทางปัญญาโดยการสลับหรือรวมเข้าด้วยกันได้อย่างง่ายดาย

คอลัมน์ 2: การจัดการความรู้แบบวงออร์เคสตรา (Intellectual Orchestration)

แม้ว่าการสามารถจัดเก็บความรู้จำนวนมากในคลังความรู้จะเป็นจุดแข็ง แต่การมีเพียงความรู้จำนวนมากอย่างเดียวก็ไม่จำเป็นต้องเป็นประโยชน์ต่อกิจกรรมทางปัญญาเสมอไป เนื่องจากข้อจำกัดด้านจำนวนโทเค็นที่ AI สร้างสรรค์สามารถใช้ได้ในคราวเดียว และข้อจำกัดที่ว่าความรู้ที่ไม่เกี่ยวข้องจะกลายเป็นสัญญาณรบกวน

ในทางกลับกัน การแบ่งส่วนคลังความรู้อย่างเหมาะสม และการสร้างคลังความรู้เฉพาะทางที่มีความหนาแน่นสูงซึ่งรวบรวมความรู้ที่จำเป็นสำหรับงานทางปัญญาเฉพาะ สามารถบรรเทาปัญหาการจำกัดโทเค็นและสัญญาณรบกวนได้

แต่ในทางกลับกัน คลังความรู้เฉพาะทางดังกล่าวจะใช้ได้เฉพาะกับงานทางปัญญาเฉพาะเหล่านั้นเท่านั้น

กิจกรรมทางปัญญาจำนวนมากเป็นการรวมกันที่ซับซ้อนของงานทางปัญญาหลากหลายประเภท ดังนั้น การแบ่งความรู้เป็นคลังความรู้เฉพาะทางตามประเภทของงานทางปัญญา และการแบ่งย่อยกิจกรรมทางปัญญาออกเป็นงานทางปัญญา ทำให้ ALIS สามารถดำเนินกิจกรรมทางปัญญาทั้งหมดได้ในขณะที่สลับไปมาระหว่างคลังความรู้เฉพาะทางอย่างเหมาะสม

สิ่งนี้เปรียบเสมือนวงออร์เคสตราที่ประกอบด้วยนักดนตรีมืออาชีพที่เล่นเครื่องดนตรีต่างกัน และวาทยกรที่เป็นผู้นำวงทั้งหมด

ด้วยเทคโนโลยีระบบนี้ที่เรียกว่า "การจัดการความรู้แบบวงออร์เคสตรา" ALIS จะสามารถจัดระเบียบกิจกรรมทางปัญญาของตนเองได้

การออกแบบพื้นฐานและวิธีการพัฒนา ALIS

จากนี้ไป ผมจะจัดระเบียบแนวทางการพัฒนาสำหรับ ALIS

ดังที่ได้กล่าวไว้ในหลักการและคอลัมน์แล้ว ALIS ได้รับการออกแบบมาโดยเนื้อแท้เพื่อให้สามารถขยายฟังก์ชันและทรัพยากรได้อย่างง่ายดาย ซึ่งเป็นเพราะสาระสำคัญของ ALIS ไม่ได้อยู่ที่ฟังก์ชันเฉพาะ แต่เป็นกระบวนการของการสกัด จัดเก็บ เลือก และใช้ความรู้

ตัวอย่างเช่น สามารถเตรียมกลไกการสกัดความรู้ได้หลายประเภท แล้วเลือกใช้หรือใช้พร้อมกันก็ได้ ขึ้นอยู่กับการออกแบบระบบ

นอกจากนี้ ALIS ยังสามารถถูกทำให้ทำการเลือกนี้ได้ด้วยตัวเอง

การจัดเก็บ การเลือก และการใช้งาน ก็สามารถเลือกหรือทำพร้อมกันได้อย่างอิสระเช่นกัน

ดังนั้น ALIS จึงสามารถพัฒนาได้ทีละน้อยและแบบ Agile โดยไม่จำเป็นต้องออกแบบฟังก์ชันทั้งหมดในลักษณะ Waterfall

จุดเริ่มต้นของ ALIS

ตอนนี้ เรามาออกแบบ ALIS ที่เรียบง่ายกัน

UI พื้นฐานจะเป็น AI แชทที่เราคุ้นเคย ในขั้นต้น ข้อมูลที่ผู้ใช้ป้อนจะถูกส่งตรงไปยัง LLM จากนั้นการตอบสนองของ LLM จะแสดงบน UI และระบบจะรอข้อมูลที่ผู้ใช้ป้อนถัดไป

เมื่อข้อมูลถัดไปมาถึง LLM จะได้รับไม่เพียงข้อมูลใหม่เท่านั้น แต่ยังรวมถึงประวัติการแชททั้งหมดระหว่างผู้ใช้และ LLM จนถึงจุดนั้นด้วย

เบื้องหลัง UI ของ AI แชทนี้ เราจะเตรียมกลไกเพื่อสกัดความรู้ที่สามารถนำกลับมาใช้ใหม่ได้จากประวัติการแชท

สิ่งนี้สามารถเพิ่มเข้าสู่ระบบ AI แชทในฐานะกระบวนการที่ทำงานเมื่อการสนทนาสิ้นสุดลง หรือทำงานเป็นช่วงๆ แน่นอนว่า LLM จะถูกใช้สำหรับการสกัดความรู้

LLM นี้จะได้รับแนวคิดและหลักการของ ALIS รวมถึงความรู้ความเข้าใจในการสกัดความรู้ในฐานะ system prompt หากความรู้ไม่ถูกสกัดตามที่ตั้งใจไว้ system prompt ควรได้รับการปรับปรุงแก้ไขผ่านการลองผิดลองถูก

ความรู้ที่สกัดจากประวัติการแชทจะถูกจัดเก็บโดยตรงใน knowledge lake knowledge lake คือกลไกสำหรับการจัดเก็บความรู้ในรูปแบบที่เรียบง่าย ไม่มีการจัดโครงสร้าง ก่อนที่จะถูกจัดโครงสร้าง

ถัดไป เราจะเตรียมกลไกการจัดโครงสร้างเพื่อให้ง่ายต่อการเลือกความรู้จาก knowledge lake

ซึ่งหมายถึงการจัดหา embedding vector stores สำหรับการค้นหาเชิงความหมาย (semantic search) เช่นเดียวกับที่ใช้ทั่วไปใน RAG และดัชนีคีย์เวิร์ด และอื่นๆ

ตัวเลือกที่ซับซื้นขึ้นได้แก่ การสร้าง knowledge graph หรือการจำแนกประเภท

ชุดข้อมูลที่มีโครงสร้างสำหรับ knowledge lake นี้จะถูกเรียกว่า knowledge base knowledge base และ knowledge lake ทั้งหมดนี้จะประกอบกันเป็น knowledge store

ถัดไป เราจะรวม knowledge store เข้ากับการประมวลผล UI แชท

นี่เป็นพื้นฐานเดียวกับกลไก RAG ทั่วไป สำหรับข้อมูลที่ผู้ใช้ป้อน ความรู้ที่เกี่ยวข้องจะถูกเลือกจาก knowledge store และส่งไปยัง LLM พร้อมกับข้อมูลที่ผู้ใช้ป้อน

สิ่งนี้ช่วยให้ LLM สามารถใช้ประโยชน์จากความรู้โดยอัตโนมัติเมื่อประมวลผลข้อมูลที่ผู้ใช้ป้อน

ด้วยวิธีนี้ ความรู้จะสะสมเพิ่มขึ้นในแต่ละการสนทนากับผู้ใช้ ทำให้เกิด ALIS ที่เรียบง่ายซึ่งใช้ความรู้ที่สะสมจากการสนทนาในอดีต

สถานการณ์จำลองอย่างง่าย

ตัวอย่างเช่น ลองจินตนาการถึงผู้ใช้ที่กำลังพัฒนาเว็บแอปพลิเคชันโดยใช้ ALIS แบบง่ายนี้

ผู้ใช้รายงานว่าโค้ดที่ LLM เสนอทำให้เกิดข้อผิดพลาด หลังจากที่ผู้ใช้และ LLM ร่วมมือกันแก้ไขปัญหา พวกเขาพบว่าข้อกำหนด API ภายนอกที่ LLM ทราบนั้นล้าสมัย และโปรแกรมก็ทำงานได้อย่างถูกต้องหลังจากปรับให้เข้ากับข้อกำหนด API ล่าสุด

จากประวัติการแชทนี้ ALIS จะสามารถสะสมความรู้ในคลังความรู้ของตน: โดยเฉพาะอย่างยิ่ง ข้อมูลที่ว่าข้อกำหนด API ที่ LLM ทราบนั้นเก่า และข้อกำหนด API ล่าสุดคืออะไร

จากนั้น ในครั้งถัดไปที่มีการสร้างโปรแกรมที่ใช้ API เดียวกัน ALIS ก็จะสามารถใช้ประโยชน์จากความรู้นี้เพื่อสร้างโปรแกรมตามข้อกำหนด API ล่าสุดได้ตั้งแต่เริ่มต้น

การปรับปรุง ALIS เริ่มต้น

อย่างไรก็ตาม เพื่อให้สิ่งนี้เกิดขึ้นได้ ความรู้นี้จะต้องถูกเลือกเพื่อตอบสนองต่อข้อมูลที่ผู้ใช้ป้อน เป็นไปได้ว่าความรู้นี้อาจไม่เชื่อมโยงโดยตรงกับข้อมูลที่ผู้ใช้ป้อน เนื่องจากชื่อ API ที่มีปัญหาอาจไม่ปรากฏในข้อมูลที่ผู้ใช้ป้อน

ในกรณีนั้น ชื่อ API จะปรากฏขึ้นในระหว่างการตอบสนองของ LLM เท่านั้น

ดังนั้น เราจะขยาย ALIS อย่างง่ายเล็กน้อยโดยการเพิ่มกลไกสำหรับการวิเคราะห์ล่วงหน้า (pre-analysis) และการตรวจสอบภายหลัง (post-checking)

การวิเคราะห์ล่วงหน้าคล้ายกับ "โหมดความคิด" ใน LLM รุ่นล่าสุด จะมีการเตรียมหน่วยความจำที่สามารถเก็บข้อความในฐานะหน่วยความจำสถานะ (state memory) และ system prompt จะสั่งให้ LLM ทำการวิเคราะห์ล่วงหน้าเมื่อได้รับข้อมูลที่ผู้ใช้ป้อน

ผลการวิเคราะห์ล่วงหน้าของ LLM จะถูกจัดเก็บไว้ในหน่วยความจำสถานะ โดยอิงจากผลการวิเคราะห์ล่วงหน้านี้ ความรู้จะถูกเลือกจากคลังความรู้ (knowledge store)

จากนั้น ประวัติการแชท ผลการวิเคราะห์ล่วงหน้า ความรู้ที่เกี่ยวข้องกับข้อมูลที่ผู้ใช้ป้อน และความรู้ที่เกี่ยวข้องกับผลการวิเคราะห์ล่วงหน้าจะถูกส่งไปยัง LLM เพื่อรับการตอบสนอง

นอกจากนี้ ผลลัพธ์ที่ LLM ส่งกลับมาก็จะถูกนำไปใช้เพื่อค้นหาความรู้จากคลังความรู้ด้วย รวมถึงความรู้ที่พบในนั้น LLM จะถูกขอให้ทำการตรวจสอบภายหลัง

หากพบปัญหาใดๆ จุดที่มีปัญหาและเหตุผลในการชี้แจงจะถูกรวมไว้และส่งกลับไปยัง LLM สำหรับการแชท

ด้วยการเปิดโอกาสให้เลือกความรู้ในระหว่างการวิเคราะห์ล่วงหน้าและการตรวจสอบภายหลัง เราสามารถเพิ่มโอกาสในการใช้ประโยชน์จากความรู้ที่สะสมไว้ได้

แนวโน้มในอนาคต

แนวทางนี้ในการสร้าง ALIS เริ่มต้นแล้วจึงเพิ่มการปรับปรุงเพื่อแก้ไขจุดอ่อน แสดงให้เห็นถึงการพัฒนาแบบ Agile และการปรับปรุง ALIS แบบค่อยเป็นค่อยไปได้อย่างสมบูรณ์แบบ

นอกจากนี้ ดังที่แสดงให้เห็นแล้ว ALIS เริ่มต้นเหมาะสมที่สุดสำหรับการใช้งานในการพัฒนาซอฟต์แวร์ เนื่องจากเป็นสาขาที่มีความต้องการสูงและยังเป็นสาขาที่สามารถสะสมความรู้ได้อย่างชัดเจนและง่ายดาย

เป็นประเภทที่สิ่งต่างๆ ชัดเจนเป็นขาวหรือดำ แต่ก็เป็นสาขาที่สำคัญที่จำเป็นต้องมีการลองผิดลองถูกและการสะสมความรู้แบบซ้ำๆ

นอกจากนี้ เนื่องจากการพัฒนา ALIS เองก็คือการพัฒนาซอฟต์แวร์ ความจริงที่ว่านักพัฒนา ALIS สามารถเป็นผู้ใช้ ALIS ได้เองก็น่าสนใจเช่นกัน

และควบคู่ไปกับระบบ ALIS, knowledge lake ก็สามารถแบ่งปันได้อย่างเปิดเผยบนแพลตฟอร์มต่างๆ เช่น GitHub

สิ่งนี้จะช่วยให้ผู้คนจำนวนมากสามารถร่วมมือกันในการปรับปรุงระบบ ALIS และการสะสมความรู้ โดยที่ทุกคนได้รับประโยชน์จากผลลัพธ์ ซึ่งจะช่วยเร่งการพัฒนา ALIS ให้เร็วขึ้นไปอีก

แน่นอนว่าการแบ่งปันความรู้ไม่ได้จำกัดอยู่แค่นักพัฒนา ALIS เท่านั้น แต่สามารถรวบรวมได้จากนักพัฒนาซอฟต์แวร์ทุกคนที่ใช้ ALIS

ความจริงที่ว่าความรู้อยู่ในรูปแบบภาษาธรรมชาติยังให้ประโยชน์อีกสองประการ:

ประโยชน์แรกคือ ความรู้สามารถนำไปใช้ประโยชน์ได้แม้ว่าโมเดล LLM จะมีการเปลี่ยนแปลงหรืออัปเดต

ประโยชน์ที่สองคือ knowledge lake ที่สะสมไว้จำนวนมหาศาลสามารถใช้เป็นชุดข้อมูลสำหรับการฝึกอบรมล่วงหน้าสำหรับ LLM ได้ ซึ่งสามารถทำได้สองวิธี: โดยใช้สำหรับการปรับแต่ง (fine-tuning) หรือโดยใช้สำหรับการฝึกอบรม LLM ล่วงหน้าด้วยตัวมันเอง

ไม่ว่าในกรณีใด หากสามารถใช้ประโยชน์จาก LLM ที่ได้เรียนรู้ความรู้ที่สะสมไว้ใน knowledge lake โดยกำเนิดได้ การพัฒนาซอฟต์แวร์ก็จะยิ่งมีประสิทธิภาพมากขึ้น

นอกจากนี้ ภายในวงการพัฒนาซอฟต์แวร์ ยังมีกระบวนการต่างๆ เช่น การวิเคราะห์ความต้องการ, การออกแบบ, การนำไปใช้งาน, การทดสอบ, การปฏิบัติงาน, และการบำรุงรักษา และมีความรู้เฉพาะทางสำหรับแต่ละโดเมนซอฟต์แวร์และแพลตฟอร์ม หากมีการสร้างกลไกเพื่อแบ่งส่วนความรู้ที่สะสมไว้จำนวนมหาศาลจากมุมมองเหล่านี้ ก็สามารถสร้างวง ALIS Orchestra ได้เช่นกัน

ดังนั้น เทคโนโลยีองค์ประกอบสำหรับ ALIS จึงพร้อมแล้ว สิ่งสำคัญตอนนี้คือการลองใช้วิธีการต่างๆ ในทางปฏิบัติ เช่น ความรู้ความเข้าใจในการสกัดความรู้, การเลือกความรู้ที่เหมาะสม, การแบ่งส่วนความรู้เฉพาะทาง, และวิธีการใช้ประโยชน์จากหน่วยความจำสถานะ เพื่อค้นหาวิธีการที่มีประสิทธิภาพ นอกจากนี้ เมื่อความซับซ้อนเพิ่มขึ้น เวลาประมวลผลและค่าใช้จ่ายในการใช้งาน LLM ก็จะเพิ่มขึ้น ซึ่งจำเป็นต้องมีการเพิ่มประสิทธิภาพ

กระบวนการลองผิดลองถูกและการเพิ่มประสิทธิภาพเหล่านี้สามารถดำเนินการได้อย่างปรับตัวผ่านการพัฒนาและการปรับปรุงเฟรมเวิร์ก

ในขั้นต้น นักพัฒนาในฐานะผู้ใช้ อาจจะรวมเฟรมเวิร์กเข้ากับ ALIS ผ่านการลองผิดลองถูก อย่างไรก็ตาม แม้ในขณะนั้น LLM เองก็สามารถถูกทำให้สร้างแนวคิดเฟรมเวิร์กได้

และด้วยการรวมเฟรมเวิร์กเข้ากับ ALIS ที่ปรับปรุงหรือค้นพบเฟรมเวิร์กโดยอิงจากผลลัพธ์ที่ได้รับจากโลกและความรู้ที่สกัดได้ ALIS เองก็จะทำการลองผิดลองถูกและเพิ่มประสิทธิภาพได้อย่างปรับตัว

ALIS ในโลกแห่งความเป็นจริง

เมื่อ ALIS ได้รับการปรับปรุงจนถึงขั้นนี้แล้ว ควรจะมีความสามารถในการเรียนรู้ความรู้ไม่เพียงแต่ในโลกของการพัฒนาซอฟต์แวร์เท่านั้น แต่ยังครอบคลุมโดเมนต่างๆ ได้อย่างกว้างขวาง

เช่นเดียวกับการพัฒนาซอฟต์แวร์ ALIS คาดว่าจะขยายขอบเขตไปยังกิจกรรมทางปัญญาต่างๆ ที่มนุษย์ดำเนินการโดยใช้คอมพิวเตอร์

แม้ในกิจกรรมทางปัญญาล้วนๆ เช่นนี้ ALIS ก็ยังคงมีลักษณะของ AI แบบมีร่าง (embodied AI) ชนิดหนึ่งที่สัมพันธ์กับโลกเป้าหมาย

เป็นเพราะมันรับรู้ถึงขอบเขตระหว่างตัวเองกับโลก กระทำการต่อโลกผ่านขอบเขตนั้น และสามารถรับรู้ข้อมูลที่ได้รับจากโลกได้

สิ่งที่เรามักเรียกว่า "ร่างกาย" คือขอบเขตกับโลกที่สามารถมองเห็นได้ทางกายภาพและอยู่รวมกันในที่เดียว

อย่างไรก็ตาม แม้ว่าขอบเขตนั้นจะมองไม่เห็นและกระจายตัวในอวกาศ โครงสร้างของการรับรู้และการกระทำผ่านขอบเขตนั้นก็เหมือนกับการมีร่างกายทางกายภาพ

ในแง่นั้น ALIS เมื่อดำเนินกิจกรรมทางปัญญา สามารถถือได้ว่ามีลักษณะของ AI แบบมีร่างเสมือนจริง (virtually embodied AI)

และเมื่อ ALIS ได้รับการปรับปรุงจนถึงขั้นที่สามารถเรียนรู้ได้อย่างเหมาะสมแม้ในโลกใหม่ๆ ที่ไม่รู้จัก ก็มีความเป็นไปได้ที่ ALIS จะสามารถถูกรวมเข้าเป็นส่วนหนึ่งของ AI แบบมีร่างจริงที่ครอบครองร่างกายทางกายภาพได้

ด้วยวิธีนี้ ALIS ในที่สุดจะถูกนำไปประยุกต์ใช้กับโลกแห่งความเป็นจริงและจะเริ่มเรียนรู้จากโลกนั้น