ในที่นี้ ข้าพเจ้าขอจัดระเบียบระบบปัญญาประดิษฐ์การเรียนรู้ (Artificial Learning Intelligence System: ALIS) โดยให้รายละเอียดเกี่ยวกับแนวคิด หลักการ การออกแบบพื้นฐาน และระเบียบวิธีพัฒนา
แนวคิด
AI เชิงสร้างสรรค์ในปัจจุบัน โดยเฉพาะแบบจำลองภาษาขนาดใหญ่ ได้รับการฝึกอบรมโดยอิงจากการเรียนรู้แบบมีผู้สอนที่ใช้โครงข่ายประสาทเทียมเป็นหลัก
ในฐานะกระบวนการเรียนรู้ เรานิยามการเรียนรู้ของโครงข่ายประสาทเทียมนี้ว่าเป็นการเรียนรู้โดยกำเนิด
ALIS ผสานกระบวนการการเรียนรู้ที่ได้รับมา ซึ่งแยกจากการเรียนรู้โดยกำเนิด เพื่อให้สามารถทำการอนุมานที่รวมกระบวนการเรียนรู้ทั้งสองเข้าด้วยกัน
ในการเรียนรู้ที่ได้รับมานี้ ความรู้ที่เรียนรู้จะถูกสะสมภายนอกโครงข่ายประสาทเทียมและนำไปใช้ในระหว่างการอนุมาน
ดังนั้น แกนหลักทางเทคนิคของ ALIS จึงอยู่ที่การดึง การจัดเก็บ และการเลือกใช้ความรู้ที่นำกลับมาใช้ใหม่ได้ในระหว่างการอนุมาน
นอกจากนี้ ALIS ไม่ได้เป็นเพียงเทคโนโลยีองค์ประกอบเดียว แต่เป็นเทคโนโลยีระบบที่รวมการเรียนรู้โดยกำเนิดและการเรียนรู้ที่ได้รับมาเข้าด้วยกัน
องค์ประกอบของระบบปัญญาประดิษฐ์การเรียนรู้
ALIS ดำเนินงานภายใต้หลักการที่ว่า ทั้งการเรียนรู้โดยกำเนิดที่มีอยู่และการเรียนรู้ที่ได้รับมาที่พิจารณาในอนาคต ล้วนปฏิบัติตามกรอบการเรียนรู้และการอนุมานเดียวกัน
เพื่ออธิบายหลักการเรียนรู้ใน ALIS เราจึงกำหนดองค์ประกอบห้าประการของระบบปัญญาประดิษฐ์การเรียนรู้ดังนี้
ประการแรกคือ หน่วยประมวลผลอัจฉริยะ ซึ่งหมายถึงระบบประมวลผลที่ทำการอนุมานโดยใช้ความรู้และดึงความรู้สำหรับการเรียนรู้
แบบจำลองภาษาขนาดใหญ่ (LLMs) และส่วนหนึ่งของสมองมนุษย์เป็นตัวอย่างสำคัญของหน่วยประมวลผลอัจฉริยะ
ประการที่สองคือ แหล่งเก็บความรู้ ซึ่งหมายถึงที่จัดเก็บที่สามารถบันทึกและเรียกใช้ความรู้ที่สกัดออกมาได้ตามต้องการ
ใน LLMs แหล่งเก็บความรู้ประกอบด้วยพารามิเตอร์ของโครงข่ายประสาทเทียม ในมนุษย์ แหล่งเก็บความรู้จะสอดคล้องกับความจำระยะยาวในสมอง
ประการที่สามคือ โลก ซึ่งหมายถึงสภาพแวดล้อมภายนอกตามที่ระบบปัญญาประดิษฐ์การเรียนรู้ เช่น มนุษย์หรือ ALIS รับรู้
สำหรับมนุษย์ โลกคือความเป็นจริงนั่นเอง ในกรณีของ LLMs กลไกที่รับผลลัพธ์จาก LLM และให้ข้อเสนอแนะกลับไปยัง LLM สามารถถือได้ว่าเทียบเท่ากับโลก
ประการที่สี่คือ หน่วยความจำสถานะ ซึ่งหมายถึงส่วนประกอบคล้ายหน่วยความจำชั่วคราวภายในที่ระบบปัญญาประดิษฐ์การเรียนรู้ใช้ในระหว่างการอนุมาน
ใน LLMs นี่คือพื้นที่หน่วยความจำที่ใช้ระหว่างการอนุมาน ซึ่งเรียกว่าสถานะซ่อนเร้น ในมนุษย์ จะสอดคล้องกับความจำระยะสั้น
ประการที่ห้าคือ เฟรมเวิร์ก หรือที่เรียกกันว่าโครงสร้างการคิด ในแง่ของระบบปัญญาประดิษฐ์การเรียนรู้ หมายถึงเกณฑ์สำหรับการเลือกความรู้ที่จำเป็นในระหว่างการอนุมานและโครงสร้างพื้นที่สถานะเชิงตรรกะสำหรับการจัดระเบียบหน่วยความจำสถานะ
ใน LLMs มันคือโครงสร้างความหมายของสถานะซ่อนเร้น และเนื้อหาของมันโดยทั่วไปกำกวมและมนุษย์ไม่สามารถเข้าใจได้ นอกจากนี้ การเลือกความรู้ยังถูกฝังอยู่ในกลไกการให้ความสนใจ ซึ่งจะเลือกโทเค็นที่มีอยู่ที่จะอ้างอิงสำหรับแต่ละโทเค็นที่กำลังประมวลผล
ในมนุษย์ ดังที่กล่าวมาข้างต้น มันคือโครงสร้างการคิด เมื่อคิดโดยใช้เฟรมเวิร์กเฉพาะ ชุดความรู้เฉพาะจะถูกเรียกคืนจากความจำระยะยาวและโหลดเข้าสู่ความจำระยะสั้น จากนั้น ข้อมูลที่รับรู้ในปัจจุบันจะถูกจัดระเบียบตามเฟรมเวิร์กการคิดเพื่อทำความเข้าใจสถานการณ์
หลักการของระบบปัญญาประดิษฐ์การเรียนรู้
ระบบปัญญาประดิษฐ์การเรียนรู้ทำงานดังนี้:
หน่วยประมวลผลอัจฉริยะจะกระทำต่อโลก โลกจะตอบสนองต่อการกระทำนี้ด้วยการส่งผลลัพธ์กลับมา
หน่วยประมวลผลอัจฉริยะจะดึงความรู้ที่นำกลับมาใช้ใหม่ได้จากผลลัพธ์เหล่านี้และจัดเก็บไว้ในแหล่งเก็บความรู้
เมื่อกระทำต่อโลกซ้ำๆ หน่วยประมวลผลอัจฉริยะจะเลือกความรู้จากแหล่งเก็บความรู้และใช้เพื่อปรับเปลี่ยนการกระทำของมัน
นี่คือกลไกพื้นฐาน
อย่างไรก็ตาม โดยพื้นฐานแล้ว วิธีการดึง จัดเก็บ เลือก และใช้ความรู้จะเป็นตัวกำหนดว่าระบบสามารถเรียนรู้ได้อย่างมีความหมายหรือไม่
มนุษย์มีกลไกที่จัดการการดึง จัดเก็บ เลือก และใช้ความรู้เหล่านี้ได้อย่างมีประสิทธิภาพ ทำให้พวกเขาสามารถเรียนรู้ได้
โครงข่ายประสาทเทียม รวมถึง LLMs มีกระบวนการดึงความรู้ที่จัดการโดยผู้สอนภายนอก แต่พวกเขามีกลไกสำหรับการจัดเก็บ การเลือก และการใช้งาน ซึ่งช่วยให้พวกเขาสามารถเรียนรู้ได้ตราบเท่าที่ได้รับผู้สอน
นอกจากนี้ ระบบปัญญาประดิษฐ์การเรียนรู้ยังสามารถเรียนรู้การดึง จัดเก็บ และเลือกเฟรมเวิร์ก ตลอดจนวิธีการใช้งานภายในหน่วยความจำสถานะในฐานะความรู้ ซึ่งจะช่วยให้สามารถเรียนรู้ที่ซับซ้อนยิ่งขึ้นได้
ประเภทของความรู้
จากหลักการเหล่านี้ เมื่อออกแบบการเรียนรู้ที่ได้รับมา จำเป็นต้องชี้แจงว่าความรู้ที่ได้รับมาจะอยู่ในรูปแบบใด
เราอาจพิจารณาวิธีการที่ความรู้ที่ได้รับมาจะถูกเรียนรู้แยกต่างหากเป็นพารามิเตอร์ของโครงข่ายประสาทเทียม
อย่างไรก็ตาม ความรู้ที่ได้รับมาไม่จำเป็นต้องจำกัดอยู่แค่พารามิเตอร์ของโครงข่ายประสาทเทียมเท่านั้น ผู้สมัครที่ใช้งานได้จริงคือความรู้ที่ถูกแปลงเป็นข้อความในภาษาธรรมชาติ
ความรู้ที่ถูกแปลงเป็นข้อความในภาษาธรรมชาติสามารถถูกดึงและนำไปใช้ประโยชน์ได้โดยอาศัยความสามารถในการประมวลผลภาษาธรรมชาติของ LLMs นอกจากนี้ เนื่องจากสามารถจัดการเป็นข้อมูลในระบบ IT มาตรฐานได้ การจัดเก็บและการเลือกจึงง่ายเช่นกัน
ยิ่งไปกว่านั้น ความรู้ที่ถูกแปลงเป็นข้อความในภาษาธรรมชาติยังง่ายสำหรับมนุษย์และ LLMs อื่น ๆ ในการตรวจสอบ ทำความเข้าใจ และในบางกรณีก็สามารถแก้ไขเนื้อหาได้อีกด้วย
นอกจากนี้ยังสามารถแบ่งปัน รวม หรือแยกกับระบบปัญญาประดิษฐ์การเรียนรู้ระบบอื่น ๆ ได้
ด้วยเหตุผลเหล่านี้ ความรู้ที่ได้รับมาในแนวคิด ALIS จึงจะได้รับการออกแบบเบื้องต้นเพื่อเป้าหมายความรู้ที่ถูกแปลงเป็นข้อความในภาษาธรรมชาติ
หน่วยความจำสถานะที่ได้รับมาและเฟรมเวิร์ก
เราได้อธิบายข้อดีของการเลือกใช้ข้อความภาษาธรรมชาติเป็นรูปแบบสำหรับความรู้ที่ได้รับมา
ในทำนองเดียวกัน ข้อความภาษาธรรมชาติยังสามารถนำมาใช้สำหรับหน่วยความจำสถานะและเฟรมเวิร์กสำหรับการอนุมานได้อีกด้วย
เฟรมเวิร์กในฐานะโครงสร้างเชิงแนวคิด สามารถจัดเก็บและนำไปใช้ในแหล่งเก็บความรู้เป็นความรู้ที่ถูกแปลงเป็นข้อความในภาษาธรรมชาติได้
แม้ในขณะที่เริ่มต้นหรืออัปเดตสถานะตามโครงสร้างที่กำหนดโดยเฟรมเวิร์ก ก็สามารถใช้หน่วยความจำสถานะในรูปแบบข้อความได้
ด้วยการออกแบบไม่เพียงแต่ความรู้ที่ได้รับมาเท่านั้น แต่ยังรวมถึงเฟรมเวิร์กและหน่วยความจำสถานะให้อยู่ในรูปแบบข้อความ ALIS จึงสามารถใช้ประโยชน์จากความสามารถในการประมวลผลภาษาธรรมชาติของ LLMs สำหรับการเรียนรู้ที่ได้รับมาและการอนุมานโดยทั่วไปได้
ความรู้เชิงรูปแบบ
ความรู้ที่ได้รับมา, เฟรมเวิร์ก และหน่วยความจำสถานะ ไม่เพียงแต่สามารถแสดงออกด้วยข้อความภาษาธรรมชาติเท่านั้น แต่ยังสามารถแสดงออกด้วยภาษาเชิงรูปแบบหรือแบบจำลองเชิงรูปแบบที่เข้มงวดมากขึ้นได้ด้วย
แม้ว่าข้าพเจ้าจะเขียนว่า "เลือก" แต่เป้าหมายของ ALIS คือการรวมกลไกการเรียนรู้ความรู้ที่ได้รับมาที่แตกต่างกันหลายแบบ เพื่อให้สามารถใช้การเรียนรู้โดยกำเนิดและการเรียนรู้ที่ได้รับมาแบบผสมผสานได้
ความรู้ที่แสดงด้วยภาษาเชิงรูปแบบหรือแบบจำลองเชิงรูปแบบสามารถทำให้แม่นยำและชัดเจนยิ่งขึ้นได้
นอกจากนี้ หากเฟรมเวิร์กถูกแสดงออกโดยใช้ภาษาเชิงรูปแบบหรือแบบจำลอง และสถานะเริ่มต้นถูกคลี่ออกในหน่วยความจำสถานะ การจำลองหรือการพัฒนาเชิงตรรกะก็สามารถทำได้ด้วยแบบจำลองที่เข้มงวด โดยหน่วยประมวลผลอัจฉริยะที่สามารถประมวลผลแบบจำลองเชิงรูปแบบได้ แทนที่จะเป็น LLM
ตัวอย่างสำคัญของภาษาเชิงรูปแบบหรือแบบจำลองเชิงรูปแบบดังกล่าวคือภาษาโปรแกรม
เมื่อระบบเรียนรู้เกี่ยวกับโลก หากสามารถแสดงกฎหมายและแนวคิดที่พบในนั้นเป็นโปรแกรมในเฟรมเวิร์ก ก็จะสามารถจำลองสิ่งเหล่านั้นบนคอมพิวเตอร์ได้
คอลัมน์ที่ 1: ประเภทของความรู้
เมื่อจัดระเบียบความรู้ภายในระบบปัญญาประดิษฐ์การเรียนรู้ จะเห็นได้ชัดว่าสามารถแบ่งออกเป็น 3 ระบบความรู้และ 2 ประเภทสถานะ
ระบบความรู้ทั้งสาม ได้แก่ ความรู้พารามิเตอร์โครงข่าย ที่จัดการโดยโครงข่ายประสาทเทียม; ความรู้ธรรมชาติ ที่แสดงออกด้วยภาษาธรรมชาติ; และความรู้เชิงรูปแบบ ที่แสดงออกด้วยภาษาเชิงรูปแบบ
ประเภทสถานะทั้งสอง ได้แก่ ไร้สถานะและมีสถานะ
ความรู้พารามิเตอร์โครงข่ายแบบไร้สถานะ คือความรู้ที่ใช้งานง่าย เช่นที่พบใน AI การเรียนรู้เชิงลึก คุณลักษณะของแมวและสุนัข ซึ่งไม่สามารถคิดหรือระบุด้วยวาจาได้อย่างชัดเจน สามารถเรียนรู้เป็นความรู้พารามิเตอร์โครงข่ายแบบไร้สถานะได้
ความรู้พารามิเตอร์โครงข่ายแบบมีสถานะ คือความรู้ที่เกิดขึ้นผ่านกระบวนการทำซ้ำที่ไม่ชัดเจน เช่นใน AI เชิงสร้างสรรค์
ความรู้ธรรมชาติแบบไร้สถานะ คือความรู้คล้ายความหมายที่ผูกติดอยู่กับคำแต่ละคำ
ความรู้ธรรมชาติแบบมีสถานะ คือความรู้ที่รวมบริบทภายในประโยค
ความรู้ธรรมชาติบางอย่างถูกรวมอยู่ในความรู้พารามิเตอร์โครงข่ายแบบมีสถานะโดยกำเนิด แต่ก็มีความรู้ที่สามารถได้รับจากข้อความภาษาธรรมชาติได้เช่นกัน
ความรู้เชิงรูปแบบแบบไร้สถานะ คือความรู้ที่สามารถแสดงออกด้วยสูตรทางคณิตศาสตร์โดยไม่ต้องมีการวนซ้ำ ความรู้เชิงรูปแบบแบบมีสถานะ คือความรู้ที่สามารถแสดงออกเป็นโปรแกรมได้
เรายังสามารถใช้หน่วยความจำระยะสั้นของตนเองเป็นหน่วยความจำสถานะสำหรับความรู้ธรรมชาติและความรู้เชิงรูปแบบได้
อย่างไรก็ตาม เนื่องจากเป็นหน่วยความจำระยะสั้น จึงมีปัญหาว่าการรักษาสถานะให้คงที่ทำได้ยาก นอกจากนี้ ยังไม่ถนัดในการรักษาสถานะที่เป็นทางการและไม่กำกวม
ในทางกลับกัน กระดาษ คอมพิวเตอร์ และสมาร์ทโฟนสามารถใช้เป็นหน่วยความจำสถานะเพื่อจดบันทึกหรือแก้ไขข้อความภาษาธรรมชาติ ภาษาเชิงรูปแบบ หรือแบบจำลองเชิงรูปแบบได้
โดยทั่วไปแล้ว ข้อมูลบนกระดาษหรือคอมพิวเตอร์มักถูกมองว่าเป็นแหล่งเก็บความรู้สำหรับจดจำความรู้ แต่ก็สามารถใช้เป็นหน่วยความจำสถานะสำหรับการจัดระเบียบความคิดได้เช่นกัน
ดังนั้น จึงเห็นได้ชัดว่ามนุษย์ดำเนินกิจกรรมทางปัญญาโดยใช้ประโยชน์จากระบบความรู้ทั้งสามประเภทและสองประเภทสถานะเหล่านี้อย่างเต็มที่
ALIS ก็เช่นกัน มีศักยภาพที่จะเพิ่มขีดความสามารถของตนเองอย่างมากโดยการเปิดใช้งานและเสริมสร้างกิจกรรมทางปัญญาที่ใช้ประโยชน์จากระบบความรู้ทั้งสามประเภทและสองประเภทสถานะเหล่านี้
โดยเฉพาะอย่างยิ่ง ALIS มีจุดแข็งในการสามารถใช้แหล่งเก็บความรู้และหน่วยความจำสถานะที่กว้างขวาง นอกจากนี้ยังสามารถทำงานทางปัญญาได้อย่างง่ายดายโดยการเตรียมแต่ละส่วนจำนวนมากและสลับหรือรวมเข้าด้วยกัน
คอลัมน์ที่ 2: การประสานงานอัจฉริยะ
แม้ว่าการสามารถสะสมความรู้จำนวนมากในแหล่งเก็บความรู้จะมีข้อดี แต่ปริมาณความรู้ไม่ได้แปลไปสู่ข้อได้เปรียบในกิจกรรมทางปัญญาโดยตรง เนื่องจากข้อจำกัดเกี่ยวกับจำนวนโทเค็นที่ AI เชิงสร้างสรรค์สามารถประมวลผลได้ในครั้งเดียว และสัญญาณรบกวนที่เกิดจากความรู้ที่ไม่เกี่ยวข้อง
ในทางกลับกัน การแบ่งแหล่งเก็บความรู้ให้เหมาะสมและแปลงเป็นแหล่งเก็บความรู้เฉพาะทางที่มีความหนาแน่นสูง โดยแต่ละส่วนจะบรรจุความรู้ที่จำเป็นสำหรับงานทางปัญญาเฉพาะ สามารถบรรเทาปัญหาข้อจำกัดโทเค็นและสัญญาณรบกวนได้
แต่ก็แลกมาด้วยการที่แหล่งเก็บความรู้เฉพาะทางแต่ละส่วนจะสามารถนำไปใช้ได้เฉพาะกับงานทางปัญญาที่กำหนดเท่านั้น
กิจกรรมทางปัญญาหลายอย่างเป็นกิจกรรมที่ซับซ้อนซึ่งประกอบด้วยงานทางปัญญาหลายประเภท ดังนั้น ด้วยการแบ่งความรู้เป็นแหล่งเก็บความรู้เฉพาะทางตามประเภทของงานทางปัญญา และการแบ่งย่อยกิจกรรมทางปัญญาออกเป็นงานแต่ละส่วน ALIS จึงสามารถดำเนินกิจกรรมทางปัญญาทั้งหมดได้โดยการสลับระหว่างแหล่งเก็บความรู้เฉพาะทางเหล่านี้อย่างเหมาะสม
สิ่งนี้เปรียบได้กับวงออร์เคสตรา ซึ่งประกอบด้วยนักดนตรีมืออาชีพที่เล่นเครื่องดนตรีต่างกัน และวาทยกรที่นำวง
ผ่านเทคโนโลยีระบบนี้ ซึ่งคือการประสานงานอัจฉริยะ ALIS จะสามารถจัดระเบียบกิจกรรมทางปัญญาของตนได้
การออกแบบพื้นฐานและระเบียบวิธีพัฒนา ALIS
จากนี้ไป เราจะจัดระเบียบการพัฒนา ALIS
ดังที่ได้กล่าวไปแล้วในหลักการและคอลัมน์ ALIS ได้รับการออกแบบมาโดยธรรมชาติเพื่อให้ง่ายต่อการขยายฟังก์ชันและทรัพยากร ทั้งนี้เป็นเพราะแก่นแท้ของ ALIS ไม่ได้อยู่ที่ฟังก์ชันเฉพาะ แต่เป็นกระบวนการของการดึง จัดเก็บ เลือก และใช้ความรู้
ตัวอย่างเช่น สามารถจัดหากลไกการดึงความรู้ได้หลายประเภท และการออกแบบระบบจะช่วยให้สามารถเลือกใช้หรือใช้พร้อมกันได้อย่างอิสระ
นอกจากนี้ ALIS เองก็สามารถถูกทำให้ดำเนินการเลือกนี้ได้
ในทำนองเดียวกัน การจัดเก็บ การเลือก และการใช้งานก็สามารถเลือกหรือทำงานขนานกันได้อย่างอิสระ
ดังนั้น ALIS จึงสามารถพัฒนาได้แบบค่อยเป็นค่อยไปและคล่องตัว โดยไม่จำเป็นต้องออกแบบฟังก์ชันการทำงานทั้งหมดในลักษณะน้ำตก
จุดเริ่มต้นของ ALIS
ตอนนี้ เรามาออกแบบ ALIS ที่เรียบง่ายกัน
UI พื้นฐานจะเป็นแชท AI ที่คุ้นเคย ในตอนแรก ข้อมูลที่ผู้ใช้ป้อนจะถูกส่งผ่านโดยตรงไปยัง LLM การตอบสนองของ LLM จะแสดงบน UI และระบบจะรอข้อมูลที่ผู้ใช้ป้อนถัดไป
เมื่อได้รับข้อมูลที่ป้อนถัดไป LLM จะได้รับไม่เพียงข้อมูลใหม่เท่านั้น แต่ยังรวมถึงประวัติการสนทนาทั้งหมดระหว่างผู้ใช้และ LLM ด้วย
เบื้องหลัง UI ของแชท AI นี้ มีกลไกที่เตรียมไว้เพื่อดึงความรู้ที่นำกลับมาใช้ใหม่ได้จากประวัติการสนทนา
กลไกนี้สามารถเพิ่มเข้าไปในระบบแชท AI เป็นกระบวนการที่ทำงานเมื่อการสนทนาสิ้นสุดลง หรือในช่วงเวลาปกติ แน่นอนว่า LLM ถูกนำมาใช้ในการดึงความรู้
LLM นี้จะได้รับแนวคิดและหลักการของ ALIS พร้อมกับความรู้ในการดึงความรู้ เป็น system prompt หากความรู้ไม่ถูกดึงออกมาตามที่ตั้งใจไว้ system prompt ควรได้รับการปรับปรุงผ่านการลองผิดลองถูก
ความรู้ที่ดึงมาจากประวัติการสนทนาจะถูกจัดเก็บโดยตรงในทะเลสาบความรู้ ทะเลสาบความรู้เป็นเพียงกลไกสำหรับการจัดเก็บความรู้ในสภาพแบนราบก่อนที่จะถูกจัดโครงสร้าง
ถัดไป กลไกการจัดโครงสร้างจะถูกเตรียมไว้เพื่อให้ง่ายต่อการเลือกความรู้จากทะเลสาบความรู้
ซึ่งเกี่ยวข้องกับการจัดหา embedding vector store สำหรับการค้นหาเชิงความหมาย ดังที่ใช้ใน RAG ทั่วไป และดัชนีคีย์เวิร์ด
ความเป็นไปได้อื่นๆ รวมถึงการสร้างกราฟความรู้ที่ซับซ้อนยิ่งขึ้น หรือการจัดหมวดหมู่
ชุดข้อมูลที่มีโครงสร้างนี้สำหรับทะเลสาบความรู้จะถูกเรียกว่าฐานความรู้ ฐานความรู้และทะเลสาบความรู้ทั้งหมดนี้จะประกอบขึ้นเป็นแหล่งเก็บความรู้
ถัดไป แหล่งเก็บความรู้จะถูกรวมเข้ากับการประมวลผลของ UI แชท
สิ่งนี้โดยพื้นฐานแล้วเหมือนกับกลไก RAG ทั่วไป สำหรับข้อมูลที่ผู้ใช้ป้อน ความรู้ที่เกี่ยวข้องจะถูกเลือกจากแหล่งเก็บความรู้และส่งผ่านไปยัง LLM พร้อมกับข้อมูลที่ผู้ใช้ป้อน
สิ่งนี้ช่วยให้ LLM ใช้ความรู้โดยอัตโนมัติเมื่อประมวลผลข้อมูลที่ผู้ใช้ป้อน
ด้วยวิธีนี้ ความรู้จะเพิ่มขึ้นกับการสนทนาแต่ละครั้งกับผู้ใช้ ทำให้สามารถสร้าง ALIS ที่เรียบง่ายที่ใช้ความรู้ที่สะสมมาจากการสนทนาในอดีตได้
สถานการณ์จำลองอย่างง่าย
ยกตัวอย่างเช่น ลองจินตนาการถึงสถานการณ์ที่ผู้ใช้กำลังพัฒนาเว็บแอปพลิเคชันโดยใช้ ALIS แบบง่ายนี้
ผู้ใช้อาจแจ้งว่าโค้ดที่ LLM เสนอมานั้นมีข้อผิดพลาด จากนั้นผู้ใช้และ LLM จะร่วมมือกันเพื่อแก้ไขปัญหา สมมติว่าพวกเขาพบว่าข้อมูลจำเพาะ API ภายนอกที่ LLM รู้จักนั้นล้าสมัย และเมื่อปรับให้เข้ากับข้อมูลจำเพาะ API ล่าสุด ปัญหาก็ได้รับการแก้ไข
ในกรณีนี้ ความรู้ที่ว่าข้อมูลจำเพาะ API ของ LLM ล้าสมัย และข้อมูลจำเพาะ API ล่าสุดเป็นอย่างไร สามารถสะสมไว้ในแหล่งเก็บความรู้จากการสนทนานี้ได้
จากนั้น เมื่อสร้างโปรแกรมที่ใช้ API เดียวกันในครั้งต่อไป ALIS สามารถใช้ประโยชน์จากความรู้นี้เพื่อสร้างโปรแกรมโดยอิงจากข้อมูลจำเพาะ API ล่าสุดได้ตั้งแต่เริ่มต้น
การปรับปรุง ALIS เริ่มต้น
อย่างไรก็ตาม เพื่อให้สิ่งนี้เกิดขึ้น ความรู้นี้จำเป็นต้องถูกเลือกเพื่อตอบสนองต่อข้อมูลที่ผู้ใช้ป้อน อาจเป็นไปได้ว่าความรู้นี้ไม่ได้เชื่อมโยงโดยตรงกับข้อมูลที่ผู้ใช้ป้อน เนื่องจากชื่อของ API ที่มีปัญหาไม่น่าจะปรากฏในข้อมูลที่ผู้ใช้ป้อนในตอนแรก
ในกรณีเช่นนี้ ชื่อ API จะปรากฏขึ้นเป็นครั้งแรกในการตอบสนองของ LLM เท่านั้น
ดังนั้น เราจะขยาย ALIS แบบง่ายเล็กน้อยโดยเพิ่มกลไกสำหรับความคิดเห็นก่อนการตรวจสอบและความคิดเห็นหลังการตรวจสอบ
ความคิดเห็นก่อนการตรวจสอบคล้ายกับ "โหมดความคิด" ล่าสุดใน LLMs เราเตรียมหน่วยความจำที่สามารถเก็บข้อความเป็นหน่วยความจำสถานะ และสั่งให้ LLM ผ่าน system prompt ให้ทำการความคิดเห็นก่อนการตรวจสอบเมื่อได้รับข้อมูลที่ผู้ใช้ป้อน
ผลลัพธ์ความคิดเห็นก่อนการตรวจสอบของ LLM จะถูกวางไว้ในหน่วยความจำสถานะ และจากผลลัพธ์นี้ ความรู้จะถูกเลือกจากแหล่งเก็บความรู้
จากนั้น ประวัติการสนทนา ผลลัพธ์ความคิดเห็นก่อนการตรวจสอบ ความรู้ที่สอดคล้องกับข้อมูลที่ผู้ใช้ป้อน และความรู้ที่สอดคล้องกับผลลัพธ์ความคิดเห็นก่อนการตรวจสอบ จะถูกส่งไปยัง LLM เพื่อรับผลลัพธ์
นอกจากนี้ สำหรับผลลัพธ์ที่ LLM ส่งคืน ความรู้จะถูกค้นหาในแหล่งเก็บความรู้ รวมถึงความรู้ใด ๆ ที่พบที่นั่น LLM จะถูกขอให้ทำการตรวจสอบหลังการทำงาน
หากพบปัญหาใด ๆ ปัญหาเหล่านั้นจะถูกส่งกลับไปยัง LLM แชทพร้อมกับจุดที่มีปัญหาและเหตุผลสำหรับข้อเสนอแนะ
ด้วยการจัดหาโอกาสในการเลือกความรู้ในระหว่างความคิดเห็นก่อนการตรวจสอบและความคิดเห็นหลังการตรวจสอบ เราสามารถเพิ่มโอกาสในการใช้ประโยชน์จากความรู้ที่สะสมได้
ภาพรวม
กระบวนการสร้าง ALIS เริ่มต้นและการเพิ่มการปรับปรุงเพื่อแก้ไขจุดอ่อนนั้นเป็นไปตามการพัฒนาแบบ Agile อย่างแท้จริง ซึ่งแสดงให้เห็นว่า ALIS สามารถได้รับการปรับปรุงอย่างต่อเนื่องได้
นอกจากนี้ ดังที่ได้ยกตัวอย่างไปแล้ว ALIS เริ่มต้นนั้นเหมาะสมที่สุดสำหรับการใช้งานในการพัฒนาซอฟต์แวร์ เนื่องจากเป็นสาขาที่มีความต้องการสูงและเป็นสาขาที่สามารถสะสมความรู้ได้อย่างชัดเจน
เป็นโดเมนที่ผลลัพธ์ไม่กำกวม แต่จำเป็นและได้รับประโยชน์อย่างมากจากการลองผิดลองถูกและการสะสมความรู้แบบวนซ้ำ
ยิ่งไปกว่านั้น เนื่องจากการพัฒนา ALIS เองก็คือการพัฒนาซอฟต์แวร์ การที่นักพัฒนา ALIS สามารถเป็นผู้ใช้ ALIS ได้ด้วยนั้นก็เป็นอีกหนึ่งจุดที่น่าสนใจ
นอกจากนี้ ระบบ ALIS และคลังความรู้สามารถแบ่งปันกันได้อย่างเปิดเผยบนแพลตฟอร์มเช่น GitHub
สิ่งนี้จะช่วยให้บุคคลจำนวนมากมีส่วนร่วมในการปรับปรุงระบบ ALIS และการสะสมความรู้ โดยทุกคนจะได้รับประโยชน์และเร่งการพัฒนา ALIS ได้อย่างมีประสิทธิภาพยิ่งขึ้น
แน่นอนว่าการแบ่งปันความรู้ไม่ได้จำกัดอยู่เฉพาะนักพัฒนา ALIS เท่านั้น แต่ยังสามารถรวบรวมจากนักพัฒนาซอฟต์แวร์ทุกคนที่ใช้ ALIS ได้ด้วย
ลักษณะที่เป็นภาษาธรรมชาติของความรู้มีข้อดีเพิ่มเติมอีกสองประการ
ข้อดีประการแรกคือ ความรู้ยังคงสามารถนำไปใช้ได้แม้ว่าโมเดล LLM จะเปลี่ยนแปลงหรือได้รับการอัปเดต
ข้อดีประการที่สองคือ คลังความรู้ที่สะสมมาอย่างมหาศาลสามารถนำไปใช้เป็นชุดข้อมูลสำหรับ Pre-training ของ LLMs ได้ มีสองวิธีในการใช้งาน: เป็น Fine-tuning หรือสำหรับการ Pre-training ของ LLM เอง
ไม่ว่าในกรณีใด หากสามารถใช้ LLM ที่เรียนรู้โดยกำเนิดจากความรู้ที่สะสมอยู่ในคลังความรู้ได้ การพัฒนาซอฟต์แวร์ก็จะยิ่งมีประสิทธิภาพมากขึ้น
นอกจากนี้ การพัฒนาซอฟต์แวร์ยังเกี่ยวข้องกับกระบวนการต่างๆ เช่น การวิเคราะห์ความต้องการ การออกแบบ การนำไปใช้งาน การทดสอบ การดำเนินงาน และการบำรุงรักษา และยังมีความรู้เฉพาะทางสำหรับแต่ละโดเมนและแพลตฟอร์มของซอฟต์แวร์ ด้วยการสร้างกลไกเพื่อแบ่งความรู้ที่สะสมมาอย่างมหาศาลจากมุมมองเหล่านี้ ก็สามารถสร้าง ALIS Orchestra ได้
ดังนั้น เทคโนโลยีพื้นฐานสำหรับ ALIS จึงพร้อมใช้งาน ขั้นตอนสำคัญที่เหลืออยู่คือการทดลองใช้หลากหลายวิธีในทางปฏิบัติ เช่น ความรู้ในการดึงความรู้ การเลือกความรู้ที่เหมาะสม การแบ่งส่วนความรู้เฉพาะทาง และการใช้ประโยชน์จากหน่วยความจำสถานะ เพื่อค้นหาวิธีการที่มีประสิทธิภาพ เมื่อความซับซ้อนเพิ่มขึ้น เวลาประมวลผลและค่าใช้จ่ายในการใช้ LLM ก็จะเพิ่มขึ้นด้วย ซึ่งจำเป็นต้องมีการปรับให้เหมาะสม
กระบวนการลองผิดลองถูกและการปรับให้เหมาะสมเหล่านี้สามารถพัฒนาในลักษณะที่มุ่งเน้นการเรียนรู้ผ่านการพัฒนาและการปรับปรุงเฟรมเวิร์ก
ในขั้นต้น นักพัฒนาในฐานะผู้ใช้ น่าจะรวมเฟรมเวิร์กเข้ากับ ALIS ผ่านการลองผิดลองถูก อย่างไรก็ตาม แม้ในขณะนั้น LLM เองก็สามารถได้รับมอบหมายให้สร้างแนวคิดเฟรมเวิร์กได้
จากนั้น โดยการรวมเฟรมเวิร์กสำหรับการปรับปรุงและค้นพบเฟรมเวิร์กเข้ากับ ALIS โดยอิงจากผลลัพธ์ที่ได้รับจากโลกและความรู้ที่ดึงออกมา ALIS เองก็จะทำการลองผิดลองถูกและการปรับให้เหมาะสมในลักษณะที่ขับเคลื่อนด้วยการเรียนรู้
ALIS ในโลกแห่งความเป็นจริง
เมื่อ ALIS ได้รับการปรับปรุงให้ถึงขั้นตอนนี้แล้ว ควรจะมีความสามารถในการรับความรู้ในหลากหลายโดเมน ไม่จำกัดอยู่เพียงโลกของการพัฒนาซอฟต์แวร์เท่านั้น
เช่นเดียวกับการพัฒนาซอฟต์แวร์ ALIS คาดว่าจะขยายขอบเขตการประยุกต์ใช้ไปยังกิจกรรมทางปัญญาต่างๆ ที่มนุษย์ดำเนินการโดยใช้คอมพิวเตอร์
แม้แต่ในกิจกรรมทางปัญญาที่บริสุทธิ์เช่นนี้ ALIS ก็จะมีความสามารถที่คล้ายคลึงกับ AI แบบมีร่างกายสัมพันธ์กับโลกเป้าหมายของมัน
เป็นเพราะมันรับรู้ถึงขอบเขตระหว่างตัวเองกับโลก ทำการกระทำต่อโลกผ่านขอบเขตนั้น และสามารถรับรู้ข้อมูลที่ได้รับจากโลกได้
เมื่อขอบเขตกับโลกนี้สามารถมองเห็นได้ด้วยกายภาพและอยู่รวมกันในที่เดียว เรามักจะเรียกสิ่งนั้นว่าร่างกาย
อย่างไรก็ตาม แม้ว่าขอบเขตจะมองไม่เห็นและกระจายตัวในเชิงพื้นที่ โครงสร้างของการรับรู้และการกระทำผ่านขอบเขตก็ยังคงเหมือนเดิมกับการมีร่างกายทางกายภาพ
ในแง่นี้ ALIS ที่ดำเนินกิจกรรมทางปัญญาสามารถถือได้ว่ามีลักษณะของ AI แบบมีร่างกายเสมือนจริง
และหาก ALIS ได้รับการปรับปรุงให้ถึงขั้นที่สามารถเรียนรู้ได้อย่างเหมาะสมแม้ในโลกใหม่ที่ไม่รู้จัก ก็มีความเป็นไปได้ที่ ALIS จะสามารถถูกรวมเข้าเป็นส่วนหนึ่งของ AI แบบมีร่างกายจริงที่ครอบครองร่างกายทางกายภาพ
ด้วยวิธีนี้ ALIS ในที่สุดจะถูกนำไปใช้กับโลกแห่งความเป็นจริงและเริ่มต้นเรียนรู้จากมัน