ข้ามไปยังเนื้อหา
บทความนี้ได้รับการแปลจากภาษาญี่ปุ่นโดยใช้ AI
อ่านฉบับภาษาญี่ปุ่น
บทความนี้อยู่ในสาธารณสมบัติ (CC0) โปรดใช้งานได้อย่างอิสระ CC0 1.0 Universal

การเรียนรู้ของเครื่องภาษาธรรมชาติ

การเรียนรู้ของเครื่องแบบดั้งเดิมดำเนินการภายใต้กระบวนทัศน์ที่คอมพิวเตอร์ ซึ่งมีความเชี่ยวชาญในการคำนวณเชิงตัวเลข จะเรียนรู้โดยใช้ข้อมูลเชิงตัวเลขและได้รับพารามิเตอร์ที่วัดปริมาณได้

อย่างไรก็ตาม มนุษย์มีความสามารถในการเรียนรู้ไม่เพียงแต่ผ่านกลไกเชิงตัวเลขเท่านั้น แต่ยังผ่านภาษาด้วย เราจัดระเบียบและบันทึกประสบการณ์เป็นคำพูด จากนั้นจึงเรียกคืน อ่าน และใช้คำเหล่านั้น

แบบจำลองภาษาขนาดใหญ่ (LLMs) สามารถอธิบายความรู้เป็นคำพูดและใช้ความรู้โดยการอ่านคำพูดได้ในทำนองเดียวกัน

ด้วยการใช้ประโยชน์จาก LLMs ในฐานะหน่วยประมวลผลภาษาธรรมชาติ การเรียนรู้ของเครื่องที่ใช้ภาษาธรรมชาติจึงเป็นไปได้ แทนที่จะเป็นการเรียนรู้ของเครื่องที่ใช้ตัวเลขเพียงอย่างเดียว

ด้วยเหตุนี้ การมาถึงของ LLMs จึงได้เปิดสาขาใหม่ นั่นคือ การเรียนรู้ของเครื่องภาษาธรรมชาติ

การฝึกอบรมล่วงหน้าของ LLMs เป็นรูปแบบหนึ่งของการเรียนรู้ของเครื่องเชิงตัวเลขแบบดั้งเดิม การเรียนรู้ของเครื่องภาษาธรรมชาติที่กล่าวถึงในที่นี้หมายถึงการเรียนรู้ของเครื่องประเภทใหม่ที่ใช้ LLMs ที่ได้รับการฝึกอบรมล่วงหน้า

แบบจำลองพื้นฐานของการเรียนรู้ของเครื่องภาษาธรรมชาติ

การเรียนรู้ของเครื่องภาษาธรรมชาติมีทั้งส่วนที่คล้ายกับการเรียนรู้ของเครื่องเชิงตัวเลขแบบดั้งเดิม และส่วนที่แตกต่างกันโดยสิ้นเชิง

เพื่อทำความเข้าใจแนวคิดของการเรียนรู้ของเครื่องภาษาธรรมชาติในเบื้องต้น เราจะอธิบายแบบจำลองพื้นฐานโดยเน้นส่วนที่คล้ายกับการเรียนรู้ของเครื่องเชิงตัวเลขแบบดั้งเดิม

ต่อจากนี้ไป แบบจำลองภาษาขนาดใหญ่ที่ได้รับการฝึกอบรมล่วงหน้าจะถูกเรียกว่า LLM โปรดทราบว่าพารามิเตอร์ของ LLM จะไม่เปลี่ยนแปลงเลยในระหว่างกระบวนการเรียนรู้นี้

แบบจำลองพื้นฐานนี้เป็นแบบจำลองการเรียนรู้แบบมีผู้สอน โดยมุ่งเน้นไปที่ปัญหาการจัดหมวดหมู่

สำหรับข้อมูลการเรียนรู้ จะมีการเตรียมคู่ของประโยคอินพุตและการจัดหมวดหมู่เป็นคำตอบที่ถูกต้องหลายคู่

ตัวอย่างเช่น สมมติว่าบริษัทแห่งหนึ่งมีฝ่ายธุรการ (General Affairs Department) และฝ่ายบริการทั่วไป (Administrative Affairs Department)

ทั้งสองฝ่ายนี้มีบทบาทที่แตกต่างกัน สำหรับประโยคอินพุต เช่น "หลอดไฟในสำนักงานเสีย" "ฉันลืมบัตรผ่านเข้าออก" หรือ "ฉันต้องการจองห้องโถงใหญ่ที่สำนักงานใหญ่" การจัดหมวดหมู่จะระบุว่าฝ่ายใดรับผิดชอบ ไม่ว่าจะเป็นฝ่ายธุรการหรือฝ่ายบริการทั่วไป

จากข้อมูลการฝึกอบรมนี้ เฉพาะประโยคอินพุตเท่านั้นที่จะถูกดึงออกมาและป้อนเข้าสู่ LLM

ในที่นี้ เราจงใจจำกัดการตอบสนองผ่านข้อความแจ้งระบบ เช่น "โปรดระบุว่าแผนกที่รับผิดชอบสำหรับคำถามนี้คือฝ่ายธุรการหรือฝ่ายบริการทั่วไป ห้ามมีอักขระอื่นใดนอกจาก 'ฝ่ายธุรการ' หรือ 'ฝ่ายบริการทั่วไป' ในคำตอบของคุณ"

ในเบื้องต้น LLM จะสร้างการตอบสนองโดยไม่มีความรู้เกี่ยวกับบริษัทนี้ โดยธรรมชาติแล้ว มันอาจไม่ถูกต้อง หรือบางครั้งก็ถูกต้องโดยบังเอิญ

สำหรับแต่ละการตอบสนอง ระบบการสอนจะกำหนดว่าถูกต้องหรือไม่ถูกต้อง จากนั้น การรวมกันของประโยคอินพุต การตอบสนองของ LLM และผลการตัดสินจะถูกบันทึกไว้ในแหล่งเก็บความรู้

กระบวนการนี้จะถูกทำซ้ำประมาณครึ่งหนึ่งของข้อมูลการฝึกอบรม

สำหรับข้อมูลการฝึกอบรมที่เหลืออีกครึ่งหนึ่ง ข้อมูลทั้งหมดที่บันทึกไว้ในแหล่งเก็บความรู้จะถูกเพิ่มลงในข้อความแจ้งระบบสำหรับ LLM และกระบวนการเดียวกันนี้จะถูกดำเนินการ

ในตอนนี้ แหล่งเก็บความรู้ประกอบด้วยข้อมูลเกี่ยวกับการแบ่งหน้าที่ระหว่างฝ่ายธุรการและฝ่ายบริการทั่วไปของบริษัทนี้ ดังนั้น ความน่าจะเป็นที่จะได้คำตอบที่ถูกต้องควรสูงกว่าครึ่งแรกของข้อมูล

ด้วยวิธีนี้ ระบบที่รวม LLM และแหล่งเก็บความรู้เข้าด้วยกันสามารถเรียนรู้การแบ่งหน้าที่สำหรับฝ่ายธุรการและฝ่ายบริการทั่วไปของบริษัทได้

กลไกการเรียนรู้เองก็คล้ายกับการเรียนรู้ของเครื่องเชิงตัวเลขแบบดั้งเดิม ความแตกต่างคือผลลัพธ์การเรียนรู้จะสะท้อนอยู่ในแหล่งเก็บความรู้ ไม่ใช่ในพารามิเตอร์ของโครงข่ายประสาทเทียมภายใน LLM นอกจากนี้ แหล่งเก็บความรู้ยังบันทึกภาษาธรรมชาติ ไม่ใช่ค่าเชิงตัวเลข

นี่คือแบบจำลองพื้นฐานของการเรียนรู้ของเครื่องภาษาธรรมชาติ

ความเป็นจริงของแบบจำลองพื้นฐาน

ดังที่ผู้ที่ใช้ LLM จะตระหนักได้อย่างรวดเร็วว่า แบบจำลองพื้นฐานนี้ขาดความเป็นจริง

นั่นเป็นเพราะไม่จำเป็นต้องเสียเวลาให้ระบบการสอนมาตัดสินว่าถูกหรือผิด เราสามารถป้อนข้อมูลการฝึกอบรมทั้งหมดเข้าไปใน System Prompt ได้ตั้งแต่แรก

อย่างไรก็ตาม หากนำแบบจำลองพื้นฐานมาประยุกต์และปรับเปลี่ยนสถานการณ์เล็กน้อย ก็จะมีความเป็นจริงมากขึ้น

ตัวอย่างเช่น ลองนึกภาพว่าฝ่ายธุรการและฝ่ายบริการทั่วไปร่วมกันจัดตั้งโต๊ะสอบถาม และมนุษย์เป็นผู้กำหนดคำถามแต่ละรายการที่เข้ามาไปยังแผนกที่เหมาะสมด้วยตนเอง

มีการสร้างระบบง่ายๆ เพื่อเพิ่มคำถามและผลการมอบหมายเหล่านี้ลงในแหล่งเก็บความรู้

จากนั้น โดยใช้แหล่งเก็บความรู้นี้ LLM สามารถเข้ามาทำหน้าที่แทนมนุษย์และมอบหมายคำถามใหม่ๆ ไปยังแผนกต่างๆ ได้

ในกรณีนี้ หาก LLM มอบหมายคำถามที่ควรเป็นของฝ่ายบริการทั่วไปให้ฝ่ายธุรการอย่างผิดพลาด พนักงานฝ่ายธุรการก็จะมอบหมายคำถามนั้นกลับไปยังฝ่ายบริการทั่วไป ข้อมูลการมอบหมายใหม่นี้จะถูกบันทึกไว้ในแหล่งเก็บความรู้ด้วย

กลไกง่ายๆ สำหรับการบันทึกบันทึกการมอบหมายนี้ เมื่อรวมกับ LLM และแหล่งเก็บความรู้ จะกลายเป็นแบบจำลองการเรียนรู้ของเครื่องภาษาธรรมชาติแบบมีผู้สอนที่สมจริง

ประเด็นสำคัญในที่นี้ ขอย้ำอีกครั้ง คือ พารามิเตอร์ของโครงข่ายประสาทเทียมภายใน LLM ไม่ได้เปลี่ยนแปลงเลย นอกจากนี้ ผลลัพธ์การเรียนรู้จากข้อเสนอแนะคือชุดของประโยคภาษาธรรมชาติ ไม่ใช่ค่าตัวเลข

และไม่ต้องสงสัยเลยว่า ระบบนี้เกี่ยวข้องกับการเรียนรู้ของเครื่อง ไม่ใช่การเรียนรู้ของมนุษย์

ดังนั้น นี่คือรูปแบบใหม่ของการเรียนรู้ของเครื่อง นั่นคือ การเรียนรู้ของเครื่องภาษาธรรมชาติ

จุดแข็งของการเรียนรู้ของเครื่องภาษาธรรมชาติ

แตกต่างจากการเรียนรู้ของเครื่องเชิงตัวเลข การเรียนรู้ภาษาธรรมชาติมีข้อดีหลายประการ

กล่าวโดยย่อ ลักษณะเฉพาะที่โดดเด่นคือประสิทธิภาพการเรียนรู้ที่สูงอย่างท่วมท้น

การเรียนรู้ของเครื่องเชิงตัวเลขโดยทั่วไปต้องใช้ข้อมูลการฝึกอบรมจำนวนมากและการเรียนรู้แบบวนซ้ำ นอกจากนี้ การประมวลผลล่วงหน้าของข้อมูลการฝึกอบรมก็จำเป็นเช่นกัน

ข้อมูลการฝึกอบรมจำนวนมากเป็นสิ่งจำเป็น เนื่องจากคุณลักษณะที่จะเรียนรู้ไม่ได้มีอยู่ในข้อมูลชิ้นเดียว แต่กระจายอยู่ท่ามกลางข้อมูลจำนวนมหาศาล

ด้วยเหตุนี้ จึงต้องใช้ข้อมูลการฝึกอบรมในระดับกำลังสองของมิติข้อมูลของคุณลักษณะที่ต้องการอย่างแท้จริง

การเรียนรู้แบบวนซ้ำเป็นสิ่งจำเป็นเพื่อให้แน่ใจว่าพารามิเตอร์ของโครงข่ายประสาทเทียมได้รับการเรียนรู้ที่เหมาะสมโดยไม่ตกอยู่ในหลุมดำในพื้นที่ ซึ่งต้องอาศัยการเปลี่ยนแปลงพารามิเตอร์เพียงเล็กน้อยในแต่ละครั้งของการป้อนกลับ

การประมวลผลล่วงหน้าของข้อมูลการฝึกอบรม เช่น การทำให้เป็นปกติและการแยกขอบ เป็นสิ่งจำเป็นเพื่อเน้นคุณลักษณะที่ต้องการอย่างแท้จริง การประมวลผลล่วงหน้านี้ยังต้องใช้ความพยายามอย่างมาก

ตัวอย่างเช่น หากการแบ่งหน้าที่ระหว่างฝ่ายบริการทั่วไปและฝ่ายธุรการจะถูกเรียนรู้โดยใช้โครงข่ายประสาทเทียมแบบดั้งเดิม และคุณลักษณะของมันมี 50 มิติ จะต้องใช้ข้อมูลการฝึกอบรมอย่างน้อยประมาณ 1,000 ชุดขึ้นไป นอกจากนี้ ข้อมูลเหล่านี้อาจต้องถูกเรียนรู้แบบวนซ้ำประมาณ 100 ครั้งเพื่อให้ได้ความแม่นยำในการเรียนรู้ที่เหมาะสม

นอกจากนี้ หากชุดข้อมูลการฝึกอบรม 1,000 ชุดนี้มีคำที่ไม่เกี่ยวข้อง การสะกดคำที่แตกต่างกัน หรือรูปแบบการจัดเรียงคำและโครงสร้างประโยคที่หลากหลาย ประสิทธิภาพการเรียนรู้จะลดลง และอาจเรียนรู้คุณลักษณะที่ไม่เกี่ยวข้องได้

ดังนั้น การประมวลผลล่วงหน้าเพื่อลบคำที่ไม่เกี่ยวข้อง การทำให้คำศัพท์เป็นมาตรฐานเพื่อขจัดความแตกต่าง และการรวมลำดับคำและไวยากรณ์เข้าด้วยกันจึงเป็นสิ่งจำเป็นอย่างยิ่ง

ในทางตรงกันข้าม การเรียนรู้ของเครื่องภาษาธรรมชาติใช้ข้อมูลการฝึกอบรมน้อยกว่า ไม่จำเป็นต้องวนซ้ำด้วยข้อมูลการฝึกอบรมชุดเดิม และมักไม่จำเป็นต้องมีการประมวลผลล่วงหน้า

หากคุณลักษณะสำหรับการแบ่งหน้าที่ระหว่างฝ่ายบริการทั่วไปและฝ่ายธุรการมี 50 มิติ ข้อมูล 50 ชิ้นที่สอดคล้องกับแต่ละมิติก็เพียงพอแล้ว

ยิ่งไปกว่านั้น นี่ไม่ได้หมายความว่าต้องใช้ประโยคแยกกัน 50 ประโยค

ประโยคเดียว เช่น "หน้าที่ที่เกี่ยวข้องกับ A, B, C และ D อยู่ในความรับผิดชอบของฝ่ายบริการทั่วไป" สามารถครอบคลุมข้อมูลสี่มิติได้

นอกจากนี้ ด้วยการสรุปภาษา ข้อมูลจากหลายมิติสามารถนำมารวมกันได้ ประโยคเช่น "การบำรุงรักษาวัสดุสิ้นเปลืองและสิ่งอำนวยความสะดวกของอาคารเป็นความรับผิดชอบของฝ่ายบริการทั่วไป" รวบรวมข้อมูลมิติที่หลากหลาย รวมถึงการเปลี่ยนหลอดไฟและการทำงานผิดปกติของประตูอัตโนมัติ

การสรุปนี้สามารถกล่าวได้ว่าช่วยลดข้อมูลการฝึกอบรมโดยใช้ประโยชน์จากความรู้และความสามารถในการให้เหตุผลที่ LLM ได้รับการฝึกอบรมล่วงหน้า

และโดยพื้นฐานแล้ว การเรียนรู้ภาษาธรรมชาติไม่จำเป็นต้องมีการเรียนรู้แบบวนซ้ำ เมื่อประโยคที่กล่าวถึงข้างต้นถูกเพิ่มลงในแหล่งเก็บความรู้ การเรียนรู้ก็เสร็จสมบูรณ์

นอกจากนี้ การประมวลผลล่วงหน้าของความรู้ก็ไม่จำเป็น แม้ว่าคำอธิบายของฝ่ายบริการทั่วไปหรือฝ่ายธุรการจะปะปนอยู่ในข้อความต่างๆ ก็ยังสามารถนำมาใช้เป็นความรู้ได้

หรือเช่นเดียวกับตัวอย่างก่อนหน้านี้ ข้อมูลดิบ เช่น บันทึกการสอบถามและการมอบหมายงาน สามารถนำมาใช้เป็นข้อมูลการฝึกอบรมได้ทันทีโดยไม่ต้องมีการประมวลผลล่วงหน้า

ดังนั้น การเรียนรู้ของเครื่องภาษาธรรมชาติจึงสามารถเรียนรู้ได้อย่างมีประสิทธิภาพมากกว่าการเรียนรู้ของเครื่องเชิงตัวเลขมาก

บทสรุป

เมื่อเทียบกับความสามารถในการคำนวณเชิงตัวเลขความเร็วสูงของคอมพิวเตอร์แล้ว ความสามารถในการประมวลผลภาษาธรรมชาติของแบบจำลองภาษาขนาดใหญ่ค่อนข้างช้า

อย่างไรก็ตาม การเรียนรู้ของเครื่องภาษาธรรมชาติช่วยให้การเรียนรู้มีประสิทธิภาพสูง ซึ่งเหนือกว่าช่องว่างระหว่างการคำนวณเชิงตัวเลขความเร็วสูงและการประมวลผลภาษาธรรมชาติที่ช้ามาก

นอกจากนี้ แบบจำลองภาษาขนาดใหญ่ ซึ่งมีความก้าวหน้าอย่างน่าทึ่งผ่านการเรียนรู้เชิงตัวเลข ดูเหมือนจะเข้าใกล้ขีดจำกัดของการปรับปรุงประสิทธิภาพด้วยการขยายขนาดแบบง่ายๆ ตามกฎการปรับขนาด

ในสถานการณ์เช่นนี้ มีความเป็นไปได้สูงที่การมุ่งเน้นจะเปลี่ยนไปสู่การเพิ่มขีดความสามารถผ่านการเรียนรู้ของเครื่องภาษาธรรมชาติ