உள்ளடக்கத்திற்குச் செல்லவும்
இந்தக் கட்டுரை ஜப்பானிய மொழியில் இருந்து AI ஐப் பயன்படுத்தி மொழிபெயர்க்கப்பட்டுள்ளது
ஜப்பானிய மொழியில் படிக்கவும்
இந்த கட்டுரை பொதுக் களத்தில் (CC0) உள்ளது. இதை சுதந்திரமாகப் பயன்படுத்தவும். CC0 1.0 Universal

இயற்கை மொழி இயந்திர கற்றல்

பாரம்பரிய இயந்திர கற்றல், கணக்கீடுகளில் திறமையான கணினிகள், எண் தரவுகளைப் பயன்படுத்தி கற்றல் மற்றும் அளவிடப்பட்ட அளவுருக்களைப் பெறும் ஒரு கோட்பாட்டுக்குள் செயல்படுகிறது.

இருப்பினும், மனிதர்கள் எண் வழிமுறைகள் மூலம் மட்டுமல்லாமல், மொழி மூலமாகவும் கற்க முடியும். நாம் அனுபவங்களை வார்த்தைகளில் ஒழுங்கமைத்து பதிவுசெய்து, பின்னர் அந்த வார்த்தைகளை நினைவுகூர்ந்து, படித்து, பயன்படுத்துகிறோம்.

பெரிய மொழி மாதிரிகள் (LLMகள்) இதேபோல் அறிவை வார்த்தைகளில் விவரிக்கவும், வார்த்தைகளைப் படிப்பதன் மூலம் அறிவைப் பயன்படுத்தவும் முடியும்.

LLMகளை இயற்கை மொழி செயலிகளாகப் பயன்படுத்துவதன் மூலம், எண் அடிப்படையிலான இயந்திர கற்றலுக்குப் பதிலாக, இயற்கை மொழி அடிப்படையிலான இயந்திர கற்றல் சாத்தியமாகிறது.

இந்த காரணத்திற்காக, LLMகளின் வருகை ஒரு புதிய துறையைத் திறந்துள்ளது: இயற்கை மொழி இயந்திர கற்றல்.

LLMகளின் முன் பயிற்சி, பாரம்பரிய எண் இயந்திர கற்றலின் ஒரு வடிவம். இங்கு விவாதிக்கப்படும் இயற்கை மொழி இயந்திர கற்றல், முன் பயிற்சி பெற்ற LLMகளைப் பயன்படுத்தும் ஒரு புதிய வகை இயந்திர கற்றலைக் குறிக்கிறது.

இயற்கை மொழி இயந்திர கற்றலின் அடிப்படை மாதிரி

இயற்கை மொழி இயந்திர கற்றல், வழக்கமான எண் சார்ந்த இயந்திர கற்றலைப் போன்ற அம்சங்களையும், முற்றிலும் மாறுபட்ட அம்சங்களையும் கொண்டுள்ளது.

இயற்கை மொழி இயந்திர கற்றல் கருத்தை முதலில் புரிந்துகொள்ள, பாரம்பரிய எண் சார்ந்த இயந்திர கற்றலை ஒத்த பகுதிகளை மையமாகக் கொண்ட ஒரு அடிப்படை மாதிரியை விவரிப்போம்.

இனிமேல், முன் பயிற்சி பெற்ற பெரிய மொழி மாதிரி LLM என்று குறிப்பிடப்படும். இந்த கற்றல் செயல்பாட்டின் போது LLM இன் அளவுருக்கள் எந்த விதத்திலும் மாறாது என்பதை கவனத்தில் கொள்ளவும்.

அடிப்படை மாதிரி ஒரு மேற்பார்வையிடப்பட்ட கற்றல் மாதிரி ஆகும், இது வகைப்படுத்துதல் சிக்கல்களை இலக்காகக் கொண்டுள்ளது.

கற்றல் தரவுகளுக்காக, உள்ளீட்டு வாக்கியங்களின் பல ஜோடிகள் மற்றும் அவற்றின் வகைப்பாடுகள் சரியான பதில்களாகத் தயாரிக்கப்படுகின்றன.

உதாரணமாக, ஒரு நிறுவனத்தில் பொது விவகாரத் துறை மற்றும் நிர்வாக விவகாரத் துறை இருப்பதாக வைத்துக்கொள்வோம்.

இந்த இரண்டு துறைகளுக்கும் தனித்தனி பணிகள் உள்ளன. "அலுவலக விளக்கு பல்புகள் அணைந்துவிட்டன", "நான் எனது அணுகல் அட்டையை மறந்துவிட்டேன்", அல்லது "தலைமையகத்தில் உள்ள பிரதான அரங்கத்தை முன்பதிவு செய்ய விரும்புகிறேன்" போன்ற உள்ளீட்டு வாக்கியங்களுக்கு, பொது விவகாரங்கள் அல்லது நிர்வாக விவகாரங்கள் - எந்தத் துறை பொறுப்பு என்பதைக் குறிக்கிறது வகைப்பாடு.

இந்த பயிற்சி தரவிலிருந்து, உள்ளீட்டு வாக்கியங்கள் மட்டும் பிரித்தெடுக்கப்பட்டு LLM க்கு அளிக்கப்படுகின்றன.

இங்கு, ஒரு சிஸ்டம் ப்ராம்ட் மூலம் பதிலை வேண்டுமென்றே கட்டுப்படுத்துகிறோம்: "இந்த விசாரணைக்கான பொறுப்புத் துறை பொது விவகாரங்களா அல்லது நிர்வாக விவகாரங்களா என்று குறிப்பிடவும். உங்கள் பதிலில் 'பொது விவகாரங்கள்' அல்லது 'நிர்வாக விவகாரங்கள்' தவிர வேறு எந்த எழுத்துக்களையும் சேர்க்க வேண்டாம்."

ஆரம்பத்தில், இந்த நிறுவனத்தைப் பற்றிய அறிவு இல்லாமல் LLM ஒரு பதிலை உருவாக்குகிறது. இயல்பாகவே, அது தவறாக இருக்கலாம், அல்லது தற்செயலாக சரியாக இருக்கலாம்.

ஒவ்வொரு பதிலுக்கும், ஒரு கற்பித்தல் அமைப்பு அது சரியா அல்லது தவறா என்பதை தீர்மானிக்கிறது. பின்னர், உள்ளீட்டு வாக்கியம், LLM இன் பதில் மற்றும் தீர்ப்பு முடிவு ஆகியவற்றின் கலவையானது ஒரு அறிவுத் தளத்தில் சேமிக்கப்படுகிறது.

இந்தச் செயல்முறை பயிற்சித் தரவுகளில் பாதி அளவு வரை மீண்டும் செய்யப்படுகிறது.

மீதமுள்ள பாதி பயிற்சி தரவுகளுக்கு, அறிவுத் தளத்தில் பதிவுசெய்யப்பட்ட அனைத்து தகவல்களும் LLM க்கான சிஸ்டம் ப்ராம்ட்டில் சேர்க்கப்பட்டு, அதே செயல்முறை செய்யப்படுகிறது.

இந்த கட்டத்தில், அறிவுத் தளத்தில் இந்த நிறுவனத்தின் பொது விவகாரங்கள் மற்றும் நிர்வாக விவகாரத் துறைகளுக்கு இடையிலான பணிப் பிரிப்பு பற்றிய தகவல்கள் உள்ளன, எனவே சரியான பதிலுக்கான வாய்ப்பு முதல் பாதி தரவுகளை விட அதிகமாக இருக்கும்.

இவ்வாறாக, ஒரு LLM மற்றும் ஒரு அறிவுத் தளத்தை இணைக்கும் ஒரு அமைப்பு ஒரு நிறுவனத்தின் பொது விவகாரங்கள் மற்றும் நிர்வாக விவகாரத் துறைகளுக்கான பணிப் பிரிப்பைக் கற்றுக்கொள்ள முடியும்.

கற்றல் பொறிமுறையே பாரம்பரிய எண் சார்ந்த இயந்திர கற்றலைப் போன்றது. வித்தியாசம் என்னவென்றால், கற்றல் முடிவுகள் LLM இல் உள்ள நரம்பியல் வலையமைப்பின் அளவுருக்களில் அல்லாமல், அறிவுத் தளத்தில் பிரதிபலிக்கின்றன. மேலும், அறிவுத் தளம் எண் மதிப்புகளுக்குப் பதிலாக இயற்கை மொழியைப் பதிவு செய்கிறது.

இது இயற்கை மொழி இயந்திர கற்றலின் அடிப்படை மாதிரி.

அடிப்படை மாதிரியின் யதார்த்தம்

LLMகளைப் பயன்படுத்துபவர்கள் விரைவாக உணர்வார்கள், இந்த அடிப்படை மாதிரிக்கு யதார்த்தம் இல்லை.

ஏனெனில், ஒரு கற்பித்தல் அமைப்பு சரியா/தவறா என்று தீர்ப்பளிக்கும் சிக்கலைச் செய்யத் தேவையில்லை; ஆரம்பத்திலிருந்தே பயிற்சித் தரவை சிஸ்டம் ப்ராம்டில் உள்ளீடு செய்யலாம்.

இருப்பினும், அடிப்படை மாதிரியைப் பயன்படுத்தி, சூழ்நிலையை சற்று மாற்றியமைப்பதன் மூலம், அது யதார்த்தத்தை அடைகிறது.

உதாரணமாக, பொது விவகாரத் துறையும், நிர்வாக விவகாரத் துறையும் இணைந்து ஒரு விசாரணை மையத்தை உருவாக்குகின்றன, மேலும் ஒரு மனிதர் உள்வரும் ஒவ்வொரு விசாரணையையும் சம்பந்தப்பட்ட துறைக்கு கைமுறையாக ஒதுக்குகிறார் என்று கற்பனை செய்து பாருங்கள்.

இந்த விசாரணைகளையும் அவற்றின் ஒதுக்கீட்டு முடிவுகளையும் ஒரு அறிவுத் தளத்தில் சேர்க்க ஒரு எளிய அமைப்பு உருவாக்கப்படுகிறது.

பின்னர், இந்த அறிவுத் தளத்தைப் பயன்படுத்தி, LLM மனிதர்களிடமிருந்து பொறுப்பை ஏற்று, புதிய விசாரணைகளைத் துறைகளுக்கு ஒதுக்க முடியும்.

இந்த நிலையில், LLM நிர்வாக விவகாரங்களுக்கான விசாரணையைத் தவறாகப் பொது விவகாரங்களுக்கு ஒதுக்கினால், பொது விவகாரத் துறை ஊழியர்கள் விசாரணையை மீண்டும் நிர்வாக விவகாரங்களுக்கு ஒதுக்க வேண்டும். இந்த மறு ஒதுக்கீட்டுத் தகவலும் அறிவுத் தளத்தில் பதிவு செய்யப்படுகிறது.

ஒதுக்கீட்டுப் பதிவுகளைப் பதிவுசெய்வதற்கான இந்த எளிய பொறிமுறை, ஒரு LLM மற்றும் ஒரு அறிவுத் தளத்துடன் இணைந்து, ஒரு யதார்த்தமான மேற்பார்வையிடப்பட்ட இயற்கை மொழி இயந்திர கற்றல் மாதிரியாக அமையும்.

இங்கு முக்கிய அம்சம், மீண்டும் வலியுறுத்துகிறேன், LLM இல் உள்ள நரம்பியல் வலையமைப்பின் அளவுருக்கள் எந்த விதத்திலும் மாறாது. மேலும், பின்னூட்ட கற்றல் முடிவு என்பது எண் மதிப்புகள் அல்ல, மாறாக இயற்கை மொழி வாக்கியங்களின் தொகுப்பாகும்.

மேலும், சந்தேகத்திற்கு இடமின்றி, இந்த அமைப்பு மனித கற்றலை உள்ளடக்கியது அல்ல, இயந்திர கற்றலை உள்ளடக்கியது.

ஆகவே, இது ஒரு புதிய வகை இயந்திர கற்றல்: இயற்கை மொழி இயந்திர கற்றல்.

இயற்கை மொழி இயந்திர கற்றலின் பலங்கள்

எண் சார்ந்த இயந்திர கற்றலைப் போலன்றி, இயற்கை மொழி கற்றல் பல நன்மைகளை வழங்குகிறது.

ஒரு வார்த்தையில் சொன்னால், அதன் சிறப்பியல்பு, மிக அதிக கற்றல் செயல்திறன் ஆகும்.

எண் சார்ந்த இயந்திர கற்றலுக்கு பொதுவாக அதிக அளவு பயிற்சித் தரவுகளும் மீண்டும் மீண்டும் செய்யும் கற்றலும் தேவைப்படுகிறது. மேலும், பயிற்சித் தரவுகளை முன்கூட்டியே செயலாக்குவதும் அவசியமாகும்.

அதிக அளவு பயிற்சித் தரவுகள் தேவைப்படுகின்றன, ஏனெனில் கற்றுக்கொள்ள வேண்டிய அம்சங்கள் ஒரு தரவில் மட்டும் இல்லாமல், ஒரு பெரிய அளவிலான தரவுகளில் பரவி உள்ளன.

இந்த காரணத்திற்காக, உண்மையிலேயே விரும்பிய அம்சங்களின் பரிமாணத்தின் சதுர வரிசையிலான பயிற்சித் தரவுகள் தேவைப்படுகின்றன.

நரம்பியல் வலையமைப்பின் அளவுருக்கள் உள்ளூர் சிறுமிகளில் விழாமல் சரியான முறையில் கற்றுக்கொள்ளப்படுவதை உறுதிசெய்ய, ஒவ்வொரு பின்னூட்டத்திலும் அளவுரு மாற்றத்தை சிறியதாக வைத்திருக்க வேண்டும் என்பதால், மீண்டும் மீண்டும் செய்யும் கற்றல் அவசியம்.

சரியாக விரும்பிய அம்சங்களை முன்னிலைப்படுத்த, இயல்பாக்குதல் மற்றும் விளிம்பு பிரித்தெடுத்தல் போன்ற பயிற்சித் தரவுகளை முன்கூட்டியே செயலாக்குவது தேவைப்படுகிறது. இந்த முன்கூட்டிய செயலாக்கத்திற்கும் குறிப்பிடத்தக்க முயற்சி தேவைப்படுகிறது.

உதாரணமாக, நிர்வாக விவகாரத் துறைக்கும் பொது விவகாரத் துறைக்கும் இடையிலான பணிப் பிரிப்பை பாரம்பரிய நரம்பியல் வலையமைப்பைப் பயன்படுத்தி கற்றுக்கொள்ள வேண்டும் என்றால், அதன் அம்சங்கள் 50 பரிமாணங்களாக இருந்தால், குறைந்தது 1,000 அல்லது அதற்கு மேற்பட்ட பயிற்சித் தரவு நிகழ்வுகள் தேவைப்படும். கூடுதலாக, இந்த 1,000+ தரவு நிகழ்வுகளை சுமார் 100 முறை மீண்டும் மீண்டும் கற்றுக் கொண்டால் மட்டுமே சரியான கற்றல் துல்லியம் அடையப்படலாம்.

மேலும், இந்த 1,000 பயிற்சித் தரவு நிகழ்வுகளில் தேவையற்ற வார்த்தைகள், எழுத்துப் பிழைகளில் வேறுபாடுகள் அல்லது பல்வேறு வார்த்தை வரிசைகள் மற்றும் வாக்கிய அமைப்புகள் இருந்தால், கற்றல் செயல்திறன் குறைந்துவிடும், மேலும் தொடர்பில்லாத அம்சங்கள் கற்றுக்கொள்ளப்படலாம்.

ஆகவே, தேவையற்ற வார்த்தைகளை நீக்குவதற்கும், எழுத்துப் பிழைகளில் உள்ள வேறுபாடுகளை நீக்குவதற்கு சொற்களை தரப்படுத்துவதற்கும், வார்த்தை வரிசை மற்றும் வாக்கிய அமைப்பை ஒருங்கிணைப்பதற்கும் முன்கூட்டிய செயலாக்கம் இன்றியமையாதது.

இதற்கு மாறாக, இயற்கை மொழி இயந்திர கற்றலுக்கு குறைவான பயிற்சித் தரவுகளே தேவைப்படுகின்றன, அதே பயிற்சித் தரவுகளுடன் மீண்டும் மீண்டும் செய்வது தேவையில்லை, மேலும் பெரும்பாலும் முன்கூட்டிய செயலாக்கமும் தேவையில்லை.

நிர்வாக விவகாரத் துறைக்கும் பொது விவகாரத் துறைக்கும் இடையிலான பணிப் பிரிப்புக்கான அம்சங்கள் 50 பரிமாணங்களாக இருந்தால், ஒவ்வொரு பரிமாணத்திற்கும் பொருத்தமான 50 தகவல்கள் போதுமானவை.

மேலும், இதற்கு 50 தனித்தனி வாக்கியங்கள் தேவைப்படும் என்று அர்த்தமல்ல.

"A, B, C, மற்றும் D தொடர்பான பணிகள் நிர்வாக விவகாரத் துறையால் கையாளப்படுகின்றன" போன்ற ஒரு வாக்கியம் நான்கு பரிமாண தகவல்களை உள்ளடக்கும்.

மேலும், மொழியை சுருக்கப்படுத்துவதன் மூலம், பல பரிமாணங்களில் இருந்து தகவல்களை ஒருங்கிணைக்க முடியும். "கட்டிடத்தின் நுகர்வுப் பொருட்கள் மற்றும் வசதிகளின் பராமரிப்பு நிர்வாக விவகாரத் துறையின் பொறுப்பாகும்" போன்ற ஒரு வாக்கியம், விளக்கு பல்புகளை மாற்றுதல் மற்றும் தானியங்கி கதவு பழுதுகள் உள்ளிட்ட பல பரிமாண தகவல்களை ஒருங்கிணைக்கிறது.

இந்த சுருக்கமானது, LLM இன் முன் பயிற்சி பெற்ற அறிவு மற்றும் பகுத்தறிவு திறன்களைப் பயன்படுத்துவதன் மூலம் பயிற்சித் தரவுகளைக் குறைக்கிறது என்று கூறலாம்.

அடிப்படையில், இயற்கை மொழி கற்றலுக்கு மீண்டும் மீண்டும் செய்யும் கற்றல் தேவையில்லை. மேற்கூறிய வாக்கியம் அறிவுத் தளத்தில் சேர்க்கப்பட்டவுடன், கற்றல் நிறைவடைகிறது.

கூடுதலாக, அறிவை முன்கூட்டியே செயலாக்குவது தேவையில்லை. நிர்வாக விவகாரத் துறை அல்லது பொது விவகாரத் துறை பற்றிய விளக்கங்கள் பல்வேறு உரைகளுக்குள் கலந்திருந்தாலும், அவை அறிவாகப் பயன்படுத்தப்படலாம்.

அல்லது, முந்தைய எடுத்துக்காட்டில் உள்ளது போல, விசாரணை மற்றும் ஒதுக்கீட்டுப் பதிவுகள் போன்ற மூலத் தரவுகள், முன்கூட்டிய செயலாக்கம் இல்லாமல் உடனடியாக பயிற்சித் தரவுகளாகப் பயன்படுத்தப்படலாம்.

இதனால், இயற்கை மொழி இயந்திர கற்றல் எண் சார்ந்த இயந்திர கற்றலை விட மிகவும் திறமையாகக் கற்றுக்கொள்ள முடியும்.

முடிவுரை

கணினிகளின் அதிவேக எண் கணக்கீட்டுத் திறன்களுடன் ஒப்பிடும்போது, பெரிய மொழி மாதிரிகளின் இயற்கை மொழி செயலாக்கத் திறன் மிகவும் மெதுவாக உள்ளது.

இருப்பினும், இயற்கை மொழி இயந்திர கற்றல் திறமையான கற்றலை அனுமதிக்கிறது, இது அதிவேக எண் கணக்கீடு மற்றும் மெதுவான இயற்கை மொழி செயலாக்கத்திற்கு இடையிலான இடைவெளியை வெகுவாக மீறுகிறது.

மேலும், எண் கற்றல் மூலம் ஆச்சரியமான முன்னேற்றம் கண்ட பெரிய மொழி மாதிரிகள், அளவு விதிமுறைகளின்படி, எளிய அளவீட்டு மூலம் செயல்திறன் மேம்பாட்டின் வரம்புகளை அணுகுவதாகத் தெரிகிறது.

இத்தகைய சூழ்நிலையில், இயற்கை மொழி இயந்திர கற்றல் மூலம் திறன்களை மேம்படுத்துவதில் கவனம் மாறும் என்பது மிகவும் சாத்தியமாகும்.

தொடர்புடைய கட்டுரைகள்

இந்த தலைப்பு தொடர்பான பிற கட்டுரைகள்