தற்போதைய உருவாக்க AI ஆனது, டிரான்ஸ்ஃபார்மரின் கண்டுபிடிப்பு ஒரு பெரிய திருப்புமுனையாக அமைந்து பூத்துக் குலுங்கிய ஒரு AI தொழில்நுட்பமாகும்.
கவனப் பொறிமுறையானது டிரான்ஸ்ஃபார்மரின் வரையறுக்கும் அம்சமாக விவரிக்கப்படலாம். டிரான்ஸ்ஃபார்மரை அறிவித்த ஆய்வுக் கட்டுரையின் தலைப்பான "கவனம் ஒன்றே உனக்குத் தேவை" (“Attention Is All You Need”) என்பதில் இது சுருக்கமாக வெளிப்படுத்தப்பட்டுள்ளது.
இதன் பின்னணி என்னவென்றால், அப்போதைய AI ஆராய்ச்சியாளர்கள், AI ஆனது மனிதர்களைப் போல இயற்கை மொழியை திறம்பட கையாளச் செய்வதற்காக பல்வேறு முயற்சிகளை மேற்கொண்டு, முயற்சி மற்றும் பிழை அடிப்படையில் பல வழிமுறைகளை உருவாக்கினர், மேலும் வெற்றிகரமான வழிமுறைகளுக்குப் பெயரிட்டு ஆய்வுக் கட்டுரைகளை வெளியிட்டனர்.
இந்த பல பயனுள்ள வழிமுறைகளை பல்வேறு வழிகளில் இணைப்பதன் மூலம், மனிதர்களைப் போல இயற்கை மொழியைக் கையாளும் AI ஐ படிப்படியாக உருவாக்க முடியும் என்று பல ஆராய்ச்சியாளர்கள் நம்பினர். அவர்கள் மற்றவற்றுடன் இணைந்து செயல்படக்கூடிய புதிய வழிமுறைகளைக் கண்டறிவதிலும், இந்த வழிமுறைகளின் உகந்த சேர்க்கைகளைக் கண்டறிவதிலும் கவனம் செலுத்தினர்.
இருப்பினும், டிரான்ஸ்ஃபார்மர் இந்த வழக்கமான ஞானத்தை தலைகீழாக மாற்றியது. பல்வேறு வழிமுறைகளை இணைக்கத் தேவையில்லை, கவனப் பொறிமுறை மட்டுமே தேவை என்ற செய்தி ஆய்வுக் கட்டுரையின் தலைப்பில் தெளிவாகத் தெரிந்தது.
டிரான்ஸ்ஃபார்மரே பல்வேறு வழிமுறைகளை உள்ளடக்கியிருந்தாலும், அவற்றில் கவனப் பொறிமுறை குறிப்பாக புதுமையானதாகவும் தனித்துவமானதாகவும் இருந்தது என்பதில் சந்தேகமில்லை.
கவனப் பொறிமுறையின் மேலோட்டம்
இயற்கை மொழியில் ஒரு குறிப்பிட்ட வார்த்தையைச் செயலாக்கும்போது, கவனப் பொறிமுறையானது, முந்தைய வாக்கியங்களில் உள்ள பல வார்த்தைகளில், எந்தெந்த வார்த்தைகளுக்குக் கவனம் செலுத்த வேண்டும் என்பதைக் கற்றுக்கொள்ள AI ஐ அனுமதிக்கும் ஒரு அமைப்பாகும்.
உதாரணமாக, "இது," "அது," அல்லது "மேற்கூறியது" (முந்தைய வாக்கியத்தில் உள்ள ஒரு வார்த்தையை சுட்டிக்காட்டுவது) போன்ற சுட்டிச் சொற்கள் அல்லது "ஆரம்ப வாக்கியம்," "இரண்டாவது பட்டியலில் உள்ள உதாரணம்," அல்லது "முந்தைய பத்தி" போன்ற நிலை சார்ந்த குறிப்புகளைக் கையாளும் போது, ஒரு சொல் எதைக் குறிக்கிறது என்பதை AI துல்லியமாகப் புரிந்துகொள்ள இது உதவுகிறது.
மேலும், ஒரு வாக்கியத்தில் மாற்றியமைக்கும் சொற்கள் வெகுதூரம் இருந்தாலும், அது அவற்றை சரியாகப் புரிந்துகொள்ள முடியும், மேலும் நீண்ட நூல்களிலும் கூட, தற்போதைய சொல் குறிப்பிடும் சூழலை இழக்காமல், மற்ற வாக்கியங்களுக்கு இடையில் தொலைந்து போகாமல் சொற்களைப் புரிந்துகொள்ள முடியும்.
இதுதான் "கவனத்தின்" பயன்பாடு.
மறுபுறம், இது என்னவென்றால், தற்போது செயலாக்கப்படும் சொல்லை விளக்கும்போது, தேவையில்லாத சொற்கள் மறைக்கப்பட்டு விளக்கத்திலிருந்து நீக்கப்படுகின்றன.
கொடுக்கப்பட்ட சொல்லை விளக்குவதற்கு அத்தியாவசியமான சொற்களை மட்டும் தக்கவைத்துக்கொண்டு, தொடர்பில்லாத சொற்களை விளக்கத்திலிருந்து நீக்குவதன் மூலம், உரை எவ்வளவு நீளமாக இருந்தாலும், விளக்கப்பட வேண்டிய சொற்களின் தொகுப்பு ஒரு சிலவற்றிற்கு மட்டுமே கட்டுப்படுத்தப்படுகிறது, இதனால் விளக்க அடர்த்தி நீர்த்துப் போவதைத் தடுக்கிறது.
மெய்நிகர் நுண்ணறிவு
இப்போது, சற்றுப் பாதையை மாற்றி, நான் மெய்நிகர் நுண்ணறிவு என்ற கருத்தை ஆராய்ந்து வருகிறேன்.
தற்போது, வணிகத்திற்காக உருவாக்க AI ஐப் பயன்படுத்தும்போது, ஒரு நிறுவனத்திற்குள் உள்ள அனைத்து தகவல்களும் ஒருங்கிணைக்கப்பட்டு, AI க்கு ஒற்றை அறிவுத் தளமாக வழங்கப்பட்டால், அறிவின் அளவு மிக அதிகமாகி, AI அதை சரியாகச் செயலாக்க முடியாத ஒரு நிகழ்வு ஏற்படுகிறது.
இந்த காரணத்திற்காக, பணிக்கு ஏற்ப அறிவைப் பிரிப்பது, ஒவ்வொரு பணிக்கான AI அரட்டைகளைத் தயாரிப்பது அல்லது குறிப்பிட்ட செயல்பாடுகளுக்கு சிறப்பு வாய்ந்த AI கருவிகளை உருவாக்குவது மிகவும் பயனுள்ளதாக இருக்கும்.
இதன் விளைவாக, சிக்கலான பணிகளைச் செய்யும்போது, இந்த AI அரட்டைகள் அல்லது AI கருவிகளை இணைப்பது அவசியமாகிறது, ஒவ்வொன்றும் அவற்றின் தனித்தனி அறிவுடன்.
இது உருவாக்கும் AI இன் தற்போதைய வரம்பைக் குறித்தாலும், அடிப்படையில், எதிர்கால உருவாக்கும் AI உடன் கூட, ஒரு குறிப்பிட்ட பணிக்குத் தேவையான அறிவில் மட்டுமே கவனம் செலுத்துவது அதிக துல்லியத்திற்கு வழிவகுக்கும்.
அதற்குப் பதிலாக, எதிர்கால உருவாக்கும் AI, மனிதர்கள் அந்த அறிவை பிரித்தெடுக்காமல் இருந்தாலும், சூழ்நிலைக்கு ஏற்ப தேவையான அறிவை உள்நாட்டில் வேறுபடுத்தி பயன்படுத்த முடியும் என்று நான் நம்புகிறேன்.
இந்த திறன் மெய்நிகர் நுண்ணறிவு ஆகும். இது ஒரு கணினியில் பல வெவ்வேறு இயக்க முறைமைகளை இயக்கக்கூடிய ஒரு மெய்நிகர் இயந்திரத்தைப் போன்றது. அதாவது, ஒரு நுண்ணறிவுக்குள், வெவ்வேறு சிறப்புப் பிரிவுகளைக் கொண்ட பல மெய்நிகர் நுண்ணறிவுகள் செயல்பட முடியும்.
தற்போதைய உருவாக்கும் AI கூட ஏற்கனவே பல நபர்களுக்கிடையேயான விவாதங்களை உருவகப்படுத்தலாம் அல்லது பல கதாபாத்திரங்களைக் கொண்ட கதைகளை உருவாக்கலாம். எனவே, மெய்நிகர் நுண்ணறிவு ஒரு சிறப்புத் திறன் அல்ல, மாறாக தற்போதைய உருவாக்கும் AI இன் ஒரு நீட்டிப்பு ஆகும்.
மைக்ரோ மெய்நிகர் நுண்ணறிவு
பணிக்கு ஏற்ப தேவையான அறிவைக் குறைக்கும் மெய்நிகர் நுண்ணறிவு பொறிமுறையானது, கவனப் பொறிமுறைக்கு ஒத்த ஒன்றைச் செய்கிறது.
வேறு வார்த்தைகளில் கூறுவதானால், தற்போது செயல்படுத்தப்படும் பணியின் அடிப்படையில் தொடர்புடைய அறிவை மட்டுமே கவனம் செலுத்தி செயலாக்குகிறது என்பதில் இது கவனப் பொறிமுறைக்கு ஒத்ததாகும்.
மாறாக, கவனப் பொறிமுறையானது மெய்நிகர் நுண்ணறிவுக்கு ஒத்த ஒன்றைப் புரிந்து கொள்ளும் ஒரு பொறிமுறை என்று கூறலாம். இருப்பினும், நான் கற்பனை செய்யும் மெய்நிகர் நுண்ணறிவு அறிவுத் தொகுப்பிலிருந்து தொடர்புடைய அறிவைத் தேர்ந்தெடுக்கிறது, கவனப் பொறிமுறையானது வார்த்தைகளின் தொகுப்பு அலகில் செயல்படுகிறது.
இந்த காரணத்திற்காக, கவனப் பொறிமுறையை மைக்ரோ மெய்நிகர் நுண்ணறிவு என்று அழைக்கலாம்.
வெளிப்படையான கவனப் பொறிமுறை
கவனப் பொறிமுறையை மைக்ரோ மெய்நிகர் நுண்ணறிவாக நாம் கருதினால், அதற்கு மாறாக, நான் முன்பு குறிப்பிட்ட மெய்நிகர் நுண்ணறிவை ஒரு மேக்ரோ கவனப் பொறிமுறையை உருவாக்குவதன் மூலம் அடைய முடியும்.
மேலும் இந்த மேக்ரோ கவனப் பொறிமுறையானது பெரிய மொழி மாதிரிகளின் உள் கட்டமைப்பில் சேர்க்கப்படவோ அல்லது நரம்பியல் வலைப்பின்னல் கற்றலை உள்ளடக்கியதாகவோ இருக்க வேண்டியதில்லை.
இது வெறுமனே இயற்கை மொழியில் எழுதப்பட்ட ஒரு வெளிப்படையான அறிக்கையாக இருக்கலாம், அதாவது: "பணி A ஐச் செயல்படுத்தும்போது, அறிவு B மற்றும் அறிவு C ஐப் பார்க்கவும்."
இது பணி A க்குத் தேவையான அறிவைத் தெளிவுபடுத்துகிறது. இந்த அறிக்கை ஒரு வகையான அறிவு.
இது ஒரு வெளிப்படையான கவனப் பொறிமுறை என்று அழைக்கப்படலாம். இந்தப் பெரிய வாக்கியத்தை கவன அறிவு என்று கருதலாம், இது பணி A ஐச் செய்யும்போது கவனம் செலுத்தப்பட வேண்டிய அறிவை வெளிப்படையாக வெளிப்படுத்துகிறது.
மேலும், இந்த கவன அறிவை உருவாக்க AI ஆல் உருவாக்கலாம் அல்லது புதுப்பிக்கலாம்.
அறிவு பற்றாக்குறை காரணமாக ஒரு பணி தோல்வியுற்றால், அந்தப் பணிக்கு ஒரு குறிப்பாக கூடுதல் அறிவைச் சேர்க்க கவன அறிவைப் புதுப்பிக்கலாம், இது இந்தக் கருத்தாய்வின் அடிப்படையில் அமைந்துள்ளது.
முடிவுரை
கவனப் பொறிமுறையானது உருவாக்க AI இன் திறன்களை வியத்தகு முறையில் மேம்படுத்தியுள்ளது.
இது தற்செயலாக சிறப்பாகச் செயல்பட்ட ஒரு பொறிமுறை மட்டுமல்ல; மாறாக, இங்கு நாம் பார்த்தது போல, ஒவ்வொரு சூழ்நிலைக்கும் குறிப்பிடப்பட வேண்டிய தகவல்களை மாறும் விதமாக குறைக்கும் வழிமுறையே மேம்பட்ட நுண்ணறிவின் சாராம்சமாகத் தெரிகிறது.
மேலும், மெய்நிகர் நுண்ணறிவு மற்றும் வெளிப்படையான கவன அறிவைப் போலவே, கவனப் பொறிமுறையானது பல்வேறு அடுக்குகளில் நுண்ணறிவை தொடர்ச்சியாக மேம்படுத்துவதற்கான திறவுகோலாகும்.