தற்போதைய உருவாக்க AI (Generative AI) என்பது, டிரான்ஸ்ஃபார்மர்களின் (Transformers) கண்டுபிடிப்பால் பெரும் முன்னேற்றம் கண்டு மலர்ந்த ஒரு AI தொழில்நுட்பமாகும்.
கவன ஈர்ப்பு பொறிமுறையே (Attention Mechanism) டிரான்ஸ்ஃபார்மரை ஒற்றை வரியில் வரையறுக்கிறது. இது, டிரான்ஸ்ஃபார்மரை அறிவித்த ஆய்வுக் கட்டுரையின் தலைப்பான "Attention is All You Need" என்பதில் சுருக்கமாக வெளிப்படுத்தப்பட்டுள்ளது.
இதன் வேர்கள், அக்கால AI ஆராய்ச்சியாளர்கள், மனிதர்களைப் போலவே இயல்பு மொழியை AI கையாள உதவும் வகையில் பல்வேறு முயற்சிகளையும் சோதனைகளையும் மேற்கொண்டு, வெற்றியடைந்த பல முறைகளுக்குப் பெயரிட்டு ஆய்வுக் கட்டுரைகளை வெளியிட்டனர் என்பதில் உள்ளன.
பல்வேறு நல்ல செயல்பாட்டு வழிமுறைகளை பல வழிகளில் ஒருங்கிணைப்பதன் மூலம், மனிதர்களைப் போலவே இயல்பு மொழியைக் கையாளக்கூடிய AI படிப்படியாக உருவாகும் என்று பல ஆராய்ச்சியாளர்கள் நம்பினர். எனவே, அவர்கள் மற்ற வழிமுறைகளுடன் இணைந்து செயல்படக்கூடிய புதிய வழிமுறைகளைக் கண்டுபிடிப்பதிலும், இந்த வழிமுறைகளின் உகந்த கலவைகளைக் கண்டறிவதிலும் ஈடுபட்டிருந்தனர்.
இருப்பினும், இந்த மரபு சார்ந்த அறிவை டிரான்ஸ்ஃபார்மர் தகர்த்தது. பல்வேறு வழிமுறைகளை ஒருங்கிணைக்க வேண்டிய அவசியமில்லை, கவன ஈர்ப்பு பொறிமுறை மட்டுமே தேவை என்ற செய்தி, ஆய்வுக் கட்டுரையின் தலைப்பில் வெளிப்படுத்தப்பட்டுள்ளது.
நிச்சயமாக, டிரான்ஸ்ஃபார்மர் itself பல்வேறு வழிமுறைகளை உள்ளடக்கியது என்றாலும், அவற்றில் கவன ஈர்ப்பு பொறிமுறை குறிப்பாகப் புரட்சிகரமானதாகவும் தனித்துவமானதாகவும் இருந்தது என்பதில் சந்தேகமில்லை.
கவன ஈர்ப்பு பொறிமுறையின் கண்ணோட்டம்
கவன ஈர்ப்பு பொறிமுறையானது, இயல்பு மொழியைச் சொல் வாரியாகச் செயலாக்கும்போது, ஒரு குறிப்பிட்ட சொல்லைச் செயலாக்கும் வேளையில், வாக்கியத்தில் அதற்கு முன்னர் வரும் பல சொற்களில் எந்தச் சொல்லுக்கு "கவனம் செலுத்த வேண்டும்" என்பதைக் கற்றுக்கொள்ளக்கூடிய ஒரு அமைப்பாகும்.
இது, "இது," "அது," அல்லது "மேற்கூறியது" (முந்தைய வாக்கியங்களில் உள்ள சொற்களைக் குறிக்கும்) போன்ற சொற்கள் அல்லது "ஆரம்ப வாக்கியம்," "இரண்டாவது எடுத்துக்காட்டு," அல்லது "முந்தைய பத்தி" (உரையில் உள்ள இடங்களைக் குறிக்கும்) போன்ற சொற்றொடர்கள் எதைக் குறிக்கின்றன என்பதை துல்லியமாகப் புரிந்துகொள்ள அனுமதிக்கிறது.
மேலும், ஒரு வாக்கியத்தில் மாற்றியமைக்கும் சொற்கள் வெகுதூரத்தில் இருந்தாலும், அது சொற்களைச் சரியாகப் புரிந்துகொள்ள முடியும். மேலும், ஒரு உரை நீளமாக இருந்தாலும், பிற வாக்கியங்களுக்கு இடையில் தற்போதைய சொல்லின் சூழலை இழக்காமல் புரிந்துகொள்ள முடியும்.
இதுவே "கவனத்தின்" பயன்.
இதற்கு மாறாக, இது தற்போது செயலாக்கப்படும் சொல்லைப் புரிந்துகொள்ளும்போது, தேவையற்ற சொற்கள் மறைக்கப்பட்டு விளக்கத்திலிருந்து அகற்றப்படுகின்றன என்பதையும் குறிக்கிறது.
ஒரு குறிப்பிட்ட சொல்லைப் புரிந்துகொள்வதற்குத் தேவையான சொற்களை மட்டும் தக்கவைத்துக்கொண்டு, பொருத்தமற்ற சொற்களை அகற்றுவதன் மூலம், உரை எவ்வளவு நீளமாக இருந்தாலும், புரிந்துகொள்ளப்பட வேண்டிய சொற்களின் தொகுப்பு ஒரு சிறிய எண்ணிக்கையில் மட்டுமே இருக்கும். இதன் மூலம் புரிந்துகொள்ளும் அடர்த்தி நீர்த்துப்போகாமல் தடுக்கப்படுகிறது.
மெய்நிகர் நுண்ணறிவு (Virtual Intelligence)
இப்போது, தலைப்பை சற்று மாற்றுகிறேன், நான் மெய்நிகர் நுண்ணறிவு என்ற கருத்தைப் பற்றிச் சிந்தித்துக் கொண்டிருக்கிறேன்.
தற்போது, வணிகத்திற்காக உருவாக்கப்படும் AI ஐப் பயன்படுத்தும் போது, ஒரு நிறுவனத்திற்குள் உள்ள அனைத்துத் தகவல்களையும் ஒருங்கிணைத்து, அதை உருவாக்கப்படும் AIக்கு அறிவாக வழங்கினால், அறிவின் அளவு அதிகமாக இருப்பதால், AI அதைச் சரியாகக் கையாள முடியாமல் போகிறது.
இந்தக் காரணத்திற்காக, அறிவை பணி வாரியாகப் பிரிப்பது சிறந்தது. ஒவ்வொரு பணிக்கும் AI சாட்களைத் தயார் செய்வது அல்லது குறிப்பிட்ட செயல்பாடுகளுக்குப் பிரத்யேகமான AI கருவிகளை உருவாக்குவது சிறப்பாகச் செயல்படும்.
இது சிக்கலான பணிகளுக்கு, இந்தத் துண்டிக்கப்பட்ட அறிவு-சார்ந்த AI சாட்களையும் கருவிகளையும் இணைக்க வேண்டிய அவசியம் ஏற்படுகிறது என்பதைக் குறிக்கிறது.
உருவாக்கும் AI ஐப் பயன்படுத்தும் போது இது ஒரு தற்போதைய வரம்பு. ஆனால் எதிர்கால உருவாக்கும் AI உடன் கூட, குறிப்பிட்ட பணிகளுக்கு, அந்தப் பணிக்குத் தேவையான அறிவில் மட்டும் கவனம் செலுத்துவது அதிக துல்லியத்தை அளிக்கும்.
அதற்குப் பதிலாக, எதிர்கால உருவாக்கும் AI ஆனது, மனிதர்கள் அறிவை பிரிக்க வேண்டிய அவசியமில்லாமல், சூழ்நிலையைப் பொறுத்து தேவையான அறிவுத் தொகுப்புகளுக்கு இடையில் உள்நாட்டில் மாற முடியும் என்று நான் நம்புகிறேன்.
இந்தக் capability தான் மெய்நிகர் நுண்ணறிவு. இது ஒரு கணினியில் பல வெவ்வேறு இயக்க முறைமைகளை இயக்கக்கூடிய ஒரு மெய்நிகர் இயந்திரம் போன்றது. அதாவது, ஒரு நுண்ணறிவுக்குள், வெவ்வேறு சிறப்புப் பகுதிகளைக் கொண்ட பல மெய்நிகர் நுண்ணறிவுகள் செயல்பட முடியும்.
தற்போதைய உருவாக்கும் AI கூட பல நபர்களிடையே விவாதங்களை உருவகப்படுத்தலாம் அல்லது பல கதாபாத்திரங்களைக் கொண்ட கதைகளை உருவாக்கலாம். எனவே, மெய்நிகர் நுண்ணறிவு ஒரு சிறப்புத் திறனல்ல, மாறாக தற்போதைய உருவாக்கும் AI இன் ஒரு நீட்டிப்பு ஆகும்.
மைக்ரோ மெய்நிகர் நுண்ணறிவு (Micro Virtual Intelligence)
பணிக்கு ஏற்ப தேவையான அறிவைக் குறைக்கும் மெய்நிகர் நுண்ணறிவின் பொறிமுறையானது, கவன ஈர்ப்பு பொறிமுறைக்கு (attention mechanism) ஒத்த ஒன்றைச் செய்கிறது.
அதாவது, தற்போது செயலாக்கப்படும் பணிக்கு ஏற்ப தொடர்புடைய அறிவில் மட்டுமே கவனம் செலுத்துகிறது என்பதில், இது கவன ஈர்ப்பு பொறிமுறைக்கு ஒத்திருக்கிறது.
மாறாக, கவன ஈர்ப்பு பொறிமுறையானது மெய்நிகர் நுண்ணறிவு போன்ற ஒன்றை உணர்த்தும் ஒரு பொறிமுறை என்று கூறலாம். இருப்பினும், நான் கருதும் மெய்நிகர் நுண்ணறிவு என்பது அறிவுத் தொகுப்பிலிருந்து தொடர்புடைய அறிவைத் தேர்ந்தெடுக்கும் ஒரு பொறிமுறையாகும், அதேசமயம் கவன ஈர்ப்பு பொறிமுறை சொற்களின் தொகுப்பில் செயல்படுகிறது.
இந்தக் காரணத்திற்காக, கவன ஈர்ப்பு பொறிமுறையை ஒரு மைக்ரோ மெய்நிகர் நுண்ணறிவு என்று அழைக்கலாம்.
வெளிப்படையான கவன ஈர்ப்பு பொறிமுறை (Explicit Attention Mechanism)
கவன ஈர்ப்பு பொறிமுறையை ஒரு மைக்ரோ மெய்நிகர் நுண்ணறிவாகக் கருதினால், அதற்கு நேர்மாறாக, நான் முன்னரே குறிப்பிட்ட மெய்நிகர் நுண்ணறிவை ஒரு மேக்ரோ கவன ஈர்ப்பு பொறிமுறையை உருவாக்குவதன் மூலம் உணர முடியும்.
இந்த மேக்ரோ கவன ஈர்ப்பு பொறிமுறையானது பெரிய மொழி மாதிரிகளின் உள் கட்டமைப்பில் சேர்க்கப்படவோ அல்லது நரம்பியல் பிணைய பயிற்சிக்கு உட்படுத்தப்படவோ தேவையில்லை.
"பணி A ஐச் செய்யும்போது, அறிவு B மற்றும் அறிவு C ஐப் பார்க்கவும்" போன்ற இயல்பு மொழியில் எழுதப்பட்ட ஒரு வெளிப்படையான வாக்கியமாக இது இருக்கலாம்.
இது பணி A க்குத் தேவையான அறிவை தெளிவுபடுத்துகிறது. இந்த வாக்கியமே ஒரு வகையான அறிவாகும்.
இதை ஒரு வெளிப்படையான கவன ஈர்ப்பு பொறிமுறை என்று அழைக்கலாம். இந்த வாக்கியமானது கவன ஈர்ப்பு அறிவாக விவரிக்கப்படலாம், இது பணி A ஐச் செய்யும்போது கவனம் செலுத்தப்பட வேண்டிய அறிவை வெளிப்படையாகக் குறிப்பிடுகிறது.
மேலும், இந்த கவன ஈர்ப்பு அறிவை உருவாக்கும் AI ஆல் உருவாக்கலாம் அல்லது புதுப்பிக்கலாம்.
அறிவின் பற்றாக்குறையால் ஒரு பணி தோல்வியுற்றால், கற்றுக்கொண்ட பாடமாக, அந்தப் பணிக்காகக் கூடுதலாகப் பார்க்கப்பட வேண்டிய அறிவைச் சேர்க்க கவன ஈர்ப்பு அறிவை புதுப்பிக்கலாம்.
முடிவுரை
கவன ஈர்ப்பு பொறிமுறையானது உருவாக்கும் AI இன் திறன்களை வியத்தகு முறையில் மேம்படுத்தியுள்ளது.
இது வெறும் தற்செயலாக சிறப்பாகச் செயல்பட்ட ஒரு பொறிமுறை மட்டுமல்ல; இங்கு நாம் கண்டது போல, ஒவ்வொரு சூழ்நிலையிலும் குறிப்பிட வேண்டிய தகவலை மாறும் வகையில் சுருக்கிச் சொல்லும் பொறிமுறையே மேம்பட்ட நுண்ணறிவின் சாரம் என்று தோன்றுகிறது.
மேலும், மெய்நிகர் நுண்ணறிவு மற்றும் வெளிப்படையான கவன அறிவு போன்றே, கவன ஈர்ப்பு பொறிமுறையும் பல்வேறு அடுக்குகளில் நுண்ணறிவை தொடர்ச்சியாக மேம்படுத்துவதற்கான முக்கிய அம்சமாகும்.