సాంప్రదాయ మెషిన్ లెర్నింగ్ అనేది కంప్యూటర్లు, సంఖ్యా గణనలో నైపుణ్యం కలిగి, సంఖ్యా డేటా నుండి నేర్చుకొని సంఖ్యా పారామితులను పొందే ఒక నమూనాలో పనిచేస్తుంది.
మరోవైపు, మనం సంఖ్యా విధానాల ద్వారా మాత్రమే కాకుండా, భాష ద్వారా కూడా నేర్చుకోగలం. మనం అనుభవాలను పదాలుగా క్రమబద్ధీకరించి, రికార్డు చేస్తాం, ఆపై ఆ పదాలను గుర్తుంచుకొని లేదా చదివి వాటిని ఉపయోగిస్తాం.
పెద్ద భాషా నమూనాలు కూడా అదే విధంగా పదాలను ఉపయోగించి జ్ఞానాన్ని వివరించగలవు మరియు వాటిని చదవడం ద్వారా పదాలను ఉపయోగించుకోగలవు.
సహజ భాషా ప్రాసెసర్లు అయిన పెద్ద భాషా నమూనాలను ఉపయోగించడం ద్వారా, కేవలం సంఖ్యా-ఆధారిత మెషిన్ లెర్నింగ్ కాకుండా, సహజ భాషా-ఆధారిత మెషిన్ లెర్నింగ్ కూడా సాధ్యమవుతుంది.
ఫలితంగా, పెద్ద భాషా నమూనాల ఆగమనం ఒక కొత్త రంగాన్ని తెరిచింది: సహజ భాషా మెషిన్ లెర్నింగ్.
పెద్ద భాషా నమూనాలకు సంబంధించిన ప్రీ-ట్రైనింగ్ అనేది సాంప్రదాయ సంఖ్యా మెషిన్ లెర్నింగ్. ఇక్కడ వివరించిన సహజ భాషా మెషిన్ లెర్నింగ్ అనేది ప్రీ-ట్రైన్ చేయబడిన పెద్ద భాషా నమూనాలను ఉపయోగించే ఒక కొత్త రకమైన మెషిన్ లెర్నింగ్ను సూచిస్తుంది.
సహజ భాషా మెషిన్ లెర్నింగ్ యొక్క ప్రాథమిక నమూనా
సహజ భాషా మెషిన్ లెర్నింగ్ సంప్రదాయ సంఖ్యా మెషిన్ లెర్నింగ్తో పోలిస్తే సారూప్యతలు మరియు పూర్తిగా భిన్నమైన అంశాలను కలిగి ఉంది.
ముందుగా, సహజ భాషా మెషిన్ లెర్నింగ్ గురించి ఒక అవగాహన పొందడానికి, సంప్రదాయ సంఖ్యా మెషిన్ లెర్నింగ్తో సారూప్యతలను కలిగి ఉన్న భాగాలను ప్రాథమిక నమూనాగా వివరిస్తాము.
ఇప్పటి నుండి, మేము ముందే శిక్షణ పొందిన పెద్ద భాషా నమూనాని LLM అని సూచిస్తాము. ఈ అభ్యాస ప్రక్రియలో LLM పారామితులు అస్సలు మారవని దయచేసి గమనించండి.
ప్రాథమిక నమూనా అనేది పర్యవేక్షిత అభ్యాసం, వర్గీకరణ సమస్యను లక్ష్యంగా చేసుకుంటుంది.
శిక్షణ డేటా కోసం సరైన సమాధానాలుగా ఇన్పుట్ వాక్యాల మరియు వాటి వర్గీకరణల యొక్క బహుళ జతలు తయారుచేయబడతాయి.
ఉదాహరణకు, ఒక కంపెనీలో జనరల్ అఫైర్స్ డిపార్ట్మెంట్ మరియు అడ్మినిస్ట్రేటివ్ అఫైర్స్ డిపార్ట్మెంట్ ఉన్నాయని అనుకుందాం.
ఈ రెండు డిపార్ట్మెంట్లకు విధుల విభజన ఉంటుంది. "ఆఫీస్ లైట్ బల్బ్ కాలిపోయింది," "నా యాక్సెస్ కార్డ్ని మర్చిపోయాను," లేదా "నేను ప్రధాన కార్యాలయంలోని ప్రధాన హాల్ను రిజర్వ్ చేయాలనుకుంటున్నాను" వంటి ఇన్పుట్ వాక్యాల కోసం, వర్గీకరణ జనరల్ అఫైర్స్ డిపార్ట్మెంట్ లేదా అడ్మినిస్ట్రేటివ్ అఫైర్స్ డిపార్ట్మెంట్ బాధ్యత వహిస్తుందో సూచిస్తుంది.
ఈ శిక్షణ డేటా నుండి, ఇన్పుట్ వాక్యాలు మాత్రమే సంగ్రహించబడి LLMకి ఇవ్వబడతాయి.
ఇక్కడ, ఒక సిస్టమ్ ప్రాంప్ట్గా, మేము ఉద్దేశపూర్వకంగా సమాధానాన్ని పరిమితం చేస్తాము, "ఈ విచారణకు ఏ డిపార్ట్మెంట్, జనరల్ అఫైర్స్ లేదా అడ్మినిస్ట్రేటివ్ అఫైర్స్ బాధ్యత వహిస్తుందో దయచేసి సమాధానం ఇవ్వండి. మీ సమాధానంలో 'జనరల్ అఫైర్స్' లేదా 'అడ్మినిస్ట్రేటివ్ అఫైర్స్' కాకుండా ఇతర అక్షరాలను చేర్చవద్దు."
మొదట, LLM ఈ కంపెనీ గురించి ఎటువంటి జ్ఞానం లేకుండా సమాధానాలను రూపొందిస్తుంది. సహజంగానే, కొన్ని సమాధానాలు తప్పుగా ఉంటాయి, మరికొన్ని అదృష్టం కొద్దీ సరిగ్గా ఉండవచ్చు.
ప్రతి సమాధానం కోసం, ఉపాధ్యాయ వ్యవస్థ అది సరైనదా లేదా తప్పు అని నిర్ణయిస్తుంది. అప్పుడు, ఇన్పుట్ వాక్యం, LLM యొక్క సమాధానం మరియు తీర్పు ఫలితం యొక్క కలయిక ఒక నాలెడ్జ్ బేస్లో సేవ్ చేయబడుతుంది.
ఈ ప్రక్రియ శిక్షణ డేటాలో సగం వరకు పునరావృతమవుతుంది.
మిగిలిన సగం శిక్షణ డేటా కోసం, అదే ప్రక్రియ నిర్వహించబడుతుంది, కానీ ఈసారి నాలెడ్జ్ బేస్లో రికార్డ్ చేయబడిన మొత్తం సమాచారం LLM కోసం సిస్టమ్ ప్రాంప్ట్కు జోడించబడుతుంది.
ఈ సమయంలో, నాలెడ్జ్ బేస్ ఈ కంపెనీలోని జనరల్ అఫైర్స్ మరియు అడ్మినిస్ట్రేటివ్ అఫైర్స్ డిపార్ట్మెంట్ల మధ్య విధుల విభజన గురించి సమాచారాన్ని కలిగి ఉంటుంది, కాబట్టి సరైన సమాధానాలు పొందే సంభావ్యత డేటా యొక్క మొదటి సగం కంటే ఎక్కువగా ఉండాలి.
ఈ విధంగా, LLM మరియు నాలెడ్జ్ బేస్ను కలిపి ఒక సిస్టమ్ ఈ కంపెనీలోని జనరల్ అఫైర్స్ మరియు అడ్మినిస్ట్రేటివ్ అఫైర్స్ డిపార్ట్మెంట్ల మధ్య విధుల విభజనను నేర్చుకోగలదు.
అభ్యాస యంత్రాంగం సంప్రదాయ సంఖ్యా మెషిన్ లెర్నింగ్ను పోలి ఉంటుంది. తేడా ఏమిటంటే, అభ్యాస ఫలితాలు LLMలోని న్యూరల్ నెట్వర్క్ పారామితులలో కాకుండా నాలెడ్జ్ బేస్లో ప్రతిబింబిస్తాయి. మరియు, సంఖ్యలు కాకుండా సహజ భాష నాలెడ్జ్ బేస్లో నమోదు చేయబడుతుంది.
ఇది సహజ భాషా మెషిన్ లెర్నింగ్ యొక్క ప్రాథమిక నమూనా.
ప్రాథమిక నమూనా యొక్క వాస్తవికత
LLMలను ఉపయోగించే ఎవరైనా త్వరగా గ్రహించినట్లుగా, ఈ ప్రాథమిక నమూనాలో వాస్తవికత లేదు.
ఎందుకంటే, సరైన మరియు తప్పు సమాధానాలను నిర్ణయించడానికి టీచర్ సిస్టమ్ను ఏర్పాటు చేసే శ్రమకు బదులుగా, ప్రారంభం నుండే శిక్షణ డేటాను సిస్టమ్ ప్రాంప్ట్లోకి నేరుగా ఇన్పుట్ చేయవచ్చు.
అయితే, ప్రాథమిక నమూనాని వర్తింపజేసి, దృశ్యాన్ని కొద్దిగా మార్చడం ద్వారా, అది వాస్తవికతను పొందుతుంది.
ఉదాహరణకు, జనరల్ అఫైర్స్ మరియు అడ్మినిస్ట్రేటివ్ అఫైర్స్ డిపార్ట్మెంట్లు కలిసి ఒక విచారణ డెస్క్ను ఏర్పాటు చేశాయని, మరియు మానవులు వచ్చే విచారణలను తగిన డిపార్ట్మెంట్కు వ్యక్తిగతంగా వర్గీకరిస్తున్నారని అనుకుందాం.
ఈ విచారణలను మరియు వాటి రూటింగ్ ఫలితాలను నాలెడ్జ్ బేస్కు జోడించడానికి ఒక సాధారణ వ్యవస్థను సృష్టించవచ్చు.
అప్పుడు, ఈ నాలెడ్జ్ బేస్ను ఉపయోగించి, LLM కొత్త విచారణలను డిపార్ట్మెంట్లకు రూట్ చేయడంలో మానవుల నుండి బాధ్యతను స్వీకరించగలదు.
ఈ సందర్భంలో, LLM అడ్మినిస్ట్రేటివ్ అఫైర్స్కు ఉద్దేశించిన విచారణను జనరల్ అఫైర్స్కు తప్పుగా రూట్ చేస్తే, జనరల్ అఫైర్స్లోని బాధ్యత గల వ్యక్తి విచారణను తిరిగి అడ్మినిస్ట్రేటివ్ అఫైర్స్కు రూట్ చేస్తారు. ఈ రీ-రూటింగ్ సమాచారం కూడా నాలెడ్జ్ బేస్లో నమోదు చేయబడుతుంది.
రూటింగ్ లాగ్లను రికార్డ్ చేయడానికి ఈ సాధారణ యంత్రాంగం, LLM మరియు నాలెడ్జ్ బేస్ సిస్టమ్తో కలిపి, సహజ భాషా మెషిన్ లెర్నింగ్ కోసం వాస్తవిక పర్యవేక్షిత నమూనాగా మారుతుంది.
ఇక్కడ ముఖ్యమైన విషయం, మళ్ళీ, LLMలోని న్యూరల్ నెట్వర్క్ పారామితులు అస్సలు మారవు. మరియు ఫీడ్బ్యాక్ అభ్యాస ఫలితాలు సంఖ్యా విలువలు కావు, బదులుగా సహజ భాషా వాక్యాల సేకరణలు.
ఇంకా, ఈ వ్యవస్థ నిస్సందేహంగా మెషిన్ లెర్నింగ్, మానవ అభ్యాసం కాదు.
అందువల్ల, ఇది ఒక కొత్త రకమైన మెషిన్ లెర్నింగ్: సహజ భాష ద్వారా మెషిన్ లెర్నింగ్.
సహజ భాషా మెషిన్ లెర్నింగ్ యొక్క బలాలు
సంఖ్యా మెషిన్ లెర్నింగ్ కాకుండా, సహజ భాషా అభ్యాసం అనేక ప్రయోజనాలను అందిస్తుంది.
ఒక మాటలో చెప్పాలంటే, దాని నిర్వచించే లక్షణం దాని అపారమైన అభ్యాస సామర్థ్యం.
సంఖ్యా మెషిన్ లెర్నింగ్కు సాధారణంగా పెద్ద మొత్తంలో శిక్షణ డేటా మరియు పునరావృత అభ్యాసం అవసరం. శిక్షణ డేటాను ముందే ప్రాసెస్ చేయడం కూడా అవసరం.
పెద్ద మొత్తంలో శిక్షణ డేటా అవసరం ఎందుకంటే నేర్చుకోవాలనుకునే లక్షణాలు ఒకే డేటాలో ఉండవు, కానీ పెద్ద మొత్తంలో డేటాలో విస్తరించి ఉంటాయి.
ఈ కారణంగా, నిజంగా కావలసిన లక్షణాల డైమెన్షన్ యొక్క వర్గం యొక్క క్రమంలో శిక్షణ డేటా అవసరం.
పునరావృత అభ్యాసం అవసరం ఎందుకంటే స్థానిక ఆప్టిమాలకు పడిపోకుండా న్యూరల్ నెట్వర్క్ పారామితులు సముచితంగా నేర్చుకోబడ్డాయని నిర్ధారించుకోవడానికి ఒకే ఫీడ్బ్యాక్ లూప్ సమయంలో పారామితులలో మార్పు తక్కువగా ఉండాలి.
నిజంగా కావలసిన లక్షణాలను హైలైట్ చేయడానికి నార్మలైజేషన్ మరియు ఎడ్జ్ ఎక్స్ట్రాక్షన్ వంటి శిక్షణ డేటా యొక్క ముందస్తు ప్రాసెసింగ్ అవసరం. ఈ ముందస్తు ప్రాసెసింగ్కు కూడా గణనీయమైన ప్రయత్నం అవసరం.
ఉదాహరణకు, పరిపాలనా మరియు సాధారణ వ్యవహారాల విభాగాల మధ్య విధుల విభజనను సాంప్రదాయ న్యూరల్ నెట్వర్క్ను ఉపయోగించి నేర్చుకోవాలంటే, దాని లక్షణాలు 50-డైమెన్షనల్గా ఉంటే, కనీసం 1000 లేదా అంతకంటే ఎక్కువ శిక్షణ డేటా పాయింట్లు అవసరం. అదనంగా, ఈ 1000+ డేటా పాయింట్లు తగినంత అభ్యాస ఖచ్చితత్వాన్ని సాధించడానికి సుమారు 100 సార్లు పునరావృతం చేయవలసి ఉంటుంది.
అంతేకాకుండా, ఈ 1000 డేటా పాయింట్లు అనవసరమైన పదాలను, పద స్పెల్లింగ్లలో వైవిధ్యాలను లేదా వివిధ రకాల పద క్రమాలు మరియు వాక్యనిర్మాణాలను కలిగి ఉంటే, అభ్యాస సామర్థ్యం తగ్గుతుంది, లేదా సంబంధం లేని లక్షణాలు నేర్చుకోబడతాయి.
అందువల్ల, అనవసరమైన పదాలను తొలగించడానికి, వైవిధ్యాలను తొలగించడానికి పదజాలాన్ని ప్రామాణీకరించడానికి, మరియు పద క్రమం మరియు వాక్యనిర్మాణాన్ని ఏకీకృతం చేయడానికి ముందస్తు ప్రాసెసింగ్ అనివార్యం.
మరోవైపు, సహజ భాషా మెషిన్ లెర్నింగ్కు తక్కువ శిక్షణ డేటా అవసరం, అదే శిక్షణ డేటాతో పునరావృతం అవసరం లేదు, మరియు చాలా సందర్భాలలో, ముందస్తు ప్రాసెసింగ్ అవసరం లేదు.
పరిపాలనా మరియు సాధారణ వ్యవహారాల విభాగాల మధ్య విధుల విభజన యొక్క లక్షణాలు 50-డైమెన్షనల్గా ఉంటే, ప్రతి డైమెన్షన్కు సంబంధించిన 50 సమాచార భాగాలు తరచుగా సరిపోతాయి.
అంతేకాకుండా, దీని అర్థం 50 వేర్వేరు వాక్యాలు అవసరం అని కాదు.
"A, B, C, మరియు Dకి సంబంధించిన విధులు పరిపాలనా విభాగాంచే నిర్వహించబడతాయి" వంటి ఒకే వాక్యం నాలుగు డైమెన్షన్ల కోసం సమాచారాన్ని చేర్చవచ్చు.
అంతేకాకుండా, భాషను అబ్స్ట్రాక్ట్ చేయడం ద్వారా, బహుళ డైమెన్షన్ల నుండి సమాచారాన్ని సమగ్రపరచవచ్చు. "భవన వినియోగ వస్తువులు మరియు పరికరాల నిర్వహణ పరిపాలనా విభాగాంచే బాధ్యత వహిస్తుంది" వంటి ఒకే వాక్యం లైట్ బల్బ్ మార్పిడి మరియు ఆటోమేటిక్ డోర్ లోపాలతో సహా విస్తృత శ్రేణి డైమెన్షన్ల నుండి సమాచారాన్ని సమగ్రపరుస్తుంది.
ఈ అబ్స్ట్రాక్షన్ LLM యొక్క ప్రీ-ట్రైన్ చేయబడిన జ్ఞానం మరియు తార్కిక సామర్థ్యాలను ప్రభావితం చేస్తుంది, తద్వారా అవసరమైన శిక్షణ డేటా మొత్తాన్ని తగ్గిస్తుంది.
మరియు, ప్రాథమికంగా, సహజ భాషా అభ్యాసానికి పునరావృత అభ్యాసం అవసరం లేదు. పైన పేర్కొన్న వాక్యం నాలెడ్జ్ బేస్కు జోడించబడిన తర్వాత, అభ్యాసం పూర్తవుతుంది.
అంతేకాకుండా, జ్ఞానాన్ని ముందే ప్రాసెస్ చేయడం అవసరం లేదు. పరిపాలనా లేదా సాధారణ వ్యవహారాల విభాగాల వివరణలు వివిధ ఇతర వాక్యాలతో కలిపి ఉన్నప్పటికీ, వాటిని జ్ఞానంగా ఉపయోగించవచ్చు.
లేదా, మునుపటి ఉదాహరణలో వలె విచారణలు మరియు అసైన్మెంట్ల లాగ్ల వంటి ముడి డేటాను, ముందస్తు ప్రాసెసింగ్ లేకుండా తక్షణమే శిక్షణ డేటాగా ఉపయోగించవచ్చు.
ఈ విధంగా, సహజ భాషా మెషిన్ లెర్నింగ్ సంఖ్యా మెషిన్ లెర్నింగ్ కంటే చాలా సమర్థవంతంగా నేర్చుకోగలదు.
ముగింపు
కంప్యూటర్ల యొక్క అధిక-వేగ సంఖ్యా గణన సామర్థ్యాలతో పోలిస్తే, పెద్ద భాషా నమూనాల సహజ భాషా ప్రాసెసింగ్ సామర్థ్యాలు చాలా నెమ్మదిగా ఉంటాయి.
అయినప్పటికీ, సంఖ్యా మెషిన్ లెర్నింగ్తో పోలిస్తే సహజ భాషా మెషిన్ లెర్నింగ్ మరింత సమర్థవంతమైన అభ్యాసానికి అనుమతిస్తుంది.
ఈ సామర్థ్యం అధిక-వేగ సంఖ్యా గణన సామర్థ్యాలు మరియు నెమ్మదిగా ఉన్న సహజ భాషా ప్రాసెసింగ్ సామర్థ్యాల మధ్య ఉన్న అంతరాన్ని చాలా ఎక్కువగా అధిగమిస్తుంది.
అంతేకాకుండా, సంఖ్యా అభ్యాసం ద్వారా అద్భుతమైన పరిణామానికి లోనైన పెద్ద భాషా నమూనాలు, స్కేలింగ్ నియమాల ప్రకారం, సరళమైన స్కేలింగ్ అప్ ద్వారా సామర్థ్యం మెరుగుదలలో ఒక పరిమితికి చేరుకుంటున్నట్లు కనిపిస్తున్నాయి.
ఆ సందర్భంలో, సహజ భాషా మెషిన్ లెర్నింగ్ ద్వారా సామర్థ్యాలను మెరుగుపరచడంపై దృష్టి మారే అవకాశం చాలా ఉంది.