ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ | ਕਤੋਸ਼ੀ ਦੇ ਖੋਜ ਨੋਟਸ

ਰਵਾਇਤੀ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਇੱਕ ਅਜਿਹੇ ਪੈਰਾਡਾਈਮ ਵਿੱਚ ਕੰਮ ਕਰਦੀ ਹੈ ਜਿੱਥੇ ਕੰਪਿਊਟਰ, ਸੰਖਿਆਤਮਕ ਗਣਨਾ ਵਿੱਚ ਨਿਪੁੰਨ ਹੋਣ ਕਰਕੇ, ਸੰਖਿਆਤਮਕ ਡੇਟਾ ਤੋਂ ਸਿੱਖਦੇ ਹਨ ਅਤੇ ਸੰਖਿਆਤਮਕ ਪੈਰਾਮੀਟਰ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਨ।

ਦੂਜੇ ਪਾਸੇ, ਅਸੀਂ ਨਾ ਸਿਰਫ਼ ਸੰਖਿਆਤਮਕ ਵਿਧੀਆਂ ਰਾਹੀਂ, ਬਲਕਿ ਭਾਸ਼ਾ ਰਾਹੀਂ ਵੀ ਸਿੱਖਣ ਦੇ ਸਮਰੱਥ ਹਾਂ। ਅਸੀਂ ਅਨੁਭਵਾਂ ਨੂੰ ਸ਼ਬਦਾਂ ਵਜੋਂ ਸੰਗਠਿਤ ਅਤੇ ਰਿਕਾਰਡ ਕਰਦੇ ਹਾਂ, ਫਿਰ ਉਹਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਉਹਨਾਂ ਸ਼ਬਦਾਂ ਨੂੰ ਯਾਦ ਕਰਦੇ ਹਾਂ ਜਾਂ ਪੜ੍ਹਦੇ ਹਾਂ।

ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲ ਵੀ ਇਸੇ ਤਰ੍ਹਾਂ ਸ਼ਬਦਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਗਿਆਨ ਦਾ ਵਰਣਨ ਕਰ ਸਕਦੇ ਹਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਪੜ੍ਹ ਕੇ ਸ਼ਬਦਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹਨ।

ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ ਦਾ ਲਾਭ ਉਠਾਉਂਦੇ ਹੋਏ, ਜੋ ਕਿ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਰ ਹਨ, ਕੁਦਰਤੀ ਭਾਸ਼ਾ-ਆਧਾਰਿਤ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਸੰਭਵ ਹੋ ਜਾਂਦੀ ਹੈ, ਨਾ ਕਿ ਸਿਰਫ਼ ਸੰਖਿਆਤਮਕ-ਆਧਾਰਿਤ ਮਸ਼ੀਨ ਲਰਨਿੰਗ।

ਨਤੀਜੇ ਵਜੋਂ, ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ ਦੇ ਆਗਮਨ ਨੇ ਇੱਕ ਨਵਾਂ ਖੇਤਰ ਖੋਲ੍ਹਿਆ ਹੈ: ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ।

ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ ਦੀ ਪ੍ਰੀ-ਟਰੇਨਿੰਗ ਰਵਾਇਤੀ ਸੰਖਿਆਤਮਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਹੈ। ਇੱਥੇ ਵਰਣਿਤ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਇੱਕ ਨਵੇਂ ਕਿਸਮ ਦੀ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ ਜੋ ਪ੍ਰੀ-ਟਰੇਨ ਕੀਤੇ ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ।

ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਮੁੱਢਲਾ ਮਾਡਲ

ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਿੱਚ ਅਜਿਹੇ ਪਹਿਲੂ ਹਨ ਜੋ ਰਵਾਇਤੀ ਸੰਖਿਆਤਮਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਸਮਾਨ ਹਨ, ਅਤੇ ਕੁਝ ਬਿਲਕੁਲ ਵੱਖਰੇ ਵੀ ਹਨ।

ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੀ ਇੱਕ ਤਸਵੀਰ ਨੂੰ ਸਮਝਣ ਲਈ, ਅਸੀਂ ਉਹਨਾਂ ਹਿੱਸਿਆਂ ਦੀ ਵਿਆਖਿਆ ਕਰਾਂਗੇ ਜੋ ਰਵਾਇਤੀ ਸੰਖਿਆਤਮਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਸਮਾਨ ਹਨ, ਇੱਕ ਮੁੱਢਲੇ ਮਾਡਲ ਵਜੋਂ।

ਇਸ ਬਿੰਦੂ ਤੋਂ, ਅਸੀਂ ਇੱਕ ਪ੍ਰੀ-ਟ੍ਰੇਨਡ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ ਨੂੰ LLM ਵਜੋਂ ਸੰਦਰਭਿਤ ਕਰਾਂਗੇ। ਕਿਰਪਾ ਕਰਕੇ ਨੋਟ ਕਰੋ ਕਿ ਇਸ ਸਿੱਖਣ ਪ੍ਰਕਿਰਿਆ ਦੌਰਾਨ LLM ਦੇ ਪੈਰਾਮੀਟਰ ਬਿਲਕੁਲ ਵੀ ਨਹੀਂ ਬਦਲਦੇ।

ਮੁੱਢਲਾ ਮਾਡਲ ਇੱਕ ਨਿਗਰਾਨੀ ਅਧੀਨ ਸਿੱਖਣ (supervised learning) ਹੈ, ਜਿਸਦਾ ਟੀਚਾ ਇੱਕ ਵਰਗੀਕਰਨ ਸਮੱਸਿਆ ਹੈ।

ਸਿਖਲਾਈ ਡੇਟਾ ਲਈ ਸਹੀ ਉੱਤਰਾਂ ਵਜੋਂ ਇਨਪੁਟ ਵਾਕਾਂਸ਼ਾਂ ਅਤੇ ਉਹਨਾਂ ਦੇ ਵਰਗੀਕਰਨਾਂ ਦੇ ਕਈ ਜੋੜੇ ਤਿਆਰ ਕੀਤੇ ਜਾਂਦੇ ਹਨ।

ਉਦਾਹਰਨ ਲਈ, ਮੰਨ ਲਓ ਕਿਸੇ ਕੰਪਨੀ ਵਿੱਚ ਇੱਕ ਜਨਰਲ ਅਫੇਅਰਸ ਵਿਭਾਗ (General Affairs Department) ਅਤੇ ਇੱਕ ਪ੍ਰਸ਼ਾਸਕੀ ਅਫੇਅਰਸ ਵਿਭਾਗ (Administrative Affairs Department) ਹੈ।

ਇਹਨਾਂ ਦੋ ਵਿਭਾਗਾਂ ਦੀਆਂ ਡਿਊਟੀਆਂ ਦੀ ਵੰਡ ਹੈ। "ਦਫਤਰ ਦਾ ਬਲਬ ਖਰਾਬ ਹੈ," "ਮੈਂ ਆਪਣਾ ਐਕਸੈਸ ਕਾਰਡ ਭੁੱਲ ਗਿਆ," ਜਾਂ "ਮੈਂ ਮੁੱਖ ਦਫਤਰ ਵਿੱਚ ਮੁੱਖ ਹਾਲ ਰਿਜ਼ਰਵ ਕਰਨਾ ਚਾਹੁੰਦਾ ਹਾਂ" ਵਰਗੇ ਇਨਪੁਟ ਵਾਕਾਂਸ਼ਾਂ ਲਈ, ਵਰਗੀਕਰਨ ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਜਨਰਲ ਅਫੇਅਰਸ ਵਿਭਾਗ ਜਾਂ ਪ੍ਰਸ਼ਾਸਕੀ ਅਫੇਅਰਸ ਵਿਭਾਗ ਵਿੱਚੋਂ ਕੌਣ ਜ਼ਿੰਮੇਵਾਰ ਹੈ।

ਇਸ ਸਿਖਲਾਈ ਡੇਟਾ ਤੋਂ, ਸਿਰਫ਼ ਇਨਪੁਟ ਵਾਕਾਂਸ਼ਾਂ ਨੂੰ ਕੱਢਿਆ ਜਾਂਦਾ ਹੈ ਅਤੇ LLM ਵਿੱਚ ਫੀਡ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਇੱਥੇ, ਇੱਕ ਸਿਸਟਮ ਪ੍ਰੋਂਪਟ ਵਜੋਂ, ਅਸੀਂ ਜਾਣਬੁੱਝ ਕੇ ਜਵਾਬ ਨੂੰ ਸੀਮਤ ਕਰਦੇ ਹੋਏ ਕਹਿੰਦੇ ਹਾਂ, "ਕਿਰਪਾ ਕਰਕੇ ਦੱਸੋ ਕਿ ਇਸ ਪੁੱਛਗਿੱਛ ਲਈ ਕਿਹੜਾ ਵਿਭਾਗ, ਜਨਰਲ ਅਫੇਅਰਸ ਜਾਂ ਪ੍ਰਸ਼ਾਸਕੀ ਅਫੇਅਰਸ, ਜ਼ਿੰਮੇਵਾਰ ਹੈ। ਆਪਣੇ ਜਵਾਬ ਵਿੱਚ 'ਜਨਰਲ ਅਫੇਅਰਸ' ਜਾਂ 'ਪ੍ਰਸ਼ਾਸਕੀ ਅਫੇਅਰਸ' ਤੋਂ ਇਲਾਵਾ ਕੋਈ ਹੋਰ ਅੱਖਰ ਸ਼ਾਮਲ ਨਾ ਕਰੋ।"

ਸ਼ੁਰੂ ਵਿੱਚ, LLM ਇਸ ਕੰਪਨੀ ਦੇ ਕਿਸੇ ਵੀ ਗਿਆਨ ਤੋਂ ਬਿਨਾਂ ਜਵਾਬ ਤਿਆਰ ਕਰੇਗਾ। ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ, ਕੁਝ ਜਵਾਬ ਗਲਤ ਹੋਣਗੇ, ਜਦੋਂ ਕਿ ਕੁਝ ਇਤਫ਼ਾਕ ਨਾਲ ਸਹੀ ਹੋ ਸਕਦੇ ਹਨ।

ਹਰੇਕ ਜਵਾਬ ਲਈ, ਅਧਿਆਪਕ ਸਿਸਟਮ ਇਹ ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ ਕਿ ਇਹ ਸਹੀ ਹੈ ਜਾਂ ਗਲਤ। ਫਿਰ, ਇਨਪੁਟ ਵਾਕਾਂਸ਼, LLM ਦੇ ਜਵਾਬ, ਅਤੇ ਨਿਰਣੇ ਦੇ ਨਤੀਜੇ ਦੇ ਸੁਮੇਲ ਨੂੰ ਇੱਕ ਗਿਆਨ ਅਧਾਰ (knowledge base) ਵਿੱਚ ਸੁਰੱਖਿਅਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਇਹ ਪ੍ਰਕਿਰਿਆ ਸਿਖਲਾਈ ਡੇਟਾ ਦੇ ਲਗਭਗ ਅੱਧੇ ਹਿੱਸੇ ਲਈ ਦੁਹਰਾਈ ਜਾਂਦੀ ਹੈ।

ਸਿਖਲਾਈ ਡੇਟਾ ਦੇ ਬਾਕੀ ਅੱਧੇ ਹਿੱਸੇ ਲਈ, ਉਸੇ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦੁਬਾਰਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਪਰ ਇਸ ਵਾਰ ਗਿਆਨ ਅਧਾਰ ਵਿੱਚ ਦਰਜ ਸਾਰੀ ਜਾਣਕਾਰੀ LLM ਲਈ ਸਿਸਟਮ ਪ੍ਰੋਂਪਟ ਵਿੱਚ ਜੋੜੀ ਜਾਂਦੀ ਹੈ।

ਇਸ ਸਮੇਂ, ਗਿਆਨ ਅਧਾਰ ਵਿੱਚ ਇਸ ਕੰਪਨੀ ਦੇ ਜਨਰਲ ਅਫੇਅਰਸ ਅਤੇ ਪ੍ਰਸ਼ਾਸਕੀ ਅਫੇਅਰਸ ਵਿਭਾਗਾਂ ਵਿਚਕਾਰ ਕਰਤੱਵਾਂ ਦੀ ਵੰਡ ਬਾਰੇ ਜਾਣਕਾਰੀ ਸ਼ਾਮਲ ਹੈ, ਇਸ ਲਈ ਸਹੀ ਜਵਾਬ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਸੰਭਾਵਨਾ ਡੇਟਾ ਦੇ ਪਹਿਲੇ ਅੱਧ ਨਾਲੋਂ ਵੱਧ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ।

ਇਸ ਤਰ੍ਹਾਂ, LLM ਅਤੇ ਗਿਆਨ ਅਧਾਰ ਨੂੰ ਜੋੜਨ ਵਾਲਾ ਇੱਕ ਸਿਸਟਮ ਇਸ ਕੰਪਨੀ ਦੇ ਜਨਰਲ ਅਫੇਅਰਸ ਅਤੇ ਪ੍ਰਸ਼ਾਸਕੀ ਅਫੇਅਰਸ ਵਿਭਾਗਾਂ ਵਿਚਕਾਰ ਕਰਤੱਵਾਂ ਦੀ ਵੰਡ ਨੂੰ ਸਿੱਖ ਸਕਦਾ ਹੈ।

ਸਿੱਖਣ ਦੀ ਵਿਧੀ ਖੁਦ ਰਵਾਇਤੀ ਸੰਖਿਆਤਮਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਸਮਾਨ ਹੈ। ਫਰਕ ਇਹ ਹੈ ਕਿ ਸਿੱਖਣ ਦੇ ਨਤੀਜੇ LLM ਦੇ ਅੰਦਰ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਦੇ ਪੈਰਾਮੀਟਰਾਂ ਵਿੱਚ ਨਹੀਂ, ਬਲਕਿ ਗਿਆਨ ਅਧਾਰ ਵਿੱਚ ਦਰਸਾਏ ਜਾਂਦੇ ਹਨ। ਅਤੇ, ਗਿਆਨ ਅਧਾਰ ਵਿੱਚ ਸੰਖਿਆਵਾਂ ਦੀ ਬਜਾਏ, ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦਰਜ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।

ਇਹ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਮੁੱਢਲਾ ਮਾਡਲ ਹੈ।

ਬੁਨਿਆਦੀ ਮਾਡਲ ਦੀ ਹਕੀਕਤ

ਜਿਵੇਂ ਕਿ LLM ਦਾ ਲਾਭ ਉਠਾਉਣ ਵਾਲਾ ਕੋਈ ਵੀ ਵਿਅਕਤੀ ਜਲਦੀ ਹੀ ਸਮਝ ਜਾਵੇਗਾ, ਇਸ ਬੁਨਿਆਦੀ ਮਾਡਲ ਵਿੱਚ ਵਾਸਤਵਿਕਤਾ ਦੀ ਘਾਟ ਹੈ।

ਇਸ ਦਾ ਕਾਰਨ ਇਹ ਹੈ ਕਿ, ਇੱਕ ਅਧਿਆਪਕ ਪ੍ਰਣਾਲੀ ਦੁਆਰਾ ਸਹੀ ਅਤੇ ਗਲਤ ਜਵਾਬਾਂ ਦਾ ਪਤਾ ਲਗਾਉਣ ਦੀ ਮੁਸ਼ਕਲ ਵਿੱਚੋਂ ਲੰਘਣ ਦੀ ਬਜਾਏ, ਕੋਈ ਵੀ ਸ਼ੁਰੂਆਤ ਤੋਂ ਹੀ ਸਿਖਲਾਈ ਡੇਟਾ ਨੂੰ ਸਿਸਟਮ ਪ੍ਰੋਂਪਟ ਵਿੱਚ ਸਿੱਧਾ ਦਾਖਲ ਕਰ ਸਕਦਾ ਹੈ।

ਹਾਲਾਂਕਿ, ਬੁਨਿਆਦੀ ਮਾਡਲ ਨੂੰ ਲਾਗੂ ਕਰਨ ਅਤੇ ਦ੍ਰਿਸ਼ ਨੂੰ ਥੋੜ੍ਹਾ ਬਦਲਣ ਨਾਲ, ਇਹ ਵਾਸਤਵਿਕਤਾ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ।

ਉਦਾਹਰਨ ਲਈ, ਮੰਨ ਲਓ ਕਿ ਜਨਰਲ ਅਫੇਅਰਸ ਅਤੇ ਪ੍ਰਸ਼ਾਸਕੀ ਅਫੇਅਰਸ ਵਿਭਾਗਾਂ ਨੇ ਸਾਂਝੇ ਤੌਰ 'ਤੇ ਇੱਕ ਪੁੱਛਗਿੱਛ ਡੈਸਕ ਸਥਾਪਤ ਕੀਤਾ ਹੈ, ਅਤੇ ਮਨੁੱਖੀ ਕਰਮਚਾਰੀ ਆਉਣ ਵਾਲੀਆਂ ਪੁੱਛਗਿੱਛਾਂ ਨੂੰ ਵਿਅਕਤੀਗਤ ਤੌਰ 'ਤੇ ਉਚਿਤ ਵਿਭਾਗ ਵਿੱਚ ਛਾਂਟਦੇ ਹਨ।

ਇਹਨਾਂ ਪੁੱਛਗਿੱਛਾਂ ਅਤੇ ਉਹਨਾਂ ਦੇ ਰੂਟਿੰਗ ਨਤੀਜਿਆਂ ਨੂੰ ਗਿਆਨ ਅਧਾਰ ਵਿੱਚ ਜੋੜਨ ਲਈ ਇੱਕ ਸਧਾਰਨ ਪ੍ਰਣਾਲੀ ਬਣਾਈ ਜਾ ਸਕਦੀ ਹੈ।

ਫਿਰ, ਇਸ ਗਿਆਨ ਅਧਾਰ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, LLM ਨਵੀਆਂ ਪੁੱਛਗਿੱਛਾਂ ਨੂੰ ਵਿਭਾਗਾਂ ਤੱਕ ਪਹੁੰਚਾਉਣ ਵਿੱਚ ਮਨੁੱਖਾਂ ਦੀ ਥਾਂ ਲੈ ਸਕਦਾ ਹੈ।

ਇਸ ਸਥਿਤੀ ਵਿੱਚ, ਜੇ LLM ਪ੍ਰਸ਼ਾਸਕੀ ਅਫੇਅਰਸ ਲਈ ਨਿਰਧਾਰਤ ਕੀਤੀ ਗਈ ਪੁੱਛਗਿੱਛ ਨੂੰ ਗਲਤ ਢੰਗ ਨਾਲ ਜਨਰਲ ਅਫੇਅਰਸ ਵਿੱਚ ਭੇਜਦਾ ਹੈ, ਤਾਂ ਜਨਰਲ ਅਫੇਅਰਸ ਦਾ ਇੰਚਾਰਜ ਵਿਅਕਤੀ ਪੁੱਛਗਿੱਛ ਨੂੰ ਵਾਪਸ ਪ੍ਰਸ਼ਾਸਕੀ ਅਫੇਅਰਸ ਵਿੱਚ ਭੇਜ ਦੇਵੇਗਾ। ਇਹ ਮੁੜ-ਰੂਟਿੰਗ ਜਾਣਕਾਰੀ ਵੀ ਗਿਆਨ ਅਧਾਰ ਵਿੱਚ ਦਰਜ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।

ਰੂਟਿੰਗ ਲੌਗਸ ਨੂੰ ਰਿਕਾਰਡ ਕਰਨ ਲਈ ਇਹ ਸਧਾਰਨ ਵਿਧੀ, LLM ਅਤੇ ਗਿਆਨ ਅਧਾਰ ਪ੍ਰਣਾਲੀ ਦੇ ਨਾਲ ਮਿਲ ਕੇ, ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਲਈ ਇੱਕ ਯਥਾਰਥਵਾਦੀ ਨਿਗਰਾਨੀ ਅਧੀਨ ਮਾਡਲ ਬਣ ਜਾਵੇਗੀ।

ਇੱਥੇ ਮੁੱਖ ਬਿੰਦੂ, ਦੁਬਾਰਾ, ਇਹ ਹੈ ਕਿ LLM ਦੇ ਅੰਦਰ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਪੈਰਾਮੀਟਰ ਬਿਲਕੁਲ ਵੀ ਨਹੀਂ ਬਦਲਦੇ। ਅਤੇ ਫੀਡਬੈਕ ਸਿੱਖਣ ਦੇ ਨਤੀਜੇ ਸੰਖਿਆਤਮਕ ਮੁੱਲ ਨਹੀਂ ਹਨ, ਬਲਕਿ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੇ ਵਾਕਾਂ ਦਾ ਸੰਗ੍ਰਹਿ ਹਨ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਹ ਪ੍ਰਣਾਲੀ ਬਿਨਾਂ ਸ਼ੱਕ ਇੱਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਪ੍ਰਣਾਲੀ ਹੈ, ਮਨੁੱਖੀ ਸਿੱਖਣ ਵਾਲੀ ਪ੍ਰਣਾਲੀ ਨਹੀਂ।

ਇਸ ਲਈ, ਇਹ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਇੱਕ ਨਵਾਂ ਰੂਪ ਹੈ: ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੁਆਰਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ।

ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੀਆਂ ਸ਼ਕਤੀਆਂ

ਸੰਖਿਆਤਮਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਉਲਟ, ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਸਿੱਖਣ ਦੇ ਕਈ ਫਾਇਦੇ ਹਨ।

ਇੱਕ ਸ਼ਬਦ ਵਿੱਚ, ਇਸਦੀ ਪਰਿਭਾਸ਼ਿਤ ਵਿਸ਼ੇਸ਼ਤਾ ਇਸਦੀ ਬਹੁਤ ਜ਼ਿਆਦਾ ਸਿੱਖਣ ਦੀ ਕੁਸ਼ਲਤਾ ਹੈ।

ਸੰਖਿਆਤਮਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨੂੰ ਆਮ ਤੌਰ 'ਤੇ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਸਿਖਲਾਈ ਡੇਟਾ ਅਤੇ ਦੁਹਰਾਉਣ ਵਾਲੇ ਸਿੱਖਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਪੂਰਵ-ਪ੍ਰੋਸੈਸਿੰਗ ਵੀ ਜ਼ਰੂਰੀ ਹੈ।

ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਕਿਉਂਕਿ ਜੋ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਸਿੱਖਣੀਆਂ ਚਾਹੁੰਦੇ ਹਨ ਉਹ ਡੇਟਾ ਦੇ ਇੱਕ ਟੁਕੜੇ ਵਿੱਚ ਸ਼ਾਮਲ ਨਹੀਂ ਹੁੰਦੀਆਂ, ਬਲਕਿ ਡੇਟਾ ਦੀ ਇੱਕ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਵੰਡੀਆਂ ਹੁੰਦੀਆਂ ਹਨ।

ਇਸ ਕਾਰਨ ਕਰਕੇ, ਅਸਲ ਵਿੱਚ ਲੋੜੀਂਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਆਯਾਮ ਦੇ ਵਰਗ ਦੇ ਕ੍ਰਮ ਵਿੱਚ ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਦੁਹਰਾਉਣ ਵਾਲੇ ਸਿੱਖਣ ਦੀ ਜ਼ਰੂਰਤ ਹੁੰਦੀ ਹੈ ਕਿਉਂਕਿ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਕਿ ਨਿਊਰਲ ਨੈਟਵਰਕ ਪੈਰਾਮੀਟਰਾਂ ਨੂੰ ਸਥਾਨਕ ਓਪਟਿਮਾ ਵਿੱਚ ਡਿੱਗਣ ਤੋਂ ਬਿਨਾਂ ਢੁਕਵੇਂ ਰੂਪ ਵਿੱਚ ਸਿੱਖਿਆ ਜਾਂਦਾ ਹੈ, ਇੱਕ ਸਿੰਗਲ ਫੀਡਬੈਕ ਲੂਪ ਦੌਰਾਨ ਪੈਰਾਮੀਟਰਾਂ ਵਿੱਚ ਤਬਦੀਲੀ ਛੋਟੀ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ।

ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਪੂਰਵ-ਪ੍ਰੋਸੈਸਿੰਗ, ਜਿਵੇਂ ਕਿ ਨੋਰਮਲਾਈਜ਼ੇਸ਼ਨ ਅਤੇ ਐਜ ਐਕਸਟਰੈਕਸ਼ਨ, ਅਸਲ ਵਿੱਚ ਲੋੜੀਂਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਉਜਾਗਰ ਕਰਨ ਲਈ ਜ਼ਰੂਰੀ ਹੈ। ਇਸ ਪੂਰਵ-ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਵੀ ਮਹੱਤਵਪੂਰਨ ਯਤਨਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਉਦਾਹਰਨ ਲਈ, ਜੇ ਪ੍ਰਸ਼ਾਸਕੀ ਅਤੇ ਜਨਰਲ ਅਫੇਅਰਸ ਵਿਭਾਗਾਂ ਵਿਚਕਾਰ ਕਰਤੱਵਾਂ ਦੀ ਵੰਡ ਨੂੰ ਇੱਕ ਰਵਾਇਤੀ ਨਿਊਰਲ ਨੈਟਵਰਕ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਿੱਖਿਆ ਜਾਣਾ ਸੀ, ਅਤੇ ਇਸ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ 50-ਅਯਾਮੀ ਸਨ, ਤਾਂ ਘੱਟੋ-ਘੱਟ 1000 ਜਾਂ ਇਸ ਤੋਂ ਵੱਧ ਸਿਖਲਾਈ ਡੇਟਾ ਪੁਆਇੰਟਾਂ ਦੀ ਲੋੜ ਹੋਵੇਗੀ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਢੁਕਵੀਂ ਸਿੱਖਣ ਦੀ ਸ਼ੁੱਧਤਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਇਹਨਾਂ 1000+ ਡੇਟਾ ਪੁਆਇੰਟਾਂ ਨੂੰ ਲਗਭਗ 100 ਵਾਰ ਦੁਹਰਾਉਣ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਜੇ ਇਹਨਾਂ 1000 ਡੇਟਾ ਪੁਆਇੰਟਾਂ ਵਿੱਚ ਬੇਲੋੜੇ ਸ਼ਬਦ, ਸ਼ਬਦਾਂ ਦੇ ਸਪੈਲਿੰਗ ਵਿੱਚ ਭਿੰਨਤਾਵਾਂ, ਜਾਂ ਕਈ ਤਰ੍ਹਾਂ ਦੇ ਸ਼ਬਦ ਕ੍ਰਮ ਅਤੇ ਵਾਕ-ਵਿਓਂਤ ਸ਼ਾਮਲ ਹਨ, ਤਾਂ ਸਿੱਖਣ ਦੀ ਕੁਸ਼ਲਤਾ ਘੱਟ ਜਾਵੇਗੀ, ਜਾਂ ਗੈਰ-ਸੰਬੰਧਿਤ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਸਿੱਖੀਆਂ ਜਾਣਗੀਆਂ।

ਇਸ ਲਈ, ਬੇਲੋੜੇ ਸ਼ਬਦਾਂ ਨੂੰ ਹਟਾਉਣ, ਭਿੰਨਤਾਵਾਂ ਨੂੰ ਖਤਮ ਕਰਨ ਲਈ ਸ਼ਬਦਾਵਲੀ ਨੂੰ ਮਾਨਕੀਕਰਨ ਕਰਨ, ਅਤੇ ਸ਼ਬਦ ਕ੍ਰਮ ਅਤੇ ਵਾਕ-ਵਿਓਂਤ ਨੂੰ ਇਕਸਾਰ ਕਰਨ ਲਈ ਪੂਰਵ-ਪ੍ਰੋਸੈਸਿੰਗ ਲਾਜ਼ਮੀ ਹੈ।

ਦੂਜੇ ਪਾਸੇ, ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨੂੰ ਘੱਟ ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਉਸੇ ਸਿਖਲਾਈ ਡੇਟਾ ਨਾਲ ਦੁਹਰਾਉਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ, ਅਤੇ ਬਹੁਤ ਸਾਰੇ ਮਾਮਲਿਆਂ ਵਿੱਚ, ਪੂਰਵ-ਪ੍ਰੋਸੈਸਿੰਗ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ।

ਜੇ ਪ੍ਰਸ਼ਾਸਕੀ ਅਤੇ ਜਨਰਲ ਅਫੇਅਰਸ ਵਿਭਾਗਾਂ ਵਿਚਕਾਰ ਕਰਤੱਵਾਂ ਦੀ ਵੰਡ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ 50-ਅਯਾਮੀ ਹਨ, ਤਾਂ ਹਰੇਕ ਆਯਾਮ ਨਾਲ ਸਬੰਧਤ 50 ਜਾਣਕਾਰੀ ਦੇ ਟੁਕੜੇ ਅਕਸਰ ਕਾਫ਼ੀ ਹੁੰਦੇ ਹਨ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਸਦਾ ਮਤਲਬ ਇਹ ਨਹੀਂ ਹੈ ਕਿ 50 ਵੱਖਰੇ ਵਾਕਾਂ ਦੀ ਲੋੜ ਹੈ।

ਇੱਕ ਸਿੰਗਲ ਵਾਕ ਜਿਵੇਂ ਕਿ "A, B, C, ਅਤੇ D ਨਾਲ ਸਬੰਧਤ ਕਰਤੱਵ ਪ੍ਰਸ਼ਾਸਕੀ ਵਿਭਾਗ ਦੁਆਰਾ ਸੰਭਾਲੇ ਜਾਂਦੇ ਹਨ" ਵਿੱਚ ਚਾਰ ਆਯਾਮਾਂ ਲਈ ਜਾਣਕਾਰੀ ਸ਼ਾਮਲ ਹੋ ਸਕਦੀ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਭਾਸ਼ਾ ਨੂੰ ਅਮੂਰਤ ਕਰਕੇ, ਕਈ ਆਯਾਮਾਂ ਤੋਂ ਜਾਣਕਾਰੀ ਨੂੰ ਇਕੱਠਾ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਇੱਕ ਸਿੰਗਲ ਵਾਕ ਜਿਵੇਂ ਕਿ "ਪ੍ਰਸ਼ਾਸਕੀ ਵਿਭਾਗ ਇਮਾਰਤ ਦੇ ਉਪਭੋਗਤਾ ਸਮਾਨ ਅਤੇ ਉਪਕਰਣਾਂ ਦੀ ਸਾਂਭ-ਸੰਭਾਲ ਲਈ ਜ਼ਿੰਮੇਵਾਰ ਹੈ" ਵਿੱਚ ਲਾਈਟ ਬਲਬ ਬਦਲਣ ਅਤੇ ਆਟੋਮੈਟਿਕ ਦਰਵਾਜ਼ੇ ਦੀਆਂ ਖਰਾਬੀਆਂ ਸਮੇਤ ਕਈ ਤਰ੍ਹਾਂ ਦੇ ਆਯਾਮਾਂ ਤੋਂ ਜਾਣਕਾਰੀ ਨੂੰ ਇਕੱਠਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਇਹ ਅਮੂਰਤੀਕਰਨ LLM ਦੇ ਪ੍ਰੀ-ਟਰੇਨ ਕੀਤੇ ਗਿਆਨ ਅਤੇ ਤਰਕ ਕਰਨ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦਾ ਲਾਭ ਉਠਾਉਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਲੋੜੀਂਦੇ ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਮਾਤਰਾ ਘੱਟ ਜਾਂਦੀ ਹੈ।

ਅਤੇ, ਮੂਲ ਰੂਪ ਵਿੱਚ, ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਸਿੱਖਣ ਲਈ ਦੁਹਰਾਉਣ ਵਾਲੇ ਸਿੱਖਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ। ਇੱਕ ਵਾਰ ਜਦੋਂ ਉਪਰੋਕਤ ਵਾਕ ਨੂੰ ਗਿਆਨ ਅਧਾਰ ਵਿੱਚ ਜੋੜਿਆ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਸਿੱਖਣ ਪੂਰਾ ਹੋ ਜਾਂਦਾ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਗਿਆਨ ਦੀ ਪੂਰਵ-ਪ੍ਰੋਸੈਸਿੰਗ ਜ਼ਰੂਰੀ ਨਹੀਂ ਹੈ। ਭਾਵੇਂ ਪ੍ਰਸ਼ਾਸਕੀ ਜਾਂ ਜਨਰਲ ਅਫੇਅਰਸ ਵਿਭਾਗਾਂ ਦੇ ਵੇਰਵੇ ਵੱਖ-ਵੱਖ ਹੋਰ ਵਾਕਾਂ ਨਾਲ ਮਿਲੇ ਹੋਏ ਹੋਣ, ਉਹਨਾਂ ਨੂੰ ਅਜੇ ਵੀ ਗਿਆਨ ਵਜੋਂ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

ਵਿਕਲਪਕ ਤੌਰ 'ਤੇ, ਕੱਚੇ ਡੇਟਾ, ਜਿਵੇਂ ਕਿ ਪੁੱਛਗਿੱਛਾਂ ਅਤੇ ਅਸਾਈਨਮੈਂਟਾਂ ਦੇ ਲੌਗਸ ਜਿਵੇਂ ਕਿ ਪਿਛਲੀ ਉਦਾਹਰਨ ਵਿੱਚ, ਨੂੰ ਪੂਰਵ-ਪ੍ਰੋਸੈਸਿੰਗ ਤੋਂ ਬਿਨਾਂ ਸਿਖਲਾਈ ਡੇਟਾ ਵਜੋਂ ਤੁਰੰਤ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

ਇਸ ਤਰ੍ਹਾਂ, ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਸੰਖਿਆਤਮਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਕੁਸ਼ਲਤਾ ਨਾਲ ਸਿੱਖ ਸਕਦੀ ਹੈ।

ਸਿੱਟਾ

ਕੰਪਿਊਟਰਾਂ ਦੀਆਂ ਤੇਜ਼ ਰਫ਼ਤਾਰ ਸੰਖਿਆਤਮਕ ਗਣਨਾ ਸਮਰੱਥਾਵਾਂ ਦੇ ਮੁਕਾਬਲੇ, ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ ਦੀਆਂ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਿੰਗ ਸਮਰੱਥਾਵਾਂ ਕਾਫ਼ੀ ਹੌਲੀ ਹਨ।

ਹਾਲਾਂਕਿ, ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਸੰਖਿਆਤਮਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਮੁਕਾਬਲੇ ਵਧੇਰੇ ਕੁਸ਼ਲ ਸਿੱਖਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ।

ਇਹ ਕੁਸ਼ਲਤਾ ਤੇਜ਼ ਰਫ਼ਤਾਰ ਸੰਖਿਆਤਮਕ ਗਣਨਾ ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਹੌਲੀ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਿੰਗ ਸਮਰੱਥਾਵਾਂ ਵਿਚਕਾਰਲੇ ਅੰਤਰ ਨੂੰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਪਛਾੜ ਦਿੰਦੀ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲ, ਜਿਨ੍ਹਾਂ ਨੇ ਸੰਖਿਆਤਮਕ ਸਿੱਖਣ ਦੁਆਰਾ ਹੈਰਾਨੀਜਨਕ ਵਿਕਾਸ ਕੀਤਾ ਹੈ, ਸਕੇਲਿੰਗ ਕਾਨੂੰਨਾਂ ਦੇ ਅਨੁਸਾਰ, ਸਿਰਫ਼ ਸਕੇਲਿੰਗ ਦੁਆਰਾ ਸਮਰੱਥਾ ਸੁਧਾਰ ਵਿੱਚ ਇੱਕ ਸੀਮਾ ਦੇ ਨੇੜੇ ਪਹੁੰਚ ਰਹੇ ਜਾਪਦੇ ਹਨ।

ਅਜਿਹੀ ਸਥਿਤੀ ਵਿੱਚ, ਇਹ ਬਹੁਤ ਸੰਭਵ ਹੈ ਕਿ ਧਿਆਨ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੁਆਰਾ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਸੁਧਾਰਨ ਵੱਲ ਤਬਦੀਲ ਹੋ ਜਾਵੇਗਾ।

ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਮੁੱਢਲਾ ਮਾਡਲ

ਬੁਨਿਆਦੀ ਮਾਡਲ ਦੀ ਹਕੀਕਤ

ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੀਆਂ ਸ਼ਕਤੀਆਂ

ਸਿੱਟਾ

ਸ਼੍ਰੇਣੀਆਂ