پرش به محتوا
این مقاله با استفاده از هوش مصنوعی از ژاپنی ترجمه شده است
به ژاپنی بخوانید
این مقاله در مالکیت عمومی (CC0) است. آزادانه از آن استفاده کنید. CC0 1.0 Universal

یادگیری برای یادگیری: هوش ذاتی

هوش مصنوعی از طریق فناوری‌ای به نام یادگیری ماشینی، رفتار هوشمندانه پیدا می‌کند.

در حالی که این یادگیری بر اساس رویه‌های توسعه‌یافته توسط انسان انجام می‌شود، هنوز توضیح داده نشده است که چرا هوش از این رویه‌ها و ساختار هوش مصنوعی پدید می‌آید.

در این مقاله، با بررسی جوهر خود یادگیری، به بررسی دلایل پیدایش هوش خواهم پرداخت.

و همانطور که عمیق‌تر به مفهوم یادگیری می‌پردازیم، به این ایده می‌رسیم که هم هوش مصنوعی و هم مغز ما دارای یک تمایل ذاتی برای یادگیری نحوه یادگیری هستند.

این نشان‌دهنده وجود مکانیزمی است که می‌توان آن را "فریم‌ورکر مادرزادی" نامید.

یادگیری از طریق بدن در مقابل یادگیری از طریق زبان

ما با دیدن اشیا با چشمانمان و حرکت دادن بدنمان، در مورد دنیای اطراف خود می‌آموزیم و قابلیت‌هایمان را گسترش می‌دهیم.

این نیز نوعی از یادگیری است که می‌توان آن را یادگیری از طریق بدن نامید.

از سوی دیگر، وقتی مردم عموماً از یادگیری صحبت می‌کنند، احتمالاً افزایش دانش را از طریق خواندن کتاب‌های درسی یا گوش دادن به توضیحات معلم تصور می‌کنند.

علاوه بر چنین یادگیری مبتنی بر برنامه درسی، ما دانش‌های مختلفی را از مکالمات با دوستان، اخبار آنلاین و غیره نیز به دست می‌آوریم.

این نوع یادگیری، به خاطر سپردن بصری تصاویر یا یادگیری با حرکت دادن بدن نیست؛ بلکه یادگیری از طریق زبان است.

یادگیری زیرفیزیکی و یادگیری متافیزیکی

در میان یادگیری از طریق زبان، مواردی وجود دارد که اطلاعات تنها از طریق تکرار مکرر قابل حفظ هستند، و مواردی که پس از یک یا چند بار شنیدن قابل حفظ می‌باشند.

همچنین، دانشی وجود دارد که حتی اگر جزئیات آن به خاطر سپرده نشود، می‌توان در لحظه لازم با بازیابی آن‌ها از کتابخانه یا اینترنت، از آن‌ها استفاده کرد.

به معنای کسب دانش و بهره‌برداری مناسب از آن در زمان نیاز، هر دو الگوی فوق را می‌توان یادگیری نامید.

از این میان، دانشی که تنها از طریق تکرار مکرر قابل حفظ است، می‌تواند دانش زیرفیزیکی نامیده شود. فرایند یادگیری برای این نوع دانش، یادگیری زیرفیزیکی است که شامل حفظ خود مفاهیم می‌شود.

این شبیه به یادگیری فیزیکی است، جایی که فرد با دیدن اشیا با چشمان خود یا حرکت دادن بدن خود به طور مکرر یاد می‌گیرد. این‌ها را نیز می‌توان به عنوان یادگیری زیرفیزیکی طبقه‌بندی کرد.

از سوی دیگر، کسب دانشی که با تکرارهای کمتر قابل حفظ است، یا می‌توان آن را در همان لحظه جستجو و استفاده کرد، یادگیری متافیزیکی نامیده می‌شود.

در این حالت، مفاهیم از پیش آموخته شده که از طریق یادگیری زیرفیزیکی کسب شده‌اند، می‌توانند برای یادگیری دانش به عنوان انواع آن مفاهیم یا به عنوان ترکیباتی از مفاهیم به کار روند.

از آنجا که مفاهیم از پیش کسب شده از طریق یادگیری زیرفیزیکی قابل استفاده هستند، یادگیری متافیزیکی نیازی به تکرار ندارد.

یادگیری ماشینی زبان طبیعی

بیایید این را به یادگیری ماشینی در هوش مصنوعی اعمال کنیم.

به طور کلی، شبکه‌های عصبی که در یادگیری ماشینی استفاده می‌شوند، یادگیری زیرفیزیکی را انجام می‌دهند که شامل یادگیری مکرر مفاهیم است.

از سوی دیگر، مدل‌های زبان بزرگ، که قادر به پردازش زبان طبیعی مشابه انسان هستند، می‌توانند یادگیری از طریق زبان را انجام دهند.

در طول پیش‌آموزش (pre-training) و تنظیم دقیق (fine-tuning) مدل‌های زبان بزرگ، یادگیری زیرفیزیکی از طریق زبان صورت می‌گیرد.

علاوه بر این، یک مدل زبان بزرگ پیش‌آموزش‌دیده می‌تواند با استفاده از دانش موجود در جمله ورودی پاسخ دهد و بدین ترتیب یادگیری متافیزیکی فوری را انجام می‌دهد.

به لطف این توانایی یادگیری متافیزیکی از طریق زبان، مدل‌های زبان بزرگ می‌توانند دانش جدید را بدون نیاز به یادگیری تکراری به کار گیرند.

این را می‌توان یادگیری ماشینی زبان طبیعی نامید، برخلاف یادگیری ماشینی عددی سنتی که پارامترهای مدل را به صورت تکراری تنظیم می‌کند.

زبان طبیعی به عنوان رابط متافیزیکی

زبان طبیعی در رابطی قرار دارد که یادگیری زیرفیزیکی و متافیزیکی را از هم جدا می‌کند.

جنبه شگفت‌انگیز زبان طبیعی این است که می‌توان آن را از طریق یادگیری زیرفیزیکی کسب کرد، و علاوه بر آن، یادگیری متافیزیکی را امکان‌پذیر می‌سازد.

رابط‌های متافیزیکی غیر از زبان طبیعی

در واقعیت، حتی در یادگیری فیزیکی نیز، هم یادگیری زیرفیزیکی و هم متافیزیکی وجود دارد. برای مثال، فردی که در ورزش ماهر است، می‌تواند به سرعت با یک بازی جدید که برای اولین بار با آن روبرو می‌شود، سازگار شود.

به همین ترتیب، فردی که در زیست‌شناسی دانش دارد، می‌تواند بلافاصله ویژگی‌های یک گونه جدید را هنگام مشاهده آن درک کند.

بنابراین، در یادگیری فیزیکی نیز، رابط‌های متافیزیکی وجود دارند که جایگاهی مشابه زبان طبیعی دارند.

چارچوب‌ها

در این رابط‌ها، چارچوب‌هایی وجود دارند که، متمایز از مفاهیم یا دانش بنیادی، روابط و ساختارهای آن‌ها را تعریف می‌کنند، یا امکان ساختاردهی جدید را فراهم می‌آورند.

با کسب انواع دانش زیرفیزیکی از طریق یادگیری زیرفیزیکی، ممکن است بتوان چارچوب موجود در رابط متافیزیکی را از طریق ارتباطات بین اجزای دانش زیرفیزیکی آموخت.

چارچوب‌های کسب‌شده از طریق یادگیری فیزیکی، امکان یادگیری فوری دانش جدید را به صورت متافیزیکی پس از کسب آن فراهم می‌کنند. با این حال، انتقال دانشی که از طریق این یادگیری متافیزیکی به دست آمده، به دیگران آسان نیست.

از سوی دیگر، چارچوبی که از طریق یادگیری با زبان به دست می‌آید، خود زبان طبیعی است.

بنابراین، دانشی که از طریق یادگیری متافیزیکی، پس از یادگیری چارچوب زبان طبیعی، به دست می‌آید، می‌تواند مستقیماً به یادگیری زبانی دیگران وارد شود.

این تنها به دانشی که یادگیری از طریق زبان، مانند کتاب‌های درسی یا اخبار آنلاین، در آن بنیادی است، محدود نمی‌شود.

یک بازیکن فوتبال باتجربه که برای اولین بار بیسبال بازی می‌کند، ممکن است بتواند دانش متافیزیکی کسب‌شده درباره بیسبال را از طریق کلمات به سایر بازیکنان فوتبال منتقل کند. این بدان معناست که اگر افراد دانش زیرفیزیکی مشترکی داشته باشند، اصطلاحاً "نکات" یا "دانش عملی" را می‌توان به صورت کلامی منتقل کرد.

علاوه بر این، می‌توان دانش خود را در مورد گونه‌ای که به تازگی کشف شده و شاهد آن بوده‌اند، از طریق کلمات با سایر زیست‌شناسان به اشتراک گذاشت.

بدین ترتیب، زبان طبیعی به عنوان یک چارچوب بسیار قدرتمند در رابط متافیزیکی آشکار می‌شود.

چارچوب‌های مجازی

فراتر از زبان طبیعی، می‌توان چارچوب‌های دیگری را نیز کسب کرد.

این‌ها چارچوب‌های خاص دامنه یا چارچوب‌های رسمی هستند.

در زمینه‌های مختلف آکادمیک، بخش‌های تجاری و زندگی روزمره، چارچوب‌های خاص دامنه متنوعی وجود دارد.

دانشمندان، در چارچوب تخصص خود عمل می‌کنند و می‌توانند اکتشافات جدیدی انجام دهند و به راحتی آن دانش را به دیگر دانشمندانی که دارای همان چارچوب هستند، منتقل کنند.

خود چارچوب گاهی اوقات می‌تواند در زبان طبیعی بیان شود، در این صورت توسط افراد یا مدل‌های زبان بزرگ که دارای چارچوب زبان طبیعی هستند، قابل یادگیری و درک است.

مدل‌های کسب‌وکار و دستور پخت غذا نیز نمونه‌هایی از چنین چارچوب‌های خاص دامنه هستند که می‌توانند در زبان طبیعی بیان شوند.

علاوه بر این، فرمول‌های ریاضی، زبان‌های برنامه‌نویسی و چارچوب‌های تحلیل کسب‌وکار، چارچوب‌های رسمی هستند.

این‌ها نیز می‌توانند چارچوب‌هایشان را در زبان طبیعی بیان یا توضیح دهند.

این چارچوب‌های خاص دامنه و رسمی که بر پایه زبان طبیعی ساخته شده‌اند، می‌توانند چارچوب‌های مجازی نامیده شوند.

این امر اگر یک ماشین مجازی را تصور کنید که یک سیستم عامل متفاوت را روی یک کامپیوتر فیزیکی اجرا می‌کند، به راحتی قابل درک است. چارچوب دیگری بر روی چارچوب بنیادی زبان طبیعی عمل می‌کند.

چارچوب‌های بومی

علاوه بر این، در حالی که این چارچوب‌های مجازی در ابتدا نیاز به درک از طریق زبان طبیعی دارند، با عادت کردن به آن‌ها، شروع به دور زدن توضیح و درک زبان طبیعی کرده و مستقیماً به عنوان یک چارچوب رابط متافیزیکی ساخته شده بر پایه دانش زیرفیزیکی عمل می‌کنند.

این را می‌توان یک چارچوب بومی (Native Framework) نامید.

زبان طبیعی، به یک معنا، نیز یک چارچوب بومی است، اما تنها در مورد زبان مادری فرد. به طور کلی، زبان‌هایی غیر از زبان مادری به عنوان چارچوب‌های مجازی کسب می‌شوند. با افزایش مهارت، آن‌ها به چارچوب‌های بومی نزدیک‌تر می‌شوند.

همین امر در مورد چارچوب‌های خاص دامنه و رسمی نیز صدق می‌کند. ریاضی‌دانان می‌توانند به طور بومی با استفاده از فرمول‌های ریاضی ارتباط برقرار کنند، و برنامه‌نویسان می‌توانند مقاصد یکدیگر را صرفاً از طریق کد منبع بدون نیاز به توضیحات درک کنند.

این نشان می‌دهد که پیشرفت از چارچوب‌های مجازی به بومی می‌تواند در مورد مدل‌های زبان بزرگ نیز اعمال شود.

ایده شناسایی چارچوب‌های مجازی پرکاربرد، تولید حجم زیادی از داده‌های نمونه با استفاده از آن چارچوب‌ها، و سپس تنظیم دقیق آن‌ها برای تبدیل شدن به چارچوب‌های بومی، بلافاصله ارزش امتحان کردن را دارد.

چارچوب‌سازهای ذاتی

با در نظر گرفتن این موضوع، متوجه می‌شویم که در طول پیش‌آموزش مدل‌های زبان بزرگ، نه تنها در تنظیم دقیق، بلکه این احتمال وجود دارد که آن‌ها چارچوب‌های خاص دامنه و رسمی را نیز یاد بگیرند.

و در این فرآیند، قابل تصور است که به جای یادگیری بومی چارچوب‌های خاص دامنه یا رسمی از ابتدا، ابتدا چارچوب زبان طبیعی را یاد بگیرند، و سپس، در طول یا پس از تسلط بر آن، چارچوب‌های خاص دامنه و رسمی را یاد بگیرند و آن‌ها را بومی سازند.

با عمیق‌تر شدن در این یادگیری چارچوب مرحله به مرحله، همچنین قابل تصور است که خود یادگیری زبان طبیعی یک خط لوله موازی از یادگیری چارچوب مرحله به مرحله با جزئیات بسیار ظریف باشد.

به عبارت دیگر، از حجم عظیمی از متون ارائه‌شده به عنوان داده‌های آموزشی در طول پیش‌آموزش، مدل‌های زبان بزرگ ممکن است نه تنها مفاهیم فردی را یاد بگیرند، بلکه چند قانون بسیار ساده زبان طبیعی را نیز به عنوان یک چارچوب بیاموزند. سپس، با استفاده از این چارچوب‌های ساده به عنوان پایه، به طور مکرر قوانین کمی پیچیده‌تر را یاد بگیرند.

این امر به آن‌ها اجازه می‌دهد تا از مرحله‌ای که در ابتدا مفاهیم کلمه را یاد گرفتند، به حفظ کلمات مرکب و گرامر پایه، و سپس به درک جملات، و یادگیری چیزهای پیچیده‌ای مانند تکنیک‌های نگارش و بیان پیشرفت کنند.

این را می‌توان به عنوان مدلی درک کرد که در آن چارچوب‌ها را به صورت مرحله‌ای و پیچیده یاد می‌گیرند، با استفاده از یک چارچوب به عنوان پایه برای یادگیری چارچوب بعدی.

این امر مدل‌های زبان بزرگ را به عنوان "چارچوب‌سازهای ذاتی" برجسته می‌کند، که از همان ابتدا مکانیسمی برای یادگیری چارچوب‌ها دارند.

مکانیزم توجه

فناوری‌ای که «چارچوب‌ساز ذاتی» را محقق می‌سازد، مکانیزم توجه است.

مکانیزم توجه شبیه به انتخاب توکن‌های مرتبط از یک متن است. این مکانیزم روابط بین توکن‌ها را روشن می‌کند. این دقیقاً ماهیت یک چارچوب است: انتزاع با حفظ مفاهیم مهم و در عین حال روشن ساختن روابط بین آن‌ها.

با تغییر این انتخاب برای هر توکن، امکان تغییر پویای چارچوب‌ها فراهم می‌شود.

این به ما امکان می‌دهد توضیح دهیم که چرا مکانیزم توجه، با استفاده از مدل چارچوب‌ساز ذاتی، فناوری‌ای است که تکامل مدل‌های زبان بزرگ را تعیین می‌کند.

نتیجه‌گیری

اگر این مکانیسم واقعاً در طول فرآیند پیش‌آموزش مدل‌های زبان بزرگ اتفاق می‌افتد، آنگاه مکانیسم‌های پیش از این مرموز مدل‌های زبان بزرگ قابل توضیح خواهند بود.

این موارد شامل یادگیری زیرفیزیکی و متافیزیکی که در اینجا بحث شد، چارچوب‌ها به عنوان رابط‌های متافیزیکی، زبان طبیعی که یادگیری از طریق زبان و چارچوب‌های مجازی را امکان‌پذیر می‌سازد، و مکانیزم توجه که چارچوب‌ساز ذاتی را محقق می‌کند، می‌شوند.

علاوه بر این، دو نکته دیگر نیز از این موضوع استنباط می‌شود.

اولاً، زبان طبیعی ساختاری دارد که برای درونی‌سازی تدریجی چارچوب‌های پیچیده از چارچوب‌های ساده‌تر، بسیار مناسب است.

اگر زبان طبیعی در ابتدا به شکلی ساده در جامعه بشری پدیدار شده و به تدریج رشد کرده تا ساختاری پیچیده‌تر و غنی‌تر پیدا کند، این یک پیامد طبیعی است.

علاوه بر این، برای آنکه به گونه‌ای ساختاربندی شود که امکان یادگیری سریع را فراهم آورد، سودمند خواهد بود. با فرض اینکه چندین جامعه با زبان‌های طبیعی متفاوت در حال رقابت بودند، فرضیه اینکه زبان‌های طبیعی مناسب‌تر برای یادگیری در حال حاضر بقا یافته‌اند، به راحتی شکل می‌گیرد.

تأمل در این ماهیت زبان طبیعی به پیشنهاد دوم منجر می‌شود: اینکه ما انسان‌ها نیز چارچوب‌سازهای ذاتی هستیم.

حتی اگر مبانی و مکانیسم‌های اساسی خاص متفاوت باشند، مغز ما نیز باید به مکانیزمی، شبیه به مکانیزم توجه، مجهز باشد که امکان یادگیری گام‌به‌گام و انطباق‌پذیری منعطف چارچوب‌ها را فراهم آورد.