پرش به محتوا
این مقاله با استفاده از هوش مصنوعی از ژاپنی ترجمه شده است
به ژاپنی بخوانید
این مقاله در مالکیت عمومی (CC0) است. آزادانه از آن استفاده کنید. CC0 1.0 Universal

یادگیری برای یادگیری: هوش ذاتی

هوش مصنوعی می‌تواند از طریق فناوری یادگیری ماشینی، رفتارهای هوشمندانه از خود نشان دهد.

اگرچه این فرآیند یادگیری از رویه‌های توسعه‌یافته توسط انسان پیروی می‌کند، اما هنوز به طور کامل توضیح داده نشده است که چرا هوش از این رویه‌ها و ساختار هوش مصنوعی پدید می‌آید.

در این مقاله، با تأمل در ماهیت یادگیری، قصد دارم دلایل ظهور هوش را بررسی کنم.

همین‌طور که عمیق‌تر به مفهوم یادگیری می‌پردازیم، به این ایده می‌رسیم که هم هوش مصنوعی و هم مغز ما دارای طبیعتی ذاتی برای یادگیری نحوه یادگیری هستند.

این نشان‌دهنده وجود مکانیزمی است که می‌توان آن را «چارچوب‌ساز ذاتی» نامید.

یادگیری از طریق بدن و یادگیری از طریق زبان

ما با دیدن اشیا با چشمانمان و حرکت دادن بدنمان، جهان پیرامون خود را درک می‌کنیم و توانایی‌هایمان را گسترش می‌دهیم.

این نیز نوعی یادگیری است که می‌توان آن را یادگیری از طریق بدن نامید.

از سوی دیگر، وقتی عموماً به یادگیری فکر می‌کنیم، ممکن است افزایش دانش خود را با خواندن کتاب‌های درسی یا گوش دادن به توضیحات معلم تصور کنیم.

فراتر از یادگیری مبتنی بر چنین برنامه‌های آموزشی، ما دانش متنوعی را از گفتگو با دوستان، اخبار آنلاین و سایر منابع نیز کسب می‌کنیم.

این نوع یادگیری به معنای به خاطر سپردن بصری تصاویر یا یادگیری از طریق حرکت فیزیکی نیست، بلکه یادگیری از طریق زبان است.

یادگیری فراشناختی و یادگیری متافیزیکی

در یادگیری مبتنی بر زبان، مواردی وجود دارد که دانش برای حفظ شدن نیاز به تکرار مکرر دارد، و مواردی که می‌توان آن را تنها پس از یک یا چند بار مواجهه یاد گرفت.

همچنین، برخی از دانش‌ها را می‌توان در صورت نیاز با بازیابی جزئیات آن از قفسه کتاب یا اینترنت، حتی اگر به طور کامل حفظ نشده باشد، استفاده کرد.

به معنای کسب و استفاده مناسب از دانش در صورت لزوم، هر دو این الگوها را می‌توان یادگیری در نظر گرفت.

در میان اینها، دانشی که بدون تکرار مکرر قابل حفظ نیست را می‌توان دانش فراشناختی نامید. فرآیند یادگیری خود مفهوم، یادگیری فراشناختی است.

این شبیه به یادگیری فیزیکی است، که در آن تکرار در دیدن اشیا با چشمانمان یا حرکت دادن بدنمان دخیل است. اینها را نیز می‌توان به عنوان یادگیری فراشناختی طبقه‌بندی کرد.

برعکس، کسب دانشی که با چند آزمایش کم قابل حفظ است یا با جستجو در همان لحظه قابل استفاده است را می‌توان یادگیری متافیزیکی نامید.

در این حالت، مفاهیم از پیش آموخته شده که از طریق یادگیری فراشناختی کسب شده‌اند، می‌توانند برای یادگیری دانش جدید به عنوان انواع آن مفاهیم یا به عنوان ترکیبی از مفاهیم استفاده شوند.

از آنجا که مفاهیمی که از طریق یادگیری فراشناختی تسلط یافته‌اند، می‌توانند مورد استفاده قرار گیرند، یادگیری متافیزیکی نیازی به تکرار ندارد.

یادگیری ماشینی زبان طبیعی

بیایید این را در مورد یادگیری ماشینی در هوش مصنوعی به کار ببریم.

به طور کلی، شبکه‌های عصبی مورد استفاده در یادگیری ماشینی، یادگیری فراشناختی را انجام می‌دهند که شامل یادگیری تکراری مفاهیم است.

از سوی دیگر، مدل‌های زبان بزرگ که قادر به پردازش زبان طبیعی مشابه انسان هستند، می‌توانند یادگیری از طریق زبان را انجام دهند.

در طول پیش‌آموزش و تنظیم دقیق مدل‌های زبان بزرگ، یادگیری فراشناختی مبتنی بر زبان اتفاق می‌افتد.

یک مدل زبان بزرگ آموزش‌دیده می‌تواند با استفاده از دانش موجود در جمله ورودی پاسخ دهد، به این معنی که در حال انجام یادگیری متافیزیکی فوری است.

این توانایی برای یادگیری متافیزیکی مبتنی بر زبان به مدل‌های زبان بزرگ اجازه می‌دهد تا دانش جدید را بدون یادگیری تکراری استفاده کنند.

این را می‌توان با یادگیری ماشینی عددی سنتی، که به طور تکراری پارامترهای مدل را تنظیم می‌کند، مقایسه کرد و می‌توان آن را یادگیری ماشینی زبان طبیعی نامید.

زبان طبیعی به عنوان رابط متافیزیکی

زبان طبیعی در رابط بین یادگیری فراشناختی و یادگیری متافیزیکی قرار دارد.

جنبه جالب زبان طبیعی این است که می‌توان آن را از طریق یادگیری فراشناختی به دست آورد، و بر پایه آن، یادگیری متافیزیکی امکان‌پذیر می‌شود.

رابط‌های متافیزیکی غیر از زبان طبیعی

در واقع، یادگیری فراشناختی و یادگیری متافیزیکی در یادگیری فیزیکی نیز وجود دارند. به عنوان مثال، فردی که در ورزش مهارت دارد می‌تواند به سرعت با ورزشی جدید که قبلاً هرگز با آن روبرو نشده، سازگار شود.

به همین ترتیب، فردی که در زیست‌شناسی آگاه است می‌تواند بلافاصله ویژگی‌های یک گونه جدید را هنگام مشاهده آن درک کند.

بنابراین، حتی در یادگیری فیزیکی، یک رابط متافیزیکی وجود دارد که موقعیتی مشابه زبان طبیعی دارد.

چارچوب

آنچه در این رابط‌ها قرار دارد، یک چارچوب است که از مفاهیم یا دانش بنیادی متمایز است؛ این چارچوب روابط و ساختارهای آن‌ها را تعریف می‌کند و ساختاردهی جدید را امکان‌پذیر می‌سازد.

با کسب دانش فراشناختی متنوع از طریق یادگیری فراشناختی، گاهی اوقات می‌توان چارچوب موجود در رابط متافیزیکی را از طریق ارتباطات بین این قطعات دانش فراشناختی یاد گرفت.

یک چارچوب که از یادگیری فیزیکی نشأت می‌گیرد، پس از تسلط بر آن، امکان کسب فوری دانش جدید را از طریق یادگیری متافیزیکی فراهم می‌کند. با این حال، دانشی که از طریق چنین یادگیری متافیزیکی به دست می‌آید، به راحتی به دیگران منتقل نمی‌شود.

از سوی دیگر، چارچوب که از یادگیری از طریق زبان نشأت می‌گیرد، خود زبان طبیعی است.

بنابراین، دانشی که از طریق یادگیری متافیزیکی با یادگیری چارچوب زبان طبیعی به دست می‌آید، می‌تواند مستقیماً به کسب زبان فرد دیگری وارد شود.

این تنها در مورد دانشی که اساساً مبتنی بر کسب زبان است، مانند کتاب‌های درسی یا اخبار آنلاین، صدق نمی‌کند.

یک بازیکن فوتبال باتجربه که برای اولین بار بیسبال را امتحان می‌کند، ممکن است بتواند دانش متافیزیکی بیسبال را که کسب کرده است، بیان کند و آن را به سایر بازیکنان فوتبال باتجربه منتقل کند. این بدان معناست که اگر افراد دانش فراشناختی یکسانی را به اشتراک بگذارند، می‌توانند آنچه را که به عنوان "نکات" یا "ترفندها" شناخته می‌شود، با کلمات بیان کنند.

علاوه بر این، می‌توان دانش مربوط به یک گونه جدید را که مشاهده شده است، به صورت شفاهی به سایر زیست‌شناسان منتقل کرد و از این طریق آن دانش را به اشتراک گذاشت.

بنابراین، زبان طبیعی یک چارچوب بسیار قدرتمند است که در رابط متافیزیکی قرار دارد.

چارچوب مجازی

فراتر از زبان طبیعی، می‌توان چارچوب دیگری را کسب کرد.

اینها شامل چارچوب‌های خاص دامنه یا چارچوب‌های متافیزیکی هستند.

در رشته‌های مختلف آکادمیک، بخش‌های تجاری و زندگی روزمره، چارچوب‌های خاص دامنه متنوعی وجود دارد.

دانشمندان می‌توانند در چارچوب‌های تخصصی خود اکتشافات جدیدی انجام دهند و به راحتی این اکتشافات را به عنوان دانش به سایر دانشمندانی که همان چارچوب را دارند، منتقل کنند.

خود چارچوب گاهی اوقات می‌تواند به زبان طبیعی بیان شود، در این صورت، افراد یا مدل‌های زبان بزرگ دارای چارچوب زبان طبیعی می‌توانند آن را کسب کرده و درک کنند.

مدل‌های کسب‌وکار و دستورالعمل‌های آشپزی نیز نمونه‌هایی از چنین چارچوب‌های خاص دامنه‌ای هستند که می‌توانند به زبان طبیعی بیان شوند.

علاوه بر این، فرمول‌های ریاضی، زبان‌های برنامه‌نویسی و چارچوب‌های تحلیل کسب‌وکار، چارچوب‌های رسمی هستند.

اینها نیز می‌توانند به زبان طبیعی بیان یا توضیح داده شوند.

چنین چارچوب‌های خاص دامنه و چارچوب‌های رسمی که بر پایه زبان طبیعی ساخته شده‌اند، را می‌توان چارچوب‌های مجازی نامید.

این امر را می‌توان به راحتی با تصور یک ماشین مجازی که یک سیستم عامل دیگر را روی یک کامپیوتر فیزیکی اجرا می‌کند، درک کرد. یک چارچوب دیگر در بالای زبان طبیعی، که به عنوان چارچوب بنیادی عمل می‌کند، در حال کار است.

چارچوب بومی

در ابتدا، این چارچوب مجازی باید از طریق زبان طبیعی درک شود، اما با تمرین، توضیحات و درک از طریق زبان طبیعی را دور می‌زند و مستقیماً به عنوان یک چارچوب رابط متافیزیکی عمل می‌کند که بر اساس دانش فراشناختی ساخته شده است.

این را می‌توان چارچوب بومی نامید.

زبان طبیعی، به نوعی، یک چارچوب بومی است، اما فقط در مورد زبان مادری. به طور کلی، زبان‌هایی غیر از زبان مادری به عنوان چارچوب‌های مجازی کسب می‌شوند. با افزایش تسلط، آنها به وضعیت یک چارچوب بومی نزدیک می‌شوند.

همین امر در مورد چارچوب‌های خاص دامنه و چارچوب‌های رسمی نیز صدق می‌کند. ریاضیدانان می‌توانند به طور بومی با یکدیگر با استفاده از فرمول‌های ریاضی ارتباط برقرار کنند، و برنامه‌نویسان می‌توانند منظور یکدیگر را فقط از طریق کد منبع بدون کامنت درک کنند.

این نشان می‌دهد که گذار از یک چارچوب مجازی به یک چارچوب بومی را می‌توان در مورد مدل‌های زبان بزرگ نیز به کار برد.

ایده شناسایی چارچوب‌های مجازی پرکاربرد، تولید حجم زیادی از داده‌های نمونه با استفاده از آن چارچوب‌های مجازی، و سپس تنظیم دقیق آنها برای تبدیل شدن به چارچوب‌های بومی، ارزش امتحان فوری را خواهد داشت.

چارچوب‌ساز ذاتی

با در نظر گرفتن این موضوع، متوجه می‌شویم که مدل‌های زبان بزرگ ممکن است این چارچوب‌های تخصصی و رسمی را نه تنها در طول تنظیم دقیق، بلکه در طول پیش‌آموزش نیز یاد بگیرند.

علاوه بر این، در آن فرآیند، این احتمال وجود دارد که آن‌ها چارچوب‌های تخصصی یا رسمی را از ابتدا به صورت بومی یاد نگیرند. در عوض، ابتدا چارچوب زبان طبیعی را یاد می‌گیرند و سپس، در طول یا پس از کسب مهارت در آن، چارچوب‌های تخصصی یا رسمی را یاد می‌گیرند و آن‌ها را به چارچوب‌های بومی تبدیل می‌کنند.

با تعمیق این ایده یادگیری افزایشی چارچوب، همچنین می‌توان تصور کرد که خود یادگیری زبان طبیعی، یک خط لوله موازی از یادگیری چارچوب افزایشی و بسیار دقیق است.

یعنی، از حجم وسیعی از متن ارائه شده به عنوان داده‌های یادگیری در طول پیش‌آموزش، مدل‌های زبان بزرگ ممکن است نه تنها مفاهیم فردی، بلکه برخی از قوانین بسیار ساده زبان طبیعی را به عنوان چارچوب یاد بگیرند. سپس، با استفاده از این چارچوب‌های ساده به عنوان پایه، ممکن است به طور مکرر قوانین کمی پیچیده‌تر را یاد بگیرند.

به این ترتیب، با شروع از مرحله یادگیری مفاهیم کلمات منفرد، آن‌ها باید بتوانند کلمات مرکب و دستور زبان پایه را کسب کنند، سپس جملات را درک کنند و در نهایت عناصر پیچیده‌ای مانند فنون ادبی و سبک‌های بیانی را یاد بگیرند.

این را می‌توان به عنوان مدلی از یادگیری چارچوب لایه‌ای و ترکیبی درک کرد، که در آن یک چارچوب به عنوان پایه برای یادگیری بعدی عمل می‌کند.

این تصویر مدل‌های زبان بزرگ را به عنوان چارچوب‌سازان ذاتی برجسته می‌کند، که ذاتاً مکانیزم یادگیری چارچوب‌ها را از ابتدا در اختیار دارند.

مکانیسم توجه

فناوری‌ای که چارچوب‌ساز ذاتی را محقق می‌سازد، مکانیسم توجه است.

مکانیسم توجه شبیه به انتخاب توکن‌هایی است که باید در یک زمینه مورد توجه قرار گیرند. این مکانیزم روابط بین توکن‌ها را روشن می‌کند. این دقیقاً ماهیت خود چارچوب است: انتزاع با حفظ مفاهیم مهم و در عین حال روشن ساختن روابط بین آن مفاهیم.

با تغییر این انتخاب برای هر توکن، امکان تغییر پویا چارچوب‌ها نیز فراهم می‌شود.

این به ما امکان می‌دهد تا با استفاده از مدل چارچوب‌ساز ذاتی، توضیح دهیم که چرا مکانیسم توجه یک فناوری تعیین‌کننده برای تکامل مدل‌های زبان بزرگ است.

نتیجه‌گیری

اگر این مکانیزم واقعاً در طول فرآیند پیش‌آموزش مدل‌های زبان بزرگ اتفاق می‌افتد، آنگاه مکانیزم قبلاً مرموز این مدل‌ها قابل توضیح می‌شود.

این توضیح شامل یادگیری فراشناختی و متافیزیکی که در مورد آن بحث کردیم، چارچوب به عنوان یک رابط متافیزیکی، زبان طبیعی که اکتساب زبان و چارچوب‌های مجازی را ممکن می‌سازد، و مکانیسم توجه که چارچوب‌ساز ذاتی را تحقق می‌بخشد، می‌شود.

علاوه بر این، دو پیامد دیگر از این موضوع ناشی می‌شود.

اولاً، زبان طبیعی دارای ساختاری بسیار مناسب برای توسعه تدریجی چارچوب‌های پیچیده از چارچوب‌های ساده به چارچوب‌های بومی است.

اگر زبان طبیعی در ابتدا به شکلی ساده در جوامع بشری پدیدار شده و به تدریج تکامل یافته تا ساختاری پیچیده‌تر و غنی‌تر داشته باشد، پس این یک پیامد طبیعی است.

علاوه بر این، ساختاری که امکان یادگیری سریع را فراهم کند، سودمند خواهد بود. با فرض رقابت چندین جامعه با زبان‌های طبیعی مختلف، این فرضیه که زبان طبیعی مناسب‌ترین برای یادگیری تا به امروز باقی مانده است، به راحتی قابل اثبات است.

تأمل در ماهیت زبان طبیعی به پیامد دوم منجر می‌شود: اینکه ما انسان‌ها نیز چارچوب‌سازان ذاتی هستیم.

حتی اگر مبانی و مکانیزم‌های خاص متفاوت باشند، مغز ما نیز باید به سیستمی مشابه مکانیسم توجه مجهز باشد که چارچوب‌ها را به تدریج یاد می‌گیرد و به طور انعطاف‌پذیر تغییر می‌دهد.