سیستم هوش مصنوعی یادگیرنده: مفهوم ALIS

در اینجا قصد دارم سیستم هوش مصنوعی یادگیرنده (Artificial Learning Intelligence System: ALIS) را با پرداختن به مفاهیم و اصول آن، و همچنین طراحی و روش‌های توسعه اولیه آن، سازماندهی کنم.

مفهوم

هوش مصنوعی مولد کنونی، به‌ویژه مدل‌های زبانی بزرگ، بر اساس یادگیری نظارت شده با استفاده از شبکه‌های عصبی آموزش دیده‌اند.

ما این فرآیند آموزش شبکه عصبی را به عنوان یادگیری ذاتی (Innate Learning) تعریف می‌کنیم.

ALIS سیستمی است که با ادغام فرآیندهای یادگیری ذاتی و اکتسابی، و با افزودن یک فرآیند یادگیری اکتسابی جداگانه از یادگیری ذاتی، استنتاج جامع را ممکن می‌سازد.

در این یادگیری اکتسابی، دانش آموخته شده در خارج از شبکه عصبی ذخیره شده و در طول استنتاج مورد استفاده قرار می‌گیرد.

بنابراین، هسته فنی ALIS در استخراج، ذخیره‌سازی دانش قابل استفاده مجدد، و انتخاب و بهره‌برداری از دانش در طول استنتاج نهفته است.

علاوه بر این، ALIS تنها یک فناوری عنصری نیست، بلکه یک فناوری سیستمی است که یادگیری ذاتی و اکتسابی را ترکیب می‌کند.

عناصر یک سیستم هوش یادگیرنده

ALIS هم یادگیری ذاتی موجود و هم یادگیری اکتسابی آینده را تحت اصول یکسان در چارچوب یادگیری و استنتاج بررسی می‌کند.

برای توضیح اصول یادگیری در ALIS، پنج عنصر از یک سیستم هوش یادگیرنده را تعریف می‌کنیم:

اولین مورد پردازشگر هوشمند است. این به یک سیستم پردازش اشاره دارد که با استفاده از دانش، استنتاج انجام می‌دهد و دانش را برای یادگیری استخراج می‌کند.

نمونه‌های بارز پردازشگرهای هوشمند شامل مدل‌های زبانی بزرگ (LLM) و بخش‌هایی از مغز انسان است.

دومین مورد ذخیره‌گاه دانش است. این به محلی برای ذخیره‌سازی اشاره دارد که دانش استخراج شده در آن ذخیره می‌شود و در صورت نیاز می‌توان آن را بازیابی کرد.

در LLMها، ذخیره‌گاه دانش، پارامترهای شبکه عصبی است. در انسان، این با حافظه بلندمدت در مغز مطابقت دارد.

سومین مورد جهان است. این به محیط خارجی اشاره دارد که توسط سیستم‌های هوش یادگیرنده مانند انسان یا ALIS درک می‌شود.

برای انسان، جهان خود واقعیت است. در مورد LLMها، مکانیزمی که خروجی را از LLM دریافت کرده و بازخورد را به آن ارائه می‌دهد، معادل جهان در نظر گرفته می‌شود.

چهارمین مورد حافظه حالت است. این به یک حافظه موقت داخلی، مانند یک دفترچه یادداشت، اشاره دارد که یک سیستم هوش یادگیرنده در طول استنتاج از آن استفاده می‌کند.

در LLMها، این فضای حافظه مورد استفاده در طول استنتاج است که به عنوان حالت‌های پنهان (hidden states) شناخته می‌شود. در انسان، این با حافظه کوتاه‌مدت مطابقت دارد.

پنجمین مورد چارچوب است. این همان به اصطلاح چارچوب فکری است. در اصطلاحات یک سیستم هوش یادگیرنده، به معیارهایی برای انتخاب دانش ضروری در طول استنتاج و ساختار فضای حالت منطقی برای سازماندهی حافظه حالت اشاره دارد.

در LLMها، این ساختار معنایی حالت‌های پنهان است و به طور کلی، محتوای آن مبهم و برای انسان غیرقابل درک است. علاوه بر این، انتخاب دانش در مکانیسم توجه (attention mechanism) ادغام شده است که برای هر توکن در حال پردازش، انتخاب می‌کند که به کدام توکن‌های موجود ارجاع دهد.

برای انسان، همانطور که در بالا ذکر شد، این چارچوب فکری است. هنگام تفکر با استفاده از یک چارچوب فکری خاص، مجموعه‌هایی از دانش فنی از حافظه بلندمدت فراخوانی شده و در حافظه کوتاه‌مدت بارگذاری می‌شوند. سپس، اطلاعات درک شده کنونی بر اساس چارچوب فکری سازماندهی می‌شوند تا وضعیت درک شود.

اصول یک سیستم هوش یادگیرنده

یک سیستم هوش یادگیرنده به شرح زیر عمل می‌کند:

پردازشگر هوشمند بر جهان تأثیر می‌گذارد. جهان نیز بر اساس آن عمل، نتایجی را بازمی‌گرداند.

پردازشگر هوشمند، دانش قابل استفاده مجدد را از این نتایج استخراج کرده و در ذخیره‌گاه دانش ذخیره می‌کند.

هنگامی که پردازشگر هوشمند به طور مکرر بر جهان تأثیر می‌گذارد، دانشی را از ذخیره‌گاه دانش انتخاب کرده و از آن برای تغییر شیوه عملکرد خود استفاده می‌کند.

این مکانیزم پایه است.

اما، اساساً، روش‌های استخراج، ذخیره‌سازی، انتخاب و بهره‌برداری از دانش تعیین می‌کنند که آیا سیستم می‌تواند به یادگیری معنی‌دار دست یابد یا خیر.

انسان‌ها دارای مکانیزم‌هایی هستند که استخراج، ذخیره‌سازی، انتخاب و بهره‌برداری مؤثر از دانش را ممکن می‌سازد و به آن‌ها اجازه یادگیری می‌دهد.

شبکه‌های عصبی، از جمله LLMها، دارای مکانیزم‌هایی برای ذخیره‌سازی، انتخاب و بهره‌برداری هستند، اگرچه بخش استخراج توسط یک معلم خارجی انجام می‌شود. این امر به آن‌ها اجازه می‌دهد تا زمانی که یک معلم ورودی را فراهم کند، یاد بگیرند.

علاوه بر این، یک سیستم هوش یادگیرنده می‌تواند با یادگیری استخراج، ذخیره‌سازی و انتخاب چارچوب‌ها و استفاده از آن‌ها در حافظه حالت، به عنوان دانش، یادگیری پیچیده‌تری را نیز انجام دهد.

انواع دانش

بر اساس این اصل، هنگام طراحی یادگیری اکتسابی، لازم است مشخص شود که دانش اکتسابی چه نوع اطلاعاتی را به خود می‌گیرد.

قابل تصور است که دانش اکتسابی به طور جداگانه به عنوان پارامترهای یک شبکه عصبی آموخته شود.

با این حال، دانش اکتسابی لزوماً نباید محدود به پارامترهای شبکه عصبی باشد. یک گزینه واقع‌بینانه، دانش متنی شده به زبان طبیعی است.

اگر دانش به زبان طبیعی متنی شود، می‌توان با بهره‌گیری از قابلیت‌های پردازش زبان طبیعی LLMها، آن را استخراج و مورد استفاده قرار داد. علاوه بر این، می‌توان آن را به عنوان داده در یک سیستم فناوری اطلاعات معمولی تلقی کرد که ذخیره‌سازی و انتخاب را آسان می‌کند.

علاوه بر این، دانش متنی شده به زبان طبیعی برای انسان‌ها و سایر LLMها به راحتی قابل بررسی، درک و در برخی موارد، ویرایش است.

همچنین می‌تواند با سایر سیستم‌های هوش یادگیرنده به اشتراک گذاشته شود و ادغام یا تقسیم شود.

به این دلایل، دانش اکتسابی در مفهوم ALIS، در ابتدا برای هدف قرار دادن دانش متنی شده به زبان طبیعی طراحی خواهد شد.

حافظه حالت اکتسابی و چارچوب

من مزایای انتخاب دانش متنی‌شده به زبان طبیعی را به‌عنوان دانش اکتسابی توضیح دادم.

به همین ترتیب، متن زبان طبیعی می‌تواند برای حافظه حالت و چارچوب استنتاج نیز استفاده شود.

چارچوب، که یک ساختار مفهومی است، همچنین می‌تواند در ذخیره‌گاه دانش به‌عنوان دانش متنی‌شده به زبان طبیعی ذخیره و مورد استفاده قرار گیرد.

هنگام مقداردهی اولیه یا به‌روزرسانی حالت‌ها بر اساس ساختار تعریف‌شده توسط آن چارچوب، می‌توان از حافظه حالت مبتنی بر متن استفاده کرد.

با طراحی ALIS به گونه‌ای که نه تنها برای دانش اکتسابی، بلکه برای چارچوب‌ها و حافظه حالت نیز از قالب متنی استفاده کند، ALIS می‌تواند از قابلیت‌های پردازش زبان طبیعی LLMها هم برای یادگیری اکتسابی و هم برای استنتاج کلی بهره‌برداری کند.

دانش رسمی

دانش اکتسابی، چارچوب‌ها و حافظه حالت را می‌توان نه تنها با متن زبان طبیعی، بلکه با زبان‌های رسمی یا مدل‌های رسمی دقیق‌تر نیز نمایش داد.

اگرچه من از کلمه "انتخاب" استفاده کردم، اما هدف ALIS این است که مکانیسم‌های یادگیری دانش اکتسابی متعدد را برای استفاده ترکیبی از یادگیری ذاتی و اکتسابی در خود جای دهد.

دانشی که با زبان‌های رسمی یا مدل‌های رسمی نمایش داده می‌شود، می‌تواند دقیق‌تر و عاری از ابهام باشد.

علاوه بر این، اگر یک چارچوب با استفاده از یک زبان رسمی یا مدل رسمی بیان شود و یک حالت اولیه در حافظه حالت گسترش یابد، آنگاه یک مدل رسمی می‌تواند توسط یک پردازشگر هوشمند (نه یک LLM) پردازش شود تا شبیه‌سازی‌های دقیق و استدلال منطقی انجام دهد.

نمونه بارز چنین زبان‌های رسمی و مدل‌های رسمی، زبان‌های برنامه‌نویسی هستند.

همانطور که سیستم در مورد جهان یاد می‌گیرد، اگر بتواند قوانین و مفاهیم زیربنایی را به عنوان برنامه‌هایی در یک چارچوب بیان کند، این موارد می‌توانند توسط رایانه شبیه‌سازی شوند.

ستون ۱: انواع دانش

همانطور که دانش را در یک سیستم هوش یادگیرنده سازماندهی می‌کنیم، مشخص می‌شود که می‌توان آن را به طور کلی به سه سیستم و دو نوع طبقه‌بندی کرد.

سه سیستم عبارتند از: دانش پارامتر شبکه که توسط شبکه‌های عصبی اداره می‌شود، دانش طبیعی در زبان طبیعی، و دانش رسمی در زبان‌های رسمی.

دو نوع عبارتند از: بی‌حالت (stateless) و باحالت (stateful).

دانش پارامتر شبکه بی‌حالت، دانش شهودی است، مانند آنچه در هوش مصنوعی یادگیری عمیق یافت می‌شود. ویژگی‌های گربه‌ها و سگ‌ها که نمی‌توان به آنها فکر کرد یا به صورت کلامی شناسایی کرد، می‌توانند به عنوان دانش پارامتر شبکه بی‌حالت آموخته شوند.

دانش پارامتر شبکه باحالت، دانش مبهم و حاصل از فرآیندهای تکراری است، مانند آنچه در هوش مصنوعی مولد یافت می‌شود.

دانش طبیعی بی‌حالت، دانشی مانند معنای مرتبط با یک کلمه است.

دانش طبیعی باحالت، دانشی است که شامل بافت موجود در یک جمله می‌شود.

برخی از دانش‌های طبیعی به طور ذاتی در دانش پارامتر شبکه باحالت گنجانده شده‌اند، اما دانشی نیز وجود دارد که می‌تواند پس از تولد از متن زبان طبیعی به دست آید.

دانش رسمی بی‌حالت، دانشی است که می‌تواند با فرمول‌های ریاضی که شامل تکرار نیستند، بیان شود. دانش رسمی باحالت، دانشی است که می‌تواند با برنامه‌ها بیان شود.

حافظه کوتاه‌مدت مغز خود نیز می‌تواند به عنوان حافظه حالت برای دانش طبیعی و رسمی استفاده شود.

با این حال، از آنجایی که این حافظه کوتاه‌مدت است، مشکلی وجود دارد که حفظ پایدار یک حالت دشوار است. همچنین، در حفظ دانش در یک حالت رسمی و بدون ابهام خوب نیست.

از سوی دیگر، کاغذ، رایانه یا گوشی‌های هوشمند می‌توانند به عنوان حافظه حالت برای یادداشت‌برداری و ویرایش متن زبان طبیعی، زبان‌های رسمی یا مدل‌های رسمی استفاده شوند.

به طور کلی، داده‌ها بر روی کاغذ یا رایانه اغلب به عنوان چیزی برای ذخیره‌سازی دانش به عنوان یک ذخیره‌گاه دانش درک می‌شوند، اما می‌توانند به عنوان حافظه حالت برای سازماندهی افکار نیز استفاده شوند.

بنابراین، آشکار است که انسان‌ها فعالیت‌های فکری را با استفاده ماهرانه از این سه سیستم و دو نوع دانش انجام می‌دهند.

ALIS نیز پتانسیل دارد که با فعال‌سازی و تقویت فعالیت‌های فکری که از همین سه سیستم و دو نوع دانش بهره می‌برند، قابلیت‌های خود را به طرز چشمگیری بهبود بخشد.

به طور خاص، ALIS این مزیت را دارد که می‌تواند از ذخیره‌گاه‌های دانش وسیع و حافظه حالت استفاده کند. علاوه بر این، می‌تواند به راحتی چندین نمونه از هر کدام را آماده کرده و با تغییر یا ترکیب آنها، وظایف فکری را انجام دهد.

ستون ۲: ارکستراسیون فکری

در حالی که توانایی ذخیره‌سازی حجم زیادی از دانش در مخزن دانش یک مزیت است، صرف داشتن مقادیر زیاد دانش لزوماً برای فعالیت‌های فکری سودمند نیست؛ این به دلیل محدودیت‌های تعداد توکن‌هایی است که یک هوش مصنوعی مولد می‌تواند در یک زمان استفاده کند و همچنین این محدودیت که دانش نامربوط به نویز تبدیل می‌شود.

از سوی دیگر، با تقسیم‌بندی مناسب مخزن دانش و ایجاد مخازن دانش تخصصی با چگالی بالا که دانش لازم برای وظایف فکری خاص را جمع‌آوری می‌کنند، می‌توان مشکلات محدودیت توکن‌ها و نویز را کاهش داد.

در مقابل، چنین مخازن دانش تخصصی تنها برای همان وظایف فکری خاص قابل استفاده خواهند بود.

بسیاری از فعالیت‌های فکری ترکیبی پیچیده از وظایف فکری مختلف هستند. بنابراین، با تقسیم دانش به مخازن دانش تخصصی بر اساس نوع وظیفه فکری و تقسیم فعالیت فکری به وظایف فکری جزئی‌تر، ALIS می‌تواند کل فعالیت فکری را با جابجایی مناسب بین مخازن دانش تخصصی اجرا کند.

این مانند یک ارکستر است که از نوازندگان حرفه‌ای با سازهای مختلف تشکیل شده و یک رهبر کل مجموعه را هدایت می‌کند.

از طریق این فناوری سیستمی، "ارکستراسیون فکری"، ALIS قادر خواهد بود فعالیت‌های فکری خود را سازماندهی کند.

طراحی اولیه و روش توسعه ALIS

از اینجا، رویکرد توسعه ALIS را سازماندهی خواهم کرد.

همانطور که قبلاً در اصول و ستون‌ها بیان شد، ALIS ذاتاً طوری طراحی شده است که به راحتی بتواند توابع و منابع خود را گسترش دهد. این به این دلیل است که جوهر ALIS در عملکردهای خاص نیست، بلکه در فرآیندهای استخراج، ذخیره‌سازی، انتخاب و بهره‌برداری از دانش نهفته است.

به عنوان مثال، چندین نوع مکانیسم استخراج دانش را می‌توان آماده کرد و سپس بسته به طراحی سیستم، از میان آنها انتخاب یا به طور همزمان استفاده کرد.

علاوه بر این، می‌توان ALIS را طوری تنظیم کرد که خودش این انتخاب را انجام دهد.

ذخیره‌سازی، انتخاب و بهره‌برداری نیز می‌توانند به طور مشابه آزادانه انتخاب یا موازی‌سازی شوند.

بنابراین، ALIS می‌تواند به صورت افزایشی و چابک توسعه یابد، بدون نیاز به طراحی کل قابلیت‌ها به روش آبشاری.

آغاز ALIS

اکنون، بیایید یک ALIS بسیار ساده را طراحی کنیم.

رابط کاربری (UI) اصلی، همان هوش مصنوعی چت آشنا خواهد بود. در ابتدا، ورودی کاربر مستقیماً به LLM ارسال می‌شود. پاسخ LLM سپس در رابط کاربری نمایش داده شده و سیستم منتظر ورودی بعدی کاربر می‌ماند.

هنگامی که ورودی بعدی دریافت شود، LLM نه تنها ورودی جدید، بلکه کل تاریخچه چت بین کاربر و LLM را تا آن لحظه دریافت خواهد کرد.

پشت این رابط کاربری چت هوش مصنوعی، ما مکانیزمی را برای استخراج دانش قابل استفاده مجدد از تاریخچه چت آماده خواهیم کرد.

این می‌تواند به عنوان یک فرآیند که هنگام پایان مکالمه یا در فواصل زمانی منظم اجرا می‌شود، به سیستم چت هوش مصنوعی اضافه شود. البته، یک LLM برای استخراج دانش استفاده خواهد شد.

به این LLM، مفهوم و اصول ALIS، همراه با دانش فنی استخراج دانش، به عنوان پرامپت‌های سیستمی داده خواهد شد. اگر دانش طبق انتظار استخراج نشود، پرامپت‌های سیستمی باید از طریق آزمون و خطا اصلاح شوند.

دانش استخراج شده از تاریخچه چت مستقیماً در یک دریاچه دانش (knowledge lake) ذخیره خواهد شد. دریاچه دانش مکانیزمی برای ذخیره سازی ساده دانش در حالت مسطح و بدون ساختار، قبل از ساختارمند شدن آن است.

در مرحله بعد، ما مکانیزمی برای ساختاردهی آماده خواهیم کرد تا انتخاب دانش از دریاچه دانش آسان‌تر شود.

این به معنای فراهم کردن ذخیره‌گاه‌های وکتور جاسازی (embedding vector stores) برای جستجوی معنایی، همانطور که معمولاً در RAG استفاده می‌شود، و شاخص‌های کلمات کلیدی، در میان سایر موارد است.

گزینه‌های پیشرفته‌تر شامل تولید یک نمودار دانش (knowledge graph) یا انجام طبقه‌بندی دسته‌ای (category classification) است.

این مجموعه از اطلاعات ساختاریافته برای دریاچه دانش، پایگاه دانش (knowledge base) نامیده می‌شود. کل این پایگاه دانش و دریاچه دانش، ذخیره‌گاه دانش (knowledge store) را تشکیل خواهند داد.

در مرحله بعد، ذخیره‌گاه دانش را در پردازش رابط کاربری چت ادغام خواهیم کرد.

این اساساً همانند یک مکانیزم RAG عمومی است. برای ورودی کاربر، دانش مرتبط از ذخیره‌گاه دانش انتخاب شده و همراه با ورودی کاربر به LLM ارسال می‌شود.

این به LLM اجازه می‌دهد تا هنگام پردازش ورودی کاربر، به طور خودکار از دانش استفاده کند.

به این ترتیب، دانش با هر مکالمه با کاربر انباشته می‌شود و یک ALIS ساده را که از دانش انباشته شده از مکالمات گذشته استفاده می‌کند، محقق می‌سازد.

سناریوی ساده

به عنوان مثال، تصور کنید کاربری در حال توسعه یک برنامه وب با استفاده از این ALIS ساده است.

کاربر گزارش می‌دهد که کد پیشنهادی توسط LLM منجر به خطا شده است. پس از همکاری کاربر و LLM برای رفع مشکل، آنها متوجه می‌شوند که مشخصات API خارجی که LLM از آن اطلاع داشت، قدیمی بوده و برنامه پس از انطباق با آخرین مشخصات API به درستی کار می‌کند.

از این رشته چت، ALIS می‌تواند دانش را در مخزن دانش خود انباشته کند: به طور خاص، اینکه مشخصات API شناخته شده توسط LLM قدیمی است، و اینکه آخرین مشخصات API چیست.

سپس، دفعه بعد که برنامه‌ای با استفاده از همان API ایجاد شود، ALIS قادر خواهد بود از این دانش برای تولید برنامه‌ای بر اساس آخرین مشخصات API از همان ابتدا بهره ببرد.

بهبودهای ALIS اولیه

با این حال، برای اینکه این اتفاق بیفتد، این دانش باید در پاسخ به ورودی کاربر انتخاب شود. ممکن است این دانش مستقیماً به ورودی کاربر مرتبط نباشد، زیرا نام API مشکل‌ساز ممکن است در ورودی کاربر ظاهر نشود.

در این صورت، نام API تنها در طول پاسخ LLM ظاهر خواهد شد.

بنابراین، ALIS ساده را کمی گسترش داده و مکانیزم‌هایی برای پیش‌تحلیل (pre-analysis) و پس‌بررسی (post-checking) اضافه خواهیم کرد.

پیش‌تحلیل شبیه "حالت تفکر" در LLMهای اخیر است. حافظه‌ای که قادر به نگهداری متن به عنوان حافظه حالت باشد، آماده خواهد شد و پرامپت سیستمی به LLM دستور می‌دهد تا پس از دریافت ورودی کاربر، پیش‌تحلیل را انجام دهد.

نتیجه پیش‌تحلیل LLM در حافظه حالت ذخیره خواهد شد. بر اساس این نتیجه پیش‌تحلیل، دانش از ذخیره‌گاه دانش انتخاب می‌شود.

سپس، تاریخچه چت، نتیجه پیش‌تحلیل، دانش مربوط به ورودی کاربر، و دانش مربوط به نتیجه پیش‌تحلیل به LLM منتقل می‌شوند تا پاسخ دریافت شود.

علاوه بر این، نتیجه بازگشتی توسط LLM نیز برای جستجوی دانش از ذخیره‌گاه دانش استفاده خواهد شد. با احتساب دانش یافت شده در آنجا، از LLM خواسته می‌شود تا پس‌بررسی را انجام دهد.

اگر هرگونه مشکلی یافت شود، نکات مشکل‌ساز و دلایل تذکر (指摘) در آن گنجانده شده و به LLM چت بازگردانده می‌شود.

با فراهم آوردن فرصت‌هایی برای انتخاب دانش در طول پیش‌تحلیل و پس‌بررسی، می‌توانیم شانس استفاده از دانش انباشته شده را افزایش دهیم.

چشم‌انداز

این رویکرد ساخت یک ALIS اولیه و سپس افزودن بهبودها برای رفع نقاط ضعف آن، توسعه چابک و بهبود تدریجی ALIS را به طور کامل نشان می‌دهد.

علاوه بر این، همانطور که نمونه زده شد، ALIS اولیه برای استفاده در توسعه نرم‌افزار بسیار مناسب است. این به دلیل این است که این حوزه هم دارای تقاضای بالایی است و هم حوزه‌ای است که دانش به وضوح و به راحتی قابل انباشت است.

این ژانری است که در آن مسائل به وضوح سیاه و سفید هستند، با این حال یک حوزه حیاتی نیز محسوب می‌شود که در آن آزمون و خطا و انباشت دانش تکراری ضروری و مهم است.

علاوه بر این، از آنجایی که توسعه ALIS خود توسعه نرم‌افزار است، این واقعیت که توسعه‌دهندگان ALIS می‌توانند خودشان کاربران ALIS باشند نیز جذاب است.

و در کنار سیستم ALIS، دریاچه دانش نیز می‌تواند به صورت باز در پلتفرم‌هایی مانند گیت‌هاب به اشتراک گذاشته شود.

این امر به بسیاری از افراد اجازه می‌دهد تا در بهبود سیستم ALIS و انباشت دانش همکاری کنند، و همه از نتایج بهره‌مند شوند، که توسعه ALIS را بیشتر تسریع می‌کند.

البته، به اشتراک‌گذاری دانش محدود به توسعه‌دهندگان ALIS نیست، بلکه می‌تواند از همه توسعه‌دهندگان نرم‌افزاری که از ALIS استفاده می‌کنند، جمع‌آوری شود.

این واقعیت که دانش به زبان طبیعی است، دو مزیت دیگر نیز دارد:

اولین مزیت این است که حتی زمانی که مدل LLM تغییر می‌کند یا به روز می‌شود، می‌توان از دانش بهره‌برداری کرد.

مزیت دوم این است که دریاچه دانش عظیم انباشته شده می‌تواند به عنوان مجموعه داده پیش‌آموزشی برای LLMها استفاده شود. این کار را می‌توان به دو روش انجام داد: با استفاده از آن برای تنظیم دقیق (fine-tuning)، یا با استفاده از آن برای خود پیش‌آموزش LLM.

در هر صورت، اگر LLMهایی که به طور ذاتی دانش انباشته شده در دریاچه دانش را آموخته‌اند، قابل استفاده باشند، توسعه نرم‌افزار حتی کارآمدتر خواهد شد.

علاوه بر این، در توسعه نرم‌افزار، فرآیندهای مختلفی مانند تحلیل نیازمندی‌ها، طراحی، پیاده‌سازی، آزمایش، عملیات و نگهداری وجود دارد، و دانش تخصصی برای هر حوزه نرم‌افزاری و پلتفرم وجود دارد. اگر مکانیزمی برای تقسیم‌بندی دانش عظیم انباشته شده از این دیدگاه‌ها ایجاد شود، یک ارکستر ALIS نیز می‌تواند تشکیل شود.

بنابراین، فناوری‌های عنصری برای ALIS در جای خود قرار دارند. نکته کلیدی اکنون این است که روش‌های مختلفی را به صورت عملی امتحان کنیم—مانند دانش فنی استخراج دانش، انتخاب دانش مناسب، تقسیم‌بندی دانش تخصصی، و نحوه استفاده از حافظه حالت—تا رویکردهای مؤثر را کشف کنیم. همچنین، با افزایش پیچیدگی، زمان پردازش و هزینه‌های استفاده از LLM افزایش خواهد یافت، که نیاز به بهینه‌سازی را ضروری می‌سازد.

این فرآیندهای آزمون و خطا و بهینه‌سازی را می‌توان به صورت انطباقی از طریق توسعه و بهبود چارچوب‌ها دنبال کرد.

در ابتدا، توسعه‌دهندگان، به عنوان کاربران، به احتمال زیاد چارچوب‌ها را از طریق آزمون و خطا در ALIS ادغام خواهند کرد. با این حال، حتی در آن زمان نیز، خود LLM می‌تواند برای تولید ایده‌های چارچوب استفاده شود.

و با ادغام چارچوب‌هایی در ALIS که چارچوب‌ها را بر اساس نتایج دریافت شده از جهان و دانش استخراج شده بهبود می‌بخشند یا کشف می‌کنند، خود ALIS آزمون و خطا و بهینه‌سازی را به صورت انطباقی انجام خواهد داد.

ALIS در دنیای واقعی

هنگامی که ALIS به این مرحله از پالایش برسد، باید قادر باشد دانش را نه تنها در دنیای توسعه نرم‌افزار، بلکه به طور گسترده در حوزه‌های مختلف یاد بگیرد.

مشابه توسعه نرم‌افزار، انتظار می‌رود ALIS دامنه کاربرد خود را به فعالیت‌های فکری مختلفی که انسان‌ها با استفاده از رایانه‌ها انجام می‌دهند، گسترش دهد.

حتی در چنین فعالیت‌های کاملاً فکری، ALIS نوعی طبیعت هوش مصنوعی تجسم‌یافته (embodied AI) را نسبت به جهان هدف خود دارا است.

این به دلیل آن است که مرز بین خود و جهان را تشخیص می‌دهد، از طریق آن مرز بر جهان تأثیر می‌گذارد و می‌تواند اطلاعات دریافتی از جهان را درک کند.

آنچه ما عموماً به آن "بدن" می‌گوییم، مرزی با جهان است که از نظر فیزیکی قابل مشاهده و در یک مکان متمرکز است.

با این حال، حتی اگر مرز نامرئی و از نظر فضایی توزیع شده باشد، ساختار درک و عمل از طریق یک مرز همانند داشتن یک بدن فیزیکی است.

به این معنا، ALIS، هنگام انجام فعالیت‌های فکری، می‌تواند دارای ماهیت یک هوش مصنوعی تجسم‌یافته مجازی (virtually embodied AI) در نظر گرفته شود.

و هنگامی که ALIS به مرحله‌ای برسد که بتواند حتی در جهان‌های جدید و ناشناخته نیز به طور مناسب یاد بگیرد، این امکان وجود دارد که ALIS به عنوان بخشی از یک هوش مصنوعی تجسم‌یافته واقعی که دارای بدن فیزیکی است، ادغام شود.

به این ترتیب، ALIS در نهایت در دنیای واقعی به کار گرفته خواهد شد و شروع به یادگیری از آن خواهد کرد.

مفهوم

عناصر یک سیستم هوش یادگیرنده

اصول یک سیستم هوش یادگیرنده

انواع دانش

حافظه حالت اکتسابی و چارچوب

دانش رسمی

ستون ۱: انواع دانش

ستون ۲: ارکستراسیون فکری

طراحی اولیه و روش توسعه ALIS

آغاز ALIS

سناریوی ساده

بهبودهای ALIS اولیه

چشم‌انداز

ALIS در دنیای واقعی

دسته‌بندی‌ها

برچسب‌ها

مقالات مرتبط

یادگیری ماشینی زبان طبیعی

مکانیسم توجه به مثابه هوش مجازی میکرو

یادگیری برای یادگیری: هوش ذاتی

مهندس همه‌جانبه در دوران لیکوئیدور

گیت‌هاب به عنوان یک معدن فکری

فشرده‌سازی زمان و نقاط کور: نیاز به تنظیم‌گری

عصر تفکر شبیه‌سازی