پرش به محتوا
این مقاله با استفاده از هوش مصنوعی از ژاپنی ترجمه شده است
به ژاپنی بخوانید
این مقاله در مالکیت عمومی (CC0) است. آزادانه از آن استفاده کنید. CC0 1.0 Universal

گیت‌هاب به عنوان یک معدن فکری

آیا با گیت‌هاب آشنایی دارید؟ سرویس وبی که به عنوان پلتفرمی برای توسعه مشارکتی در میان توسعه‌دهندگان نرم‌افزارهای متن‌باز استفاده می‌شود.

در سال‌های اخیر، استفاده از آن به عنوان پلتفرمی برای کارهای مشارکتی گسترش یافته است، نه تنها برای نرم‌افزارهای متن‌باز، بلکه برای توسعه نرم‌افزارهای شرکتی و حتی برای اهداف غیر مرتبط با نرم‌افزار.

من نیز از گیت‌هاب برای مدیریت برنامه‌های شخصی و پیش‌نویس مقالاتی که برای این وبلاگ می‌نویسم، استفاده می‌کنم.

در این مقاله، من به بررسی این امکان خواهم پرداخت که چگونه استفاده از گیت‌هاب در آینده به طور فزاینده‌ای فراتر از توسعه نرم‌افزار گسترش یافته و به مکانی برای اشتراک‌گذاری دانش باز تبدیل خواهد شد.

تولید سایت ویکی توسط DeepWiki

بسیاری از ابزارهای توسعه نرم‌افزار که از هوش مصنوعی مولد استفاده می‌کنند، برای کمک به وظایف برنامه‌نویسی انسان طراحی شده‌اند. انسان‌ها برنامه‌ها را می‌نویسند و هوش مصنوعی پشتیبانی می‌کند.

از سوی دیگر، نوع جدیدی از ابزارهای توسعه نرم‌افزار در حال ظهور است که در آن انسان‌ها فقط دستورالعمل می‌دهند و هوش مصنوعی مولد، وظیفه ایجاد برنامه‌ها را بر عهده می‌گیرد.

دوین (Devin) یکی از این ابزارهاست که پیشگام شد و مورد توجه قرار گرفت. برخی حتی گفتند که معرفی دوین مانند اضافه کردن یک برنامه‌نویس دیگر به تیم توسعه است. اگرچه هنوز گفته می‌شود که مهندسان انسانی برای استفاده مؤثر از آن به پشتیبانی دقیق نیاز دارند، اما چنین داده‌هایی مطمئناً جمع‌آوری شده و برای بهبود استفاده خواهند شد.

عصر تیم‌های توسعه نرم‌افزار متشکل از یک انسان و برنامه‌نویسان هوش مصنوعی مانند دوین به عنوان اعضای تیم، در شرف وقوع است.

Cognition، توسعه‌دهنده دوین، همچنین سرویسی به نام DeepWiki را منتشر کرده است.

DeepWiki سرویسی است که به طور خودکار یک سایت ویکی برای هر پروژه توسعه نرم‌افزار در گیت‌هاب ایجاد می‌کند. این بدان معناست که یک هوش مصنوعی، شبیه به دوین، تمام برنامه‌ها و اسناد مرتبط با آن پروژه را می‌خواند و تجزیه و تحلیل می‌کند و تمام دفترچه‌های راهنما و اسناد طراحی را ایجاد می‌کند.

Cognition طبق گزارش‌ها، با استفاده از DeepWiki، سایت‌های ویکی را برای بیش از ۵۰,۰۰۰ پروژه بزرگ توسعه نرم‌افزار عمومی در گیت‌هاب که به طور آزاد در دسترس همه هستند، ایجاد کرده است.

از آنجا که این‌ها پروژه‌های عمومی هستند، هیچ مشکلی در انجام این کار وجود ندارد. اگرچه سایت‌های ویکی می‌توانند به طور خودکار تولید شوند، اما باید به تعداد زیادی هوش مصنوعی مولد نیاز داشته باشد که برای مدت طولانی با ظرفیت کامل کار کنند، و هزینه آن باید قابل توجه بوده باشد.

با تحمل این هزینه‌ها، Cognition سود بزرگی را برای تعداد زیادی از پروژه‌های عمومی فراهم کرده است و به آن‌ها امکان می‌دهد توضیحات و اسناد طراحی را به صورت رایگان دریافت کنند.

اگر داده‌های آماری نشان دهد که این سایت‌های ویکی برای هر پروژه عمومی مفید هستند و تأثیر قابل توجهی بر بهبود کیفیت و بهره‌وری دارند، آنگاه شرکت‌های توسعه نرم‌افزار، DeepWiki را برای پروژه‌های خود به کار خواهند گرفت.

Cognition باید با این باور که این اتفاق ممکن است، در تولید سایت‌های ویکی برای تعداد زیادی از پروژه‌های عمومی سرمایه‌گذاری کرده باشد. این نشان‌دهنده اعتماد Cognition به DeepWiki است. و هنگامی که DeepWiki به کار گرفته شود، دوین به طور خودکار از آن پیروی خواهد کرد و به طور قابل توجهی احتمال پذیرش گسترده برنامه‌نویسان هوش مصنوعی را افزایش می‌دهد.

گیت‌هاب به عنوان پلتفرم اشتراک‌گذاری سند

گیت‌هاب به یک سرویس وب محبوب و استاندارد دوفاکتو برای اشتراک‌گذاری، ویرایش مشترک و ذخیره برنامه‌ها برای توسعه نرم‌افزار متن‌باز تبدیل شده است.

در سال‌های اخیر، ویژگی‌های مدیریت و امنیتی آن برای شرکت‌ها بهبود یافته و آن را به ابزاری رایج در شرکت‌های پیشرفته‌ای که نرم‌افزار توسعه می‌دهند، تبدیل کرده است.

به همین دلیل، گیت‌هاب قویاً تصویر یک سرویس وب برای ذخیره و اشتراک‌گذاری برنامه‌ها را تداعی می‌کند. با این حال، در واقعیت، می‌توان از آن برای اشتراک‌گذاری، ویرایش مشترک و ذخیره اسناد و مواد مختلف، کاملاً بی‌ربط به برنامه‌ها، استفاده کرد.

بنابراین، کم نیستند افرادی که از گیت‌هاب برای مدیریت اسنادی استفاده می‌کنند که می‌خواهند به طور گسترده ویرایش مشترک داشته باشند. اینها می‌توانند اسناد مرتبط با نرم‌افزار باشند یا اسناد کاملاً بی‌ربط.

علاوه بر این، وبلاگ‌ها و وب‌سایت‌ها نیز اسنادی هستند که حاوی نوعی برنامه یا ساختار یافته و توسط برنامه‌ها منتشر می‌شوند.

به همین دلیل، غیرمعمول نیست که افراد و شرکت‌ها محتوای وبلاگ‌ها و وب‌سایت‌ها، همراه با برنامه‌هایی که مشاهده آنها را آسان می‌کنند و برنامه‌های تولید خودکار سایت، را به عنوان یک پروژه واحد در گیت‌هاب ذخیره کنند.

همچنین می‌توان چنین وبلاگ‌ها و وب‌سایت‌هایی را به پروژه‌های عمومی در گیت‌هاب تبدیل کرد تا محتوای آنها به طور مشترک ویرایش شود.

علاوه بر این، اخیراً هوش مصنوعی مولد نه تنها برای توسعه نرم‌افزار استفاده می‌شود، بلکه اغلب در نرم‌افزار نیز ادغام می‌شود.

در این حالت، جملات دستوری به نام پرامپت، که دستورالعمل‌های دقیقی به هوش مصنوعی مولد می‌دهند، در داخل برنامه‌ها گنجانده می‌شوند.

این پرامپت‌ها را نیز می‌توان نوعی سند در نظر گرفت.

کارخانه فکری

با وجود اینکه من یک مهندس توسعه نرم‌افزار هستم، مقالاتی نیز برای وبلاگم می‌نویسم.

در حالی که می‌خواهم افراد زیادی مقالاتم را بخوانند، افزایش تعداد خوانندگان بسیار دشوار است.

البته، می‌توان به ایجاد مقالاتی برای جلب توجه یا تماس فعال با افراد تأثیرگذار برای دریافت مشاوره، و سایر تلاش‌ها و ابتکارات فکر کرد.

با این حال، با توجه به شخصیت من و تلاش و استرس ناشی از آن، تمایلی به تبلیغات پرخاشگرانه ندارم. علاوه بر این، صرف زمان برای چنین فعالیت‌هایی، از هسته اصلی کارم که شامل برنامه‌نویسی، تفکر درباره ایده‌ها و مستندسازی آنهاست، می‌کاهد.

بنابراین، اخیراً تصمیم گرفتم استراتژی‌ای به نام چندرسانه‌ای یا همه‌کاناله را امتحان کنم، که شامل گسترش دامنه دسترسی به پست‌های وبلاگم با تبدیل آنها به اشکال مختلف محتوا است.

به طور خاص، این شامل ترجمه مقالات ژاپنی به انگلیسی و انتشار آنها در سایت‌های وبلاگ انگلیسی، و ایجاد ویدئوهای ارائه برای توضیح مقالات و انتشار آنها در یوتیوب است.

علاوه بر این، در کنار انتشار در سرویس‌های وبلاگ عمومی، در حال بررسی ایجاد سایت وبلاگ شخصی خود نیز هستم که پست‌های وبلاگ گذشته‌ام را لیست و دسته‌بندی کرده و مقالات مرتبط را لینک دهد.

اگر قرار بود هر بار که مقاله جدیدی نوشته می‌شود، زمان صرف ایجاد اینها کنم، نتیجه معکوس می‌داد. بنابراین، تمام وظایف به جز نوشتن مقاله اولیه ژاپنی، با استفاده از هوش مصنوعی مولد خودکار می‌شوند. من این را یک کارخانه فکری می‌نامم.

من باید برنامه‌هایی برای پیاده‌سازی این مکانیسم توسعه دهم.

در حال حاضر، من قبلاً برنامه‌هایی ایجاد کرده‌ام که می‌توانند ترجمه، تولید ویدئوی ارائه و آپلود در یوتیوب را به طور کامل خودکار کنند.

اکنون در حال ایجاد برنامه‌های پایه برای دسته‌بندی و لینک‌دهی پست‌های وبلاگ موجود هستم.

پس از اتمام آن، و با ایجاد برنامه‌ای برای تولید سایت وبلاگ شخصی‌ام و بازتاب خودکار آن در یک سرور وب، مفهوم اولیه کارخانه فکری من کامل خواهد شد.

کارخانه فکری در معنای وسیع‌تر

پیش‌نویس پست‌های وبلاگ من، که به عنوان مواد اولیه برای این کارخانه فکری عمل می‌کنند، نیز به عنوان یک پروژه گیت‌هاب مدیریت می‌شوند. در حال حاضر، آنها خصوصی هستند و به صورت عمومی در دسترس نیستند، اما من در آینده در نظر دارم که آنها را همراه با برنامه‌های کارخانه فکری، به پروژه‌های عمومی تبدیل کنم.

و دسته‌بندی پست‌های وبلاگ، لینک‌دهی مقالات، و توضیح پست‌های وبلاگ تبدیل شده به ویدئو، که در حال حاضر در حال توسعه آن‌ها هستم، همان مفهوم اساسی DeepWiki را به اشتراک می‌گذارند.

با استفاده از هوش مصنوعی مولد، محتواهای مختلفی از آثار خلاقانه اصلی به عنوان مواد اولیه تولید می‌شوند. علاوه بر این، می‌تواند اطلاعات و دانش موجود در آن‌ها را به هم متصل کند و به طور مؤثر یک پایگاه دانش ایجاد نماید.

تنها تفاوت این است که آیا ماده اولیه یک برنامه است یا یک پست وبلاگ. و برای DeepWiki و کارخانه فکری من که با هوش مصنوعی مولد کار می‌کند، این تفاوت تقریباً بی‌معنی است.

به عبارت دیگر، اگر اصطلاح "کارخانه فکری" به معنای عمومی و وسیع‌تر تفسیر شود و محدود به برنامه من نباشد، آنگاه DeepWiki نیز نوعی کارخانه فکری است.

و آنچه کارخانه‌های فکری تولید می‌کنند، محدود به مقالات ترجمه شده به زبان‌های دیگر، ویدئوهای ارائه، سایت‌های وبلاگ خودساخته، یا سایت‌های ویکی نیست.

آنها احتمالاً قادر خواهند بود محتوا را به هر رسانه و فرمت قابل تصوری مانند ویدئوهای کوتاه، توییت‌ها، کمیک‌ها، انیمیشن‌ها، پادکست‌ها و کتاب‌های الکترونیکی تبدیل کنند.

علاوه بر این، محتوای موجود در این رسانه‌ها و فرمت‌ها نیز می‌تواند برای مطابقت با گیرنده متنوع شود، مانند پشتیبانی گسترده‌تر چندزبانه، نسخه‌هایی برای متخصصان یا مبتدیان، و نسخه‌هایی برای بزرگسالان یا کودکان.

علاوه بر این، حتی تولید محتوای سفارشی بر اساس تقاضا نیز قابل دستیابی است.

گیت‌هاب به عنوان یک معدن فکری

مواد اولیه یک کارخانه فکری اساساً می‌تواند در هر مکانی قرار داشته باشد.

با این حال، با توجه به اینکه گیت‌هاب به استاندارد دوفاکتو برای اشتراک‌گذاری، ویرایش مشترک و ذخیره‌سازی برنامه‌های پروژه متن‌باز تبدیل شده است، و اینکه بسیاری از افراد، نه فقط من، از گیت‌هاب به عنوان مکانی برای ذخیره‌سازی اسناد استفاده می‌کنند، واضح است که گیت‌هاب پتانسیل تبدیل شدن به منبع اصلی مواد اولیه برای کارخانه‌های فکری را دارد.

به عبارت دیگر، گیت‌هاب به یک معدن فکری مشترک برای بشریت تبدیل خواهد شد که مواد اولیه را به کارخانه‌های فکری تأمین می‌کند.

اصطلاح "مشترک برای بشریت" در اینجا، بازتابی از این ایده است که پروژه‌های متن‌باز، یک دارایی نرم‌افزاری مشترک برای بشریت هستند.

فلسفه متن‌باز که از گیت‌هاب حمایت کرده است، با مفهوم اسناد باز نیز به خوبی سازگار خواهد بود.

علاوه بر این، فرهنگی برای مدیریت اطلاعات حق چاپ و مجوزها برای هر سند، مشابه برنامه‌ها، می‌تواند پدید آید. محتوای تولید شده خودکار از اسناد منبع می‌تواند به راحتی همان مجوز را دریافت کند، یا با قوانینی که توسط مجوز تعیین شده است، مطابقت داشته باشد.

از دیدگاه توسعه یک کارخانه فکری، متمرکز کردن اسناد مواد اولیه در گیت‌هاب ایده‌آل است.

این امر دو مزیت دارد: بهبود کارایی توسعه با صرفاً اتصال گیت‌هاب به کارخانه فکری، و توانایی مؤثر در نمایش عملکردها و کارایی کارخانه فکری خود با استفاده از اسناد در دسترس عمومی، مشابه DeepWiki.

در آینده، با توسعه کارخانه‌های فکری مختلف و قابلیت اتصال آنها به گیت‌هاب، و با افزایش تعداد افراد و شرکت‌هایی که اسناد را در گیت‌هاب مدیریت کرده و آنها را با کارخانه‌های فکری پردازش می‌کنند، جایگاه گیت‌هاب به عنوان یک معدن فکری باید به طور محکم تثبیت شود.

پایگاه دانش عمومی مشترک بشریت

با محوریت گیت‌هاب به عنوان یک معدن فکری، و تولید محتواها و پایگاه‌های دانش مختلف توسط کارخانه‌های فکری، کل این اکوسیستم یک پایگاه دانش عمومی مشترک برای بشریت ایجاد خواهد کرد.

علاوه بر این، این یک پایگاه دانش پویا و بلادرنگ است که با افزایش تعداد اسناد منتشر شده در گیت‌هاب، به طور خودکار گسترش خواهد یافت.

در حالی که این پایگاه دانش وسیع و پیچیده، که حاوی دانش بی‌نهایتی است، برای انسان‌ها مفید خواهد بود، اما استخراج کامل ارزش بالقوه آن دشوار خواهد بود.

با این حال، هوش مصنوعی قادر خواهد بود از این پایگاه دانش عمومی، که توسط تمام بشریت به اشتراک گذاشته شده است، به طور کامل استفاده کند.

رگه‌های دانش عمومی

اگر چنین اکوسیستمی محقق شود، اطلاعات عمومی مختلف به طور طبیعی در گیت‌هاب همگرا خواهند شد.

این امر فقط به پیش‌نویس وبلاگ‌های شخصی یا وب‌سایت‌های شرکتی محدود نخواهد شد.

بینش‌ها و داده‌های دانشگاهی، مانند مقالات پیش از انتشار و ایده‌های تحقیقاتی، داده‌های تجربی، و نتایج نظرسنجی نیز انباشته خواهند شد.

این امر نه تنها کسانی را که می‌خواهند از دانش، ایده‌ها و داده‌ها برای منفعت تمام بشریت استفاده کنند، بلکه کسانی را که می‌خواهند یافته‌های خود را به سرعت منتشر کرده و به رسمیت شناخته شوند، جذب خواهد کرد.

حتی برای محققان و پژوهشگران، بسیاری ارزش این را خواهند یافت که اعتبار، نوآوری و تأثیر کارشان توسط هوش مصنوعی تأیید شود، از طریق محتوای مختلف بیان شود، و به گونه‌ای شناخته شود که وایرال شود، بدون اینکه مجبور باشند منتظر فرآیند طولانی داوری همتا بمانند.

همچنین، اگر کار آنها به این شیوه توجه سایر محققان یا شرکت‌ها را جلب کند و به تحقیقات مشترک یا تأمین مالی منجر شود، مزایای عملی نیز وجود دارد.

علاوه بر این، احتمالاً جریان برگشتی از دانش خود هوش مصنوعی نیز وجود خواهد داشت.

هوش مصنوعی مولد مقادیر زیادی دانش را از طریق پیش‌آموزش کسب می‌کند، اما به طور فعال به دنبال ارتباطات غیرمنتظره یا ساختارهای مشابه بین آن دانش وسیع در طول یادگیری نیست.

همین امر در مورد بینش‌های جدیدی که از اتصال قطعات مختلف دانش پدید می‌آیند نیز صدق می‌کند.

از سوی دیگر، هنگام توضیح چنین شباهت‌ها و ارتباطاتی در طول مکالمه با یک هوش مصنوعی مولد پیش‌آموزش‌دیده، می‌تواند ارزش آنها را به دقت ارزیابی کند.

بنابراین، با مقایسه و اتصال تصادفی یا جامع قطعات مختلف دانش و وارد کردن آنها به یک هوش مصنوعی مولد، می‌توان شباهت‌های غیرمنتظره و ارتباطات ارزشمند را کشف کرد.

البته، از آنجا که تعداد ترکیبات بسیار زیاد است، پوشش دادن همه آنها غیرواقعی است. با این حال، با بهینه‌سازی و خودکارسازی مناسب این فرآیند، امکان کشف خودکار دانش مفید از دانش موجود فراهم می‌شود.

با دستیابی به چنین کشف خودکار دانش و ذخیره دانش کشف شده در گیت‌هاب، به نظر می‌رسد می‌توان این حلقه را به طور نامحدود تکرار کرد.

به این ترتیب، رگه‌های متعدد کشف نشده‌ای از دانش در این معدن فکری وجود دارد، و حفاری آنها امکان‌پذیر خواهد شد.

نتیجه‌گیری

با ایجاد یک پایگاه دانش انسانی مشترک و دوفاکتو مانند گیت‌هاب، به احتمال زیاد از آن برای پیش‌آموزش هوش مصنوعی مولد و بازیابی دانش مانند RAG استفاده خواهد شد.

در این سناریو، خود گیت‌هاب مانند یک مغز غول‌پیکر عمل خواهد کرد. و هوش مصنوعی مولد این مغز را به اشتراک خواهد گذاشت و در حالی که دانش را به اشتراک می‌گذارد، آن را توزیع و گسترش خواهد داد.

دانشی که به طور اضافی در آن ثبت می‌شود، نه تنها شامل ثبت حقایق، داده‌های جدید یا طبقه‌بندی‌ها خواهد بود. بلکه ممکن است شامل دانش کاتالیزوری نیز باشد که کشف دانش‌های دیگر یا ترکیبات جدید را ترویج می‌کند.

من چنین دانشی با اثر کاتالیزوری را "بلورهای فکری" یا "بلورهای دانش" می‌نامم. این شامل، برای مثال، چارچوب‌های جدیدی برای تفکر است.

هنگامی که یک چارچوب جدید کشف یا توسعه می‌یابد و یک بلور فکری به آن اضافه می‌شود، اثر کاتالیزوری آن ترکیبات و ساختاربندی متفاوتی از دانش را نسبت به قبل امکان‌پذیر می‌سازد که منجر به رشد دانش جدید می‌شود.

در میان اینها، ممکن است بلورهای دانش دیگری نیز وجود داشته باشند. این به نوبه خود، دانش را بیشتر افزایش خواهد داد.

چنین دانشی یک کشف علمی نیست، بلکه چیزی نزدیک‌تر به بررسی ریاضیاتی، توسعه مهندسی یا اختراع است. بنابراین، دانشی است که صرفاً از طریق تفکر رشد می‌کند، نه از طریق حقایق مشاهده‌ای جدید مانند دانش علمی.

و گیت‌هاب به عنوان یک معدن فکری، همراه با هوش مصنوعی‌های مولد بی‌شماری که از آن استفاده می‌کنند، رشد چنین دانشی را تسریع خواهد کرد.

دانشی که یکی پس از دیگری با سرعتی بسیار فراتر از مقیاس کشف انسان کشف می‌شود، توسط کارخانه‌های دانش به شکلی که برای ما قابل درک باشد، ارائه خواهد شد.

به این ترتیب، دانشی که صرفاً از طریق تفکر قابل کاوش است، به سرعت استخراج خواهد شد.