Перейти до вмісту
Ця стаття була перекладена з японської мови за допомогою ШІ
Читати японською
Ця стаття знаходиться в суспільному надбанні (CC0). Ви можете вільно використовувати її. CC0 1.0 Universal

GitHub як інтелектуальна копальня

Чи знайомі ви з GitHub, веб-сервісом, що використовується як платформа для спільної розробки серед розробників відкритого програмного забезпечення?

Останніми роками його використання як платформи для спільної роботи розширилося не лише для відкритого програмного забезпечення, але й для корпоративної розробки програмного забезпечення та навіть для цілей, не пов’язаних із програмним забезпеченням.

Я також використовую GitHub для керування власними програмами та чернетками статей, які пишу для цього блогу.

У цій статті я досліджуватиму можливість того, що в майбутньому використання GitHub дедалі більше виходитиме за межі розробки програмного забезпечення, стаючи місцем для відкритого обміну знаннями.

Генерація вікі-сайтів за допомогою DeepWiki

Багато інструментів розробки програмного забезпечення, що використовують генеративний ШІ, призначені для допомоги людині в задачах програмування. Люди пишуть програми, а ШІ надає підтримку.

З іншого боку, з'являється новий тип інструментів розробки програмного забезпечення, де люди лише дають інструкції, а генеративний ШІ бере на себе завдання створення програм.

Devin є одним з таких інструментів, який став піонером і привернув увагу. Деякі навіть казали, що впровадження Devin було схоже на додавання ще одного програміста до команди розробників. Хоча досі стверджується, що людські інженери повинні надавати детальну підтримку для його ефективного використання, такі дані, безсумнівно, будуть збиратися та використовуватися для вдосконалення.

Ера, коли команди розробки програмного забезпечення, що складаються з однієї людини та ШІ-програмістів, таких як Devin, стануть звичним явищем, вже не за горами.

Cognition, розробник Devin, також випустила сервіс під назвою DeepWiki.

DeepWiki – це сервіс, який автоматично генерує вікі-сайт для кожного проекту розробки програмного забезпечення на GitHub. Це означає, що ШІ, подібний до Devin, читає та аналізує всі програми та пов'язані документи цього проекту та створює всі посібники та проектну документацію.

Повідомляється, що Cognition створила вікі-сайти для понад 50 000 основних публічних проектів розробки програмного забезпечення на GitHub, які є вільно доступними для будь-кого, використовуючи DeepWiki.

Оскільки це публічні проекти, у цьому абсолютно немає жодних проблем. Хоча вікі-сайти можуть генеруватися автоматично, це, мабуть, вимагало, щоб численні генеративні ШІ працювали на повну потужність протягом тривалого періоду, а вартість, мабуть, була значною.

Беручи на себе ці витрати, Cognition надала величезну перевагу великій кількості публічних проектів, дозволивши їм безкоштовно отримати пояснення та проектну документацію.

Якщо статистичні дані покажуть, що ці вікі-сайти корисні для кожного публічного проекту та мають значний вплив на покращення якості та продуктивності, тоді компанії-розробники програмного забезпечення приймуть DeepWiki для своїх власних проектів.

Cognition, мабуть, інвестувала в створення вікі-сайтів для величезної кількості публічних проектів, вірячи, що це може статися. Це демонструє впевненість Cognition у DeepWiki. І коли DeepWiki буде прийнято, Devin автоматично піде за ним, значно збільшуючи ймовірність широкого розповсюдження ШІ-програмістів.

GitHub як платформа для обміну документами

GitHub став популярним і де-факто стандартним веб-сервісом для спільного використання, редагування та зберігання програм для розробки відкритого програмного забезпечення.

Останніми роками його функції управління та безпеки для підприємств були покращені, що зробило його поширеним інструментом у передових компаніях, що розробляють програмне забезпечення.

З цієї причини GitHub викликає стійке уявлення про веб-сервіс для зберігання та спільного використання програм. Однак, насправді, його можна використовувати для спільного використання, редагування та зберігання різних документів та матеріалів, що абсолютно не пов’язані з програмами.

Тому чимало людей використовують GitHub для керування документами, які вони бажають широко спільно редагувати. Це можуть бути документи, пов’язані з програмним забезпеченням, або зовсім не пов’язані.

Крім того, блоги та веб-сайти також є документами, які містять певний тип програми або структуровані та публікуються за допомогою програм.

Через це нерідко окремі особи та компанії зберігають вміст блогів та веб-сайтів, а також програми, які роблять їх легкими для перегляду, та програми для автоматичної генерації сайту разом як єдиний проект на GitHub.

Також можна зробити такі блоги та веб-сайти публічними проектами на GitHub для спільного редагування їхнього вмісту.

Крім того, останнім часом генеративний ШІ не лише використовується для розробки програмного забезпечення, але й часто інтегрується в програмне забезпечення.

У цьому випадку інструкції, що називаються промптами, які дають детальні вказівки генеративному ШІ, вбудовуються в програми.

Ці промпти також можна вважати типом документа.

Інтелектуальна фабрика

Хоча я інженер-розробник програмного забезпечення, я також пишу статті для свого блогу.

Хоча я хочу, щоб їх читало багато людей, збільшити кількість читачів досить складно.

Звичайно, можна розглянути створення статей для привернення уваги або активний зв’язок із впливовими особами для отримання порад, серед інших зусиль та винахідливості.

Однак, враховуючи мою особистість та зусилля та стрес, пов'язані з цим, я неохоче займаюся агресивним просуванням. Крім того, витрачання часу на таку діяльність відволікало б від основи моєї роботи, яка включає програмування, обдумування ідей та їх документування.

Тому нещодавно я вирішив спробувати стратегію, відому як мультимедійна або омніканальна, яка передбачає розширення охоплення моїх дописів у блозі шляхом перетворення їх на різні форми контенту.

Зокрема, це включає переклад японських статей англійською мовою та їх публікацію на англомовних блог-сайтах, а також створення презентаційних відео для пояснення статей та їх публікацію на YouTube.

Крім того, окрім публікації на загальних блог-сервісах, я також розглядаю можливість створення власного блог-сайту, який перелічуватиме та категоризуватиме мої минулі дописи в блозі та посилатиме на пов'язані статті.

Якби я витрачав час на створення всього цього щоразу, коли пишеться нова стаття, це було б контрпродуктивно. Тому всі завдання, окрім написання початкової японської статті, автоматизуються за допомогою генеративного ШІ. Я називаю це інтелектуальною фабрикою.

Мені потрібно розробити програми для реалізації цього механізму.

Наразі я вже створив програми, які можуть повністю автоматизувати переклад, генерацію презентаційних відео та завантаження на YouTube.

Зараз я перебуваю в процесі створення базових програм для категоризації та зв'язування існуючих дописів у блозі.

Як тільки це буде завершено, і я створю програму для генерації власного блог-сайту та автоматичного відображення його на веб-сервері, початкова концепція моєї інтелектуальної фабрики буде завершена.

Інтелектуальна фабрика в широкому сенсі

Чернетки моїх дописів у блозі, які слугують сировиною для цієї інтелектуальної фабрики, також керуються як проект GitHub. Наразі вони є приватними та не є загальнодоступними, але я розглядаю можливість зробити їх публічними проектами разом із програмами інтелектуальної фабрики в майбутньому.

А категоризація дописів у блозі, зв'язування статей та пояснення дописів у блозі, перетворених на відео, які я зараз розробляю, мають ту саму базову концепцію, що й DeepWiki.

Використовуючи генеративний ШІ, з оригінальних творчих робіт як сировини виробляються різноманітні матеріали. Крім того, він може пов'язувати інформацію та знання всередині них, ефективно створюючи базу знань.

Єдина відмінність полягає в тому, чи є сировиною програма, чи допис у блозі. І для DeepWiki та моєї інтелектуальної фабрики, що працює на генеративному ШІ, ця різниця майже безглузда.

Іншими словами, якщо термін "інтелектуальна фабрика" трактувати в загальному, ширшому сенсі, не обмежуючись моєю програмою, то DeepWiki також є типом інтелектуальної фабрики.

І те, що виробляють інтелектуальні фабрики, не обмежується перекладеними статтями іншими мовами, презентаційними відео, саморобними блог-сайтами чи вікі-сайтами.

Вони, ймовірно, зможуть перетворювати контент на всі можливі медіа та формати, такі як короткі відео, твіти, комікси, анімація, подкасти та електронні книги.

Крім того, вміст у цих медіа та форматах також може бути диверсифікований відповідно до одержувача, наприклад, ширша багатомовна підтримка, версії для експертів чи початківців, а також версії для дорослих чи дітей.

Більше того, навіть генерація індивідуального контенту на замовлення є досяжною.

GitHub як інтелектуальна копальня

Сировина для інтелектуальної фабрики фундаментально може розташовуватися будь-де.

Однак, враховуючи, що GitHub став де-факто стандартом для спільного використання, спільного редагування та зберігання програм для проектів з відкритим кодом, і що багато людей, не лише я, використовують GitHub як місце зберігання документів, стає очевидним, що GitHub має потенціал стати основним джерелом сировини для інтелектуальних фабрик.

Іншими словами, GitHub стане спільною інтелектуальною копальнею для людства, постачаючи сировину інтелектуальним фабрикам.

Термін "спільний для людства" тут перегукується з ідеєю, що проекти з відкритим кодом є спільним програмним активом для людства.

Філософія відкритого коду, яка підтримувала GitHub, також добре узгоджуватиметься з концепцією відкритих документів.

Крім того, може виникнути культура управління інформацією про авторські права та ліцензіями для кожного документа, подібно до програм. Вміст, автоматично згенерований з вихідних документів, може легко отримати ту саму ліцензію або відповідати правилам, встановленим ліцензією.

З точки зору розробки інтелектуальної фабрики, централізація вихідних документів на GitHub є ідеальною.

Це дає дві переваги: підвищення ефективності розробки шляхом простого підключення GitHub до інтелектуальної фабрики, а також можливість ефективно демонструвати функції та продуктивність власної інтелектуальної фабрики, використовуючи загальнодоступні документи, подібно до DeepWiki.

У майбутньому, коли будуть розроблені різні інтелектуальні фабрики та стануть підключатися до GitHub, і коли все більше людей та компаній керуватимуть документами на GitHub та оброблятимуть їх за допомогою інтелектуальних фабрик, позиція GitHub як інтелектуальної копальні повинна міцно закріпитися.

Спільна публічна база знань людства

Завдяки GitHub у центрі як інтелектуальній копальні, а також різноманітному вмісту та базам знань, що виробляються інтелектуальними фабриками, вся ця екосистема створить публічну базу знань, спільну для всього людства.

Більше того, це динамічна база знань у реальному часі, яка буде автоматично розширюватися зі збільшенням кількості документів, опублікованих на GitHub.

Хоча ця величезна та складна база знань, що містить безліч інформації, буде корисною для людей, її потенційну цінність буде важко повністю витягти.

Однак ШІ зможе повністю використовувати цю публічну базу знань, спільну для всього людства.

Жили публічних знань

Якщо така екосистема буде реалізована, різноманітна публічна інформація природним чином збиратиметься на GitHub.

Це не обмежуватиметься чернетками особистих блогів чи корпоративних веб-сайтів.

Накопичуватимуться також академічні знання та дані, такі як статті перед публікацією та дослідницькі ідеї, експериментальні дані та результати опитувань.

Це привабить не лише тих, хто хоче використовувати знання, ідеї та дані на благо всього людства, а й тих, хто бажає швидко поширити свої відкриття та отримати визнання.

Навіть для вчених та дослідників багато хто знайде цінність у тому, щоб ШІ перевірив достовірність, новизну та вплив їхньої роботи, висловив це через різноманітний контент та визнав таким чином, що він стане вірусним, не чекаючи тривалого процесу рецензування.

Крім того, якщо їхня робота таким чином приверне увагу інших дослідників або компаній, що призведе до співпраці в дослідженнях або фінансування, це також матиме практичні переваги.

Крім того, ймовірно, буде зворотний потік власних знань ШІ.

Генеративний ШІ набуває величезних обсягів знань під час попереднього навчання, але він не активно досліджує несподівані зв'язки або схожі структури між цими величезними знаннями під час навчання.

Те саме стосується нових ідей, що виникають внаслідок з'єднання різних частин знань.

З іншого боку, пояснюючи такі подібності та зв'язки під час розмов з попередньо навченим генеративним ШІ, він може досить точно оцінити їхню цінність.

Отже, шляхом випадкового або вичерпного порівняння та з'єднання різних частин знань та введення їх у генеративний ШІ, можна виявити несподівані подібності та цінні зв'язки.

Звичайно, оскільки існує величезна кількість комбінацій, нереально охопити їх усі. Однак, шляхом відповідної оптимізації та автоматизації цього процесу, стає можливим автоматично відкривати корисні знання з існуючих знань.

Досягнувши такого автоматичного виявлення знань та зберігаючи виявлені знання на GitHub, здається можливим нескінченно повторювати цей цикл.

Таким чином, у цій інтелектуальній копальні існує безліч невідкритих жил знань, і їх стане можливим розкопувати.

Висновок

Коли буде створена де-факто стандартна, спільна база знань людства, подібна до GitHub, вона, ймовірно, буде використовуватися для попереднього навчання генеративного ШІ та для пошуку знань, як-от RAG.

У такому сценарії сам GitHub функціонуватиме як гігантський мозок. А генеративний ШІ ділитиметься цим мозком, розповсюджуючи та розширюючи знання, водночас ділячись ними.

Знання, додатково записані там, включатимуть не лише записи фактів, нові дані чи класифікації. Вони також можуть включати каталітичні знання, що сприяють відкриттю інших знань або нових комбінацій.

Такі знання з каталітичним ефектом я називаю "інтелектуальними кристалами" або "кристалами знань". Це включає, наприклад, нові рамки для мислення.

Коли рамка щойно відкрита або розроблена, і додається інтелектуальний кристал, його каталітичний ефект дозволяє різні комбінації та структурування знань, ніж раніше, що призводить до зростання нових знань.

Серед них можуть бути й інші кристали знань. Це, у свою чергу, ще більше збільшить знання.

Такі знання — це не наукове відкриття, а щось ближче до математичного дослідження, інженерної розробки чи винаходу. Отже, це знання, які ростуть суто через думку, а не через нові спостережні факти, як наукові знання.

І GitHub як інтелектуальна копальня, разом з незліченною кількістю генеративних ШІ, що її використовують, прискорить зростання таких знань.

Знання, відкриті одне за одним зі швидкістю, що значно перевищує людські масштаби відкриття, будуть надані нам у формі, легкій для розуміння, завдяки фабрикам знань.

Таким чином, знання, які можна досліджувати суто за допомогою думки, будуть швидко видобуватися.