Czy znacie GitHub, serwis internetowy, który służy programistom oprogramowania open source jako platforma do wspólnego rozwoju?
W ostatnich latach jego zastosowanie jako przestrzeni do wspólnej pracy rozszerzyło się poza oprogramowanie open source, obejmując rozwój oprogramowania korporacyjnego, a nawet zastosowania niezwiązane z oprogramowaniem.
Ja również używam GitHuba do zarządzania własnymi programami oraz szkicami artykułów, które piszę na tego bloga.
W tym artykule zbadam możliwość, że wykorzystanie GitHuba będzie w coraz większym stopniu wykraczać poza oprogramowanie, stając się wspólną przestrzenią dla otwartej wiedzy.
Generowanie witryn Wiki za pomocą DeepWiki
Wiele narzędzi do tworzenia oprogramowania, wykorzystujących generatywną sztuczną inteligencję, ma za zadanie wspierać programistów. W tych narzędziach to ludzie piszą program, a AI zapewnia wsparcie.
Pojawia się jednak nowy typ narzędzi do tworzenia oprogramowania, w których ludzie jedynie wydają instrukcje, a generatywna sztuczna inteligencja przejmuje zadanie tworzenia programu.
Jednym z takich pionierskich narzędzi, które zyskało uwagę, jest Devin. Niektórzy mówili, że wprowadzenie Devina jest jak dodanie kolejnego programisty do zespołu deweloperskiego. Chociaż nadal mówi się, że ludzcy inżynierowie muszą zapewnić szczegółowe wsparcie dla efektywnego użytkowania, takie dane z pewnością zostaną zebrane i wykorzystane do dalszych usprawnień.
Era, w której typowy zespół programistów składa się z jednego człowieka i programistów AI, takich jak Devin, jako członków zespołu, szybko się zbliża.
Firma Cognition, twórca Devina, udostępniła również usługę o nazwie DeepWiki.
DeepWiki to usługa, która automatycznie generuje witrynę wiki dla każdego projektu rozwoju oprogramowania na GitHubie. Oznacza to, że AI, taka jak Devin, czyta i analizuje wszystkie programy i powiązane dokumenty projektu, a następnie tworzy całą dokumentację i specyfikacje projektowe.
Cognition podobno wygenerowała witryny wiki dla ponad 50 000 największych publicznych projektów rozwoju oprogramowania na GitHubie, które są swobodnie dostępne dla każdego.
Ponieważ są to projekty publiczne, nie ma z tym żadnego problemu. Chociaż witryny wiki mogą być generowane automatycznie, musiało to wiązać się z licznymi generatywnymi AI działającymi z pełną mocą przez dłuższy czas, co wiązało się z dużymi kosztami.
Dzięki temu, że Cognition poniosło te koszty, ogromna liczba projektów publicznych skorzystała, otrzymując darmową dokumentację i specyfikacje projektowe.
Jeśli dane statystyczne pokażą, że te witryny wiki są przydatne dla projektów publicznych i mają znaczący wpływ na poprawę jakości i produktywności, firmy programistyczne prawdopodobnie przyjmą DeepWiki do swoich własnych projektów.
Cognition musiało zainwestować w generowanie witryn wiki dla licznych projektów publicznych, wierząc, że tak się stanie. To dowodzi zaufania Cognition do DeepWiki. A jeśli DeepWiki zostanie przyjęte, Devin automatycznie podąży za nim, znacząco przyspieszając popularyzację programistów AI.
GitHub jako platforma udostępniania dokumentów
GitHub stał się popularnym i de facto standardowym serwisem internetowym do udostępniania, wspólnego edytowania i przechowywania programów dla rozwoju oprogramowania open source.
W ostatnich latach jego solidne funkcje zarządzania i bezpieczeństwa dla przedsiębiorstw sprawiły, że stał się powszechnie używany przez zaawansowane firmy programistyczne.
W rezultacie GitHub często kojarzony jest z serwisem internetowym przeznaczonym głównie do przechowywania i udostępniania programów. W rzeczywistości jednak umożliwia udostępnianie, wspólne edytowanie i przechowywanie różnorodnych dokumentów i materiałów, całkowicie niezwiązanych z programami.
Z tego powodu wiele osób używa GitHuba do zarządzania dokumentami, które chcą szeroko wspólnie edytować. Dokumenty te mogą być związane z oprogramowaniem lub całkowicie niezwiązane.
Ponadto blogi i witryny internetowe to również dokumenty, które zawierają rodzaj programu lub są strukturyzowane przez programy w celu ich publikacji.
Dlatego nie jest rzadkością, aby osoby prywatne i firmy przechowywały zawartość blogów i witryn internetowych, wraz z programami do prezentacji i automatycznego generowania witryn, razem jako jeden projekt GitHub.
Możliwe jest również uczynienie takiej zawartości blogów i witryn internetowych publicznymi projektami GitHub, aby umożliwić wspólną edycję.
Ostatnio, oprócz wykorzystywania generatywnej sztucznej inteligencji do rozwoju oprogramowania, coraz częściej spotyka się osadzanie funkcji generatywnej sztucznej inteligencji bezpośrednio w oprogramowaniu.
W takich przypadkach szczegółowe instrukcje dla generatywnej sztucznej inteligencji, zwane promptami, są osadzone w programie.
Te prompty również można uznać za rodzaj dokumentu.
Fabryka intelektualna
Chociaż jestem inżynierem oprogramowania, piszę również artykuły na mojego bloga.
Chociaż chciałbym, aby czytało je wiele osób, zwiększenie liczby czytelników jest sporym wyzwaniem.
Oczywiście mógłbym rozważyć tworzenie artykułów mających na celu przyciągnięcie uwagi lub bezpośredni kontakt z różnymi wpływowymi osobami w celu uzyskania porady, wkładając w to wysiłek i pomysłowość.
Jednak, biorąc pod uwagę moją osobowość oraz wysiłek i stres związane z tym, nie jestem entuzjastycznie nastawiony do agresywnej promocji. Co więcej, poświęcanie czasu na takie działania odwróciłoby moją uwagę od kluczowych aspektów mojej pracy: tworzenia programów, myślenia i pisania dokumentów.
Dlatego niedawno postanowiłem wypróbować strategię „multimedialną” lub „omnikanałową”, aby zwiększyć zasięg moich artykułów blogowych, publikując je w różnych formatach treści.
W szczególności obejmuje to tłumaczenie artykułów z języka japońskiego na angielski i publikowanie ich na anglojęzycznej stronie bloga, a także tworzenie filmów prezentacyjnych wyjaśniających artykuły i publikowanie ich na YouTube.
Ponadto, poza publikowaniem w ogólnych serwisach blogowych, rozważam również stworzenie własnej witryny blogowej z indeksem moich poprzednich artykułów według kategorii i linkowaniem powiązanych artykułów.
Gdybym miał tworzyć to wszystko ręcznie za każdym razem, gdy dodawany jest nowy artykuł, mijałoby się to z celem. Dlatego wszystkie zadania, z wyjątkiem pisania początkowego artykułu w języku japońskim, są automatyzowane za pomocą generatywnej sztucznej inteligencji. Nazywam to Fabryką Intelektualną.
Muszę opracować programy do realizacji tego systemu.
Obecnie stworzyłem już programy, które mogą w pełni zautomatyzować tłumaczenie, generowanie filmów prezentacyjnych i przesyłanie ich na YouTube.
Teraz jestem w trakcie tworzenia podstawowych programów do kategoryzacji i linkowania istniejących artykułów blogowych.
Gdy to zostanie ukończone i stworzę program do generowania mojej niestandardowej witryny blogowej i automatycznego wdrażania jej na serwerze WWW, początkowa koncepcja mojej Fabryki Intelektualnej zostanie w pełni zrealizowana.
Fabryka Intelektualna w szerszym sensie
Szkice moich artykułów blogowych, które służą jako surowce dla tej Fabryki Intelektualnej, są również zarządzane jako projekty GitHub. Obecnie nie są one publicznie ujawniane jako projekty prywatne, ale rozważam uczynienie ich projektami publicznymi w przyszłości, wraz z programami Fabryki Intelektualnej.
Ponadto, kategoryzacja artykułów blogowych, łączenie artykułów oraz wyjaśnienia wideo do artykułów blogowych, które obecnie rozwijam, dzielą tę samą podstawową koncepcję, co DeepWiki.
Wykorzystując generatywną sztuczną inteligencję, oryginalne dzieła twórcze są używane jako surowce do produkcji różnorodnych treści. Dodatkowo, informacje i wiedza zawarte w tych treściach mogą być połączone w celu stworzenia czegoś, co można nazwać bazą wiedzy.
Jedyna różnica polega na tym, czy surowcem jest program, czy artykuł blogowy. A dla DeepWiki i mojej Fabryki Intelektualnej, napędzanych generatywną sztuczną inteligencją, ta różnica jest w dużej mierze nieistotna.
Innymi słowy, jeśli termin „Fabryka Intelektualna” zostanie zinterpretowany w ogólnym, szerszym sensie, nie ograniczonym do moich konkretnych programów, DeepWiki jest również rodzajem Fabryki Intelektualnej.
Co więcej, to, co produkuje Fabryka Intelektualna, nie ogranicza się do przetłumaczonych artykułów w innych językach, filmów prezentacyjnych ani samodzielnie stworzonych witryn blogowych i wiki.
Prawdopodobnie będzie ona zdolna do konwertowania treści na każde możliwe medium i format, takie jak krótkie filmy, tweety, manga i anime, podcasty i e-booki.
Ponadto, treści w tych mediach i formatach mogą być również zróżnicowane, aby odpowiadać różnym odbiorcom, w tym szerszej wielojęzyczności, wersjom dla ekspertów lub początkujących, oraz wersjom dla dorosłych lub dzieci.
Ostatecznie, możliwa będzie nawet generacja treści na żądanie, dostosowanych do indywidualnych potrzeb.
GitHub jako kopalnia intelektualna
Surowce dla Fabryki Intelektualnej mogą być w zasadzie przechowywane w dowolnym miejscu.
Jednak biorąc pod uwagę, że GitHub stał się de facto standardem do udostępniania, wspólnego edytowania i przechowywania programów dla projektów open source, oraz że różne osoby — nie tylko ja sam — używają GitHuba jako miejsca do przechowywania dokumentów, staje się oczywiste, że GitHub ma potencjał, by stać się głównym źródłem surowców dla Fabryk Intelektualnych.
Innymi słowy, GitHub stanie się Kopalnią Intelektualną, wspólną dla ludzkości, dostarczającą surowców Fabrykom Intelektualnym.
Termin „wspólna dla ludzkości” tutaj odzwierciedla ideę, że projekty open source są wspólnym zasobem oprogramowania dla ludzkości.
Filozofia open source, która leży u podstaw GitHuba, będzie również dobrze pasować do koncepcji otwartych dokumentów.
Ponadto, mogłaby powstać kultura zarządzania informacjami o prawach autorskich i licencjami dla każdego dokumentu, podobnie jak w przypadku programów. Treści automatycznie generowane z dokumentów źródłowych mogą z łatwością otrzymać tę samą licencję lub być zgodne z zasadami określonymi w licencji.
Z perspektywy tworzenia Fabryki Intelektualnej, konsolidacja dokumentów surowcowych na GitHubie jest idealna.
Daje to dwie korzyści: efektywność rozwoju, ponieważ wymaga jedynie połączenia GitHuba z Fabryką Intelektualną, oraz możliwość skutecznego zademonstrowania funkcji i wydajności własnej Fabryki Intelektualnej na publicznie dostępnych dokumentach, podobnie jak w DeepWiki.
W przyszłości, w miarę rozwoju i połączenia różnych Fabryk Intelektualnych z GitHubem, oraz gdy coraz więcej osób i firm będzie zarządzać dokumentami na GitHubie w celu przetwarzania ich przez Fabryki Intelektualne, pozycja GitHuba jako Kopalni Intelektualnej powinna zostać mocno ugruntowana.
Publiczna baza wiedzy współdzielona przez ludzkość
Dzięki GitHubowi w centrum, pełniącemu rolę Kopalni Intelektualnej, oraz Fabrykom Intelektualnym produkującym szeroki wachlarz treści i baz wiedzy, cały ten ekosystem stworzy publiczną bazę wiedzy współdzieloną przez ludzkość.
Co więcej, będzie to dynamiczna, działająca w czasie rzeczywistym baza wiedzy, która automatycznie rozszerza się wraz ze wzrostem liczby dokumentów publikowanych na GitHubie.
Chociaż ta złożona, ogromna baza wiedzy, zawierająca olbrzymie ilości informacji, będzie korzystna dla ludzi, pełne wydobycie jej potencjalnej wartości będzie dla nas prawdopodobnie wyzwaniem.
Jednak AI będzie w stanie w pełni wykorzystać tę publicznie współdzieloną bazę wiedzy ludzkości.
Żyły wiedzy publicznej
Gdy taki ekosystem zostanie zrealizowany, różnorodne informacje publiczne naturalnie zbiegną się na GitHubie.
Nie ograniczy się to do szkiców osobistych blogów czy stron internetowych firm.
Zbiorą się tam również spostrzeżenia akademickie i dane, takie jak artykuły przed publikacją, pomysły badawcze, dane eksperymentalne i wyniki ankiet.
Przyciągnie to nie tylko tych, którzy chcą przyczynić się do rozwoju wiedzy, pomysłów i danych dla dobra całej ludzkości, ale także tych, którzy dążą do szybkiego rozpowszechniania odkryć, aby zyskać uznanie.
Nawet naukowcy i badacze mogą docenić to, że ich prace są weryfikowane pod kątem ważności, nowości i wpływu przez AI, wyrażane w różnych formatach treści i rozpoznawane przez „stanie się wirusowymi”, zamiast czekać na długotrwały i czasochłonny proces recenzowania artykułów.
Alternatywnie, jeśli ich praca w ten sposób zwróci uwagę innych badaczy lub firm, prowadząc do współpracy badawczej lub finansowania, istnieją wymierne korzyści.
Ponadto nastąpi recyrkulacja własnej wiedzy AI.
Chociaż generatywna AI zdobywa ogromne ilości wiedzy poprzez wstępne szkolenie, nie uczy się aktywnie, badając nieoczekiwane połączenia czy podobne struktury wśród tej ogromnej ilości wiedzy.
To samo dotyczy nowych spostrzeżeń, które pojawiają się w wyniku łączenia różnych fragmentów wiedzy.
Z drugiej strony, podczas omawiania takich podobieństw i połączeń z wstępnie wytrenowaną generatywną AI, może ona dość dokładnie ocenić ich wartość.
Dlatego, wprowadzając różnorodne fragmenty wiedzy do generatywnej AI, porównując je losowo lub wyczerpująco, możliwe jest odkrycie nieoczekiwanych podobieństw i wartościowych połączeń.
Oczywiście, biorąc pod uwagę ogromną liczbę kombinacji, objęcie wszystkiego jest niepraktyczne. Jednak odpowiednio usprawniając i automatyzując ten proces, możliwe staje się automatyczne wydobywanie użytecznej wiedzy z istniejącej.
Dzięki osiągnięciu takiego automatycznego odkrywania wiedzy i przechowywaniu odkrytej wiedzy na GitHubie, ta pętla mogłaby pozornie trwać w nieskończoność.
W ten sposób, w ramach tej Kopalni Intelektualnej, istnieje wiele nieodkrytych żył, a ich wydobycie stanie się możliwe.
Podsumowanie
W miarę jak kształtuje się wspólna dla ludzkości baza wiedzy, taka jak GitHub, działająca jako de facto standard, prawdopodobnie będzie ona wykorzystywana do wstępnego szkolenia generatywnej sztucznej inteligencji oraz do mechanizmów wyszukiwania wiedzy, takich jak RAG.
W takim scenariuszu sam GitHub będzie funkcjonował jak ogromne mózgowie. Generatywne sztuczne inteligencje będą wtedy współdzielić to mózgowie, dystrybuując i rozszerzając wiedzę.
Dodatkowo zapisywana tam wiedza nie będzie jedynie zapisami faktów, nowymi danymi czy klasyfikacjami. Będzie ona również zawierać wiedzę, która działa jak katalizator, promując odkrywanie innej wiedzy i nowych kombinacji.
Wiedzę o takim działaniu katalitycznym nazywam Kryształem Intelektualnym, czyli kryształem wiedzy. Obejmuje to na przykład nowe ramy myślenia.
Kiedy ramy są nowo odkrywane lub rozwijane, a Kryształy Intelektualne są dodawane, ich efekt katalityczny umożliwia nowe kombinacje i strukturyzację wiedzy, które wcześniej były niemożliwe, prowadząc do wzrostu nowej wiedzy.
Czasami mogą one zawierać kolejny Kryształ Intelektualny, który następnie dodatkowo wzmacnia wiedzę.
Ten rodzaj wiedzy jest bliższy dociekaniu matematycznemu, rozwojowi inżynieryjnemu czy wynalazkom, niż odkryciom naukowym. Dlatego jest to wiedza, która rośnie wyłącznie dzięki myśleniu, a nie dzięki nowym faktom obserwacyjnym, jak wiedza naukowa.
A GitHub, jako Kopalnia Intelektualna, wraz z niezliczonymi generatywnymi sztucznymi inteligencjami, które z niego korzystają, przyspieszy wzrost takiej wiedzy.
Ta szybko odkrywana wiedza, znacznie przekraczająca tempo odkryć w skali ludzkiej, będzie dostarczana w łatwo zrozumiałym formacie przez Fabryki Intelektualne.
W ten sposób wiedza, którą można badać wyłącznie poprzez myślenie, będzie szybko wydobywana.