GitHub jako kopalnia intelektualna

Czy znasz GitHub, usługę internetową, która służyła jako platforma współpracy dla twórców oprogramowania open-source?

W ostatnich latach jej zastosowanie jako platformy do pracy zespołowej rozszerzyło się, obejmując nie tylko oprogramowanie open-source, ale także korporacyjne tworzenie oprogramowania, a nawet cele niezwiązane z oprogramowaniem.

Ja również używam GitHub do zarządzania własnymi programami i szkicami artykułów, które piszę na tego bloga.

W tym artykule zbadam możliwość, że zastosowanie GitHub w przyszłości będzie coraz bardziej wykraczać poza rozwój oprogramowania, stając się miejscem otwartej wymiany wiedzy.

Generowanie witryn Wiki przez DeepWiki

Wiele narzędzi do tworzenia oprogramowania, wykorzystujących generatywną sztuczną inteligencję, zostało zaprojektowanych w celu wspomagania zadań programistycznych wykonywanych przez ludzi. Ludzie piszą programy, a sztuczna inteligencja zapewnia wsparcie.

Z drugiej strony, pojawia się nowy typ narzędzi do tworzenia oprogramowania, gdzie ludzie jedynie wydają instrukcje, a generatywna sztuczna inteligencja przejmuje zadanie tworzenia programów.

Devin jest jednym z takich narzędzi, które stało się pionierem i zwróciło na siebie uwagę. Niektórzy nawet mówili, że wprowadzenie Devina było jak dodanie kolejnego programisty do zespołu deweloperskiego. Chociaż nadal mówi się, że inżynierowie-ludzie muszą zapewnić szczegółowe wsparcie, aby narzędzie było skutecznie wykorzystywane, takie dane z pewnością zostaną zebrane i wykorzystane do ulepszeń.

Era, w której zespoły deweloperskie składające się z jednego człowieka i programistów AI, takich jak Devin, staną się powszechne, jest już tuż za rogiem.

Cognition, twórca Devina, udostępnił również usługę o nazwie DeepWiki.

DeepWiki to usługa, która automatycznie generuje witrynę wiki dla każdego projektu rozwoju oprogramowania na GitHubie. Oznacza to, że sztuczna inteligencja, podobna do Devina, czyta i analizuje wszystkie programy i powiązane dokumenty danego projektu, a następnie tworzy wszystkie instrukcje i dokumenty projektowe.

Cognition podobno stworzyło witryny wiki dla ponad 50 000 głównych publicznych projektów rozwoju oprogramowania na GitHubie, które są swobodnie dostępne dla każdego, wykorzystując DeepWiki.

Ponieważ są to projekty publiczne, nie ma absolutnie żadnego problemu z takim działaniem. Chociaż witryny wiki mogą być generowane automatycznie, musiało to wymagać uruchomienia wielu generatywnych SI na pełnych obrotach przez długi czas, a koszty musiały być znaczne.

Poniosając te koszty, Cognition zapewniło ogromną korzyść ogromnej liczbie publicznych projektów, umożliwiając im bezpłatne uzyskanie wyjaśnień i dokumentów projektowych.

Jeśli dane statystyczne wykażą, że te witryny wiki są przydatne dla każdego projektu publicznego i mają znaczący wpływ na poprawę jakości i produktywności, wówczas firmy deweloperskie oprogramowania przyjmą DeepWiki do swoich własnych projektów.

Cognition musiało zainwestować w generowanie witryn wiki dla ogromnej liczby publicznych projektów, wierząc, że to się uda. To pokazuje zaufanie Cognition do DeepWiki. A kiedy DeepWiki zostanie przyjęte, Devin automatycznie podąży za nim, znacznie zwiększając prawdopodobieństwo powszechnego przyjęcia programistów AI.

GitHub jako platforma udostępniania dokumentów

GitHub stał się popularnym i de facto standardowym serwisem internetowym do udostępniania, wspólnej edycji i przechowywania programów w rozwoju oprogramowania open-source.

W ostatnich latach jego funkcje zarządzania i bezpieczeństwa dla przedsiębiorstw zostały udoskonalone, co czyni go powszechnym narzędziem w zaawansowanych firmach zajmujących się tworzeniem oprogramowania.

Z tego powodu GitHub silnie kojarzy się z usługą internetową do przechowywania i udostępniania programów. Jednak w rzeczywistości może być wykorzystywany do udostępniania, wspólnej edycji i przechowywania różnorodnych dokumentów i materiałów, całkowicie niezwiązanych z programami.

Dlatego niemało osób używa GitHub do zarządzania dokumentami, które chcą szeroko współredagować. Mogą to być dokumenty związane z oprogramowaniem lub całkowicie niezwiązane.

Co więcej, blogi i strony internetowe to również dokumenty, które zawierają rodzaj programu lub są strukturyzowane i publikowane za pomocą programów.

Z tego powodu nie jest rzadkością, że osoby prywatne i firmy przechowują zawartość blogów i stron internetowych, wraz z programami ułatwiającymi ich przeglądanie i programami do automatycznego generowania witryn, razem jako jeden projekt na GitHubie.

Istnieje również możliwość uczynienia takich blogów i stron internetowych projektami publicznymi na GitHubie w celu wspólnej edycji ich zawartości.

Ponadto, ostatnio generatywna sztuczna inteligencja jest nie tylko wykorzystywana do rozwoju oprogramowania, ale także często integrowana z oprogramowaniem.

W tym przypadku zdania instruktażowe zwane promptami, które zawierają szczegółowe instrukcje dla generatywnej sztucznej inteligencji, są osadzone w programach.

Te prompty również mogą być uważane za rodzaj dokumentu.

Fabryka Intelektualna

Chociaż jestem inżynierem zajmującym się tworzeniem oprogramowania, piszę również artykuły na mojego bloga.

Chociaż chciałbym, aby czytało je wiele osób, zwiększenie liczby czytelników jest dość trudne.

Oczywiście, można by rozważyć tworzenie artykułów mających na celu przyciągnięcie uwagi lub aktywne kontaktowanie się z wpływowymi osobami w celu uzyskania porady, a także inne wysiłki i pomysłowość.

Jednak biorąc pod uwagę moją osobowość oraz wysiłek i stres związane z takimi działaniami, niechętnie angażuję się w agresywną promocję. Co więcej, poświęcanie czasu na takie działania odciągałoby mnie od istoty mojej pracy, która obejmuje programowanie, rozważanie pomysłów i ich dokumentowanie.

Dlatego niedawno zdecydowałem się wypróbować strategię znaną jako multimedia lub omnichannel, która polega na poszerzaniu zasięgu moich postów na blogu poprzez rozwijanie ich w różne formy treści.

W szczególności obejmuje to tłumaczenie japońskich artykułów na angielski i publikowanie ich na angielskich stronach blogowych, a także tworzenie filmów prezentacyjnych wyjaśniających artykuły i publikowanie ich na YouTube.

Ponadto, oprócz publikowania na ogólnych serwisach blogowych, rozważam również stworzenie własnej witryny blogowej, która będzie listować i kategoryzować moje wcześniejsze posty oraz linkować powiązane artykuły.

Gdybym miał poświęcać czas na tworzenie tego wszystkiego za każdym razem, gdy napisany zostanie nowy artykuł, byłoby to nieefektywne. Dlatego wszystkie zadania inne niż pisanie początkowego japońskiego artykułu są zautomatyzowane przy użyciu generatywnej sztucznej inteligencji. Nazywam to fabryką intelektualną.

Muszę opracować programy do wdrożenia tego mechanizmu.

Obecnie stworzyłem już programy, które mogą w pełni zautomatyzować tłumaczenie, generowanie filmów prezentacyjnych i przesyłanie ich na YouTube.

Obecnie jestem w trakcie tworzenia podstawowych programów do kategoryzowania i linkowania istniejących postów na blogu.

Gdy to zostanie ukończone i stworzę program do generowania mojej własnej witryny blogowej oraz automatycznego odzwierciedlania jej na serwerze internetowym, początkowa koncepcja mojej fabryki intelektualnej zostanie ukończona.

Fabryka Intelektualna w Szerokim Sensie

Szkice moich postów na blogu, które służą jako surowiec dla tej fabryki intelektualnej, są również zarządzane jako projekt GitHub. Na razie są one prywatne i nie są publicznie dostępne, ale rozważam uczynienie ich projektami publicznymi w przyszłości, wraz z programami fabryki intelektualnej.

Kategoryzacja postów na blogu, linkowanie artykułów oraz wyjaśnianie postów na blogu przekształconych w wideo, które obecnie rozwijam, mają ten sam podstawowy koncept co DeepWiki.

Wykorzystując generatywną sztuczną inteligencję, różnorodne treści są wytwarzane z oryginalnych dzieł twórczych jako surowców. Dodatkowo, może ona łączyć w sobie informacje i wiedzę, skutecznie tworząc bazę wiedzy.

Jedyną różnicą jest to, czy surowiec to program, czy post na blogu. A dla DeepWiki i mojej fabryki intelektualnej, napędzanej generatywną sztuczną inteligencją, ta różnica jest niemal bez znaczenia.

Innymi słowy, jeśli termin „fabryka intelektualna” zostanie zinterpretowany w ogólnym, szerszym sensie, nie ograniczając się do mojego programu, wówczas DeepWiki jest również rodzajem fabryki intelektualnej.

A to, co produkują fabryki intelektualne, nie ogranicza się do przetłumaczonych artykułów w innych językach, filmów prezentacyjnych, własnoręcznie stworzonych stron blogowych czy witryn wiki.

Prawdopodobnie będą one w stanie przekształcać treści w każde możliwe medium i format, takie jak krótkie filmy, tweety, komiksy, animacje, podcasty i e-booki.

Co więcej, zawartość tych mediów i formatów może być również zróżnicowana, aby odpowiadać odbiorcy, np. szersze wsparcie wielojęzyczne, wersje dla ekspertów lub początkujących, oraz wersje dla dorosłych lub dzieci.

Ponadto, możliwe jest nawet generowanie niestandardowych treści na żądanie.

Surowce dla fabryki intelektualnej mogą być zasadniczo zlokalizowane w dowolnym miejscu.

Jednak biorąc pod uwagę, że GitHub stał się de facto standardem dla udostępniania, wspólnej edycji i przechowywania programów projektów open-source, oraz że wiele osób, nie tylko ja, używa GitHub jako miejsca przechowywania dokumentów, staje się oczywiste, że GitHub ma potencjał, by stać się głównym źródłem surowców dla fabryk intelektualnych.

Innymi słowy, GitHub stanie się wspólną kopalnią intelektualną dla ludzkości, dostarczającą surowce do fabryk intelektualnych.

Termin „dzielony przez ludzkość” nawiązuje tutaj do idei, że projekty open-source są wspólnym zasobem oprogramowania dla ludzkości.

Filozofia open-source, która wspiera GitHub, będzie również dobrze pasować do koncepcji otwartych dokumentów.

Co więcej, może pojawić się kultura zarządzania informacjami o prawach autorskich i licencjach dla każdego dokumentu, podobnie jak w przypadku programów. Treści automatycznie generowane z dokumentów źródłowych mogą łatwo otrzymać tę samą licencję lub być zgodne z zasadami określonymi w licencji.

Z perspektywy rozwoju fabryki intelektualnej, scentralizowanie dokumentów źródłowych na GitHubie jest idealne.

Oferuje to dwie korzyści: poprawioną efektywność rozwoju poprzez proste połączenie GitHub z fabryką intelektualną oraz możliwość skutecznego demonstrowania funkcji i wydajności własnej fabryki intelektualnej przy użyciu publicznie dostępnych dokumentów, podobnie jak w przypadku DeepWiki.

W przyszłości, gdy rozwiną się różne fabryki intelektualne i będą mogły łączyć się z GitHubem, a coraz więcej osób i firm będzie zarządzać dokumentami na GitHubie i przetwarzać je za pomocą fabryk intelektualnych, pozycja GitHub jako kopalni intelektualnej powinna zostać mocno ugruntowana.

Wspólna Publiczna Baza Wiedzy Ludzkości

Gdy GitHub znajdzie się w centrum jako kopalnia intelektualna, a różnorodne treści i bazy wiedzy będą produkowane przez fabryki intelektualne, cały ten ekosystem stworzy publiczną bazę wiedzy, współdzieloną przez ludzkość.

Co więcej, jest to dynamiczna i działająca w czasie rzeczywistym baza wiedzy, która będzie automatycznie się rozszerzać wraz ze wzrostem liczby dokumentów publikowanych na GitHubie.

Chociaż ta ogromna i złożona baza wiedzy, zawierająca olbrzymią ilość informacji, będzie użyteczna dla ludzi, trudno będzie w pełni wydobyć jej potencjalną wartość.

Jednak sztuczna inteligencja będzie w stanie w pełni wykorzystać tę publiczną bazę wiedzy, współdzieloną przez całą ludzkość.

Żyły Wiedzy Publicznej

Jeśli taki ekosystem zostanie zrealizowany, różnorodne informacje publiczne naturalnie zbiegną się na GitHubie.

Nie będzie to ograniczać się tylko do szkiców osobistych blogów czy stron internetowych firm.

Będą się tam również gromadzić akademickie spostrzeżenia i dane, takie jak artykuły przed publikacją, pomysły badawcze, dane eksperymentalne i wyniki ankiet.

Przyciągnie to nie tylko tych, którzy chcą wykorzystać wiedzę, pomysły i dane dla dobra całej ludzkości, ale także tych, którzy pragną szybko rozpowszechnić swoje odkrycia i zyskać uznanie.

Nawet dla naukowców i badaczy wielu uznałoby za cenne, aby ich praca została zweryfikowana przez AI pod kątem ważności, nowości i wpływu, wyrażona w różnorodnych treściach i rozpoznana w sposób, który stanie się wirusowy, bez konieczności czekania na długi proces recenzowania.

Alternatywnie, jeśli ich praca w ten sposób przyciągnie uwagę innych badaczy lub firm, prowadząc do wspólnych badań lub finansowania, istnieją również praktyczne korzyści.

Ponadto, prawdopodobnie nastąpi przepływ zwrotny własnej wiedzy AI.

Generatywna sztuczna inteligencja nabywa ogromne ilości wiedzy poprzez wstępne szkolenie, ale nie aktywnie eksploruje nieoczekiwane połączenia ani podobne struktury między tą ogromną wiedzą podczas uczenia się.

To samo dotyczy nowych spostrzeżeń, które pojawiają się w wyniku łączenia różnych fragmentów wiedzy.

Z drugiej strony, podczas wyjaśniania takich podobieństw i połączeń w rozmowach z wstępnie przeszkoloną generatywną sztuczną inteligencją, może ona dość dokładnie ocenić ich wartość.

Dlatego, poprzez losowe lub wyczerpujące porównywanie i łączenie różnych fragmentów wiedzy oraz wprowadzanie ich do generatywnej sztucznej inteligencji, możliwe jest odkrycie nieoczekiwanych podobieństw i wartościowych połączeń.

Oczywiście, ponieważ istnieje ogromna liczba kombinacji, nierealistyczne jest pokrycie wszystkich. Jednak poprzez odpowiednie usprawnienie i automatyzację tego procesu, możliwe staje się automatyczne odkrywanie użytecznej wiedzy z istniejącej wiedzy.

Osiągając takie automatyczne odkrywanie wiedzy i przechowując odkrytą wiedzę na GitHubie, wydaje się możliwe powtarzanie tej pętli w nieskończoność.

W ten sposób w tej kopalni intelektualnej istnieje wiele nieodkrytych żył wiedzy, a ich wydobycie stanie się możliwe.

Podsumowanie

W miarę jak powstaje de facto standardowa, wspólna dla ludzkości baza wiedzy, taka jak GitHub, prawdopodobnie będzie ona wykorzystywana do wstępnego szkolenia generatywnej sztucznej inteligencji oraz do wyszukiwania wiedzy, podobnie jak w przypadku RAG.

W takim scenariuszu sam GitHub będzie funkcjonował jak gigantyczny mózg. A generatywna sztuczna inteligencja będzie dzielić ten mózg, dystrybuując i rozszerzając wiedzę, jednocześnie ją współdzieląc.

Dodatkowo zapisana tam wiedza będzie obejmować nie tylko zapisy faktów, nowe dane czy klasyfikacje. Może również zawierać wiedzę katalityczną, która sprzyja odkrywaniu innej wiedzy lub nowych kombinacji.

Taką wiedzę o działaniu katalitycznym nazywam „kryształami intelektualnymi” lub „kryształami wiedzy”. Obejmuje to na przykład nowe ramy myślenia.

Kiedy nowa rama zostanie odkryta lub opracowana i dodany zostanie kryształ intelektualny, jego efekt katalityczny umożliwia inne niż dotąd kombinacje i strukturyzację wiedzy, prowadząc do wzrostu nowej wiedzy.

Wśród nich mogą znajdować się inne kryształy wiedzy. To z kolei jeszcze bardziej zwiększy wiedzę.

Taka wiedza nie jest odkryciem naukowym, ale czymś bliższym dociekaniom matematycznym, rozwojowi inżynieryjnemu czy wynalazkowi. Dlatego jest to wiedza, która rośnie wyłącznie poprzez myśl, a nie poprzez nowe fakty obserwacyjne, jak wiedza naukowa.

A GitHub jako kopalnia intelektualna, wraz z niezliczonymi generatywnymi sztucznymi inteligencjami wykorzystującymi go, przyspieszy wzrost takiej wiedzy.

Wiedza odkrywana jedna po drugiej, w tempie znacznie przewyższającym ludzką skalę odkryć, będzie dostarczana w formie łatwej do zrozumienia przez fabryki wiedzy.

W ten sposób wiedza, którą można badać wyłącznie poprzez myśl, będzie szybko wydobywana.

GitHub jako kopalnia intelektualna

Generowanie witryn Wiki przez DeepWiki

GitHub jako platforma udostępniania dokumentów

Fabryka Intelektualna

Fabryka Intelektualna w Szerokim Sensie