Kennen Sie GitHub, den Webdienst, der von Open-Source-Softwareentwicklern als Plattform für die kollaborative Entwicklung genutzt wird?
In den letzten Jahren hat sich seine Nutzung als Plattform für die Zusammenarbeit nicht nur auf Open-Source-Software, sondern auch auf die Unternehmenssoftwareentwicklung und sogar auf nicht-softwarebezogene Zwecke ausgeweitet.
Ich nutze GitHub auch, um meine eigenen Programme und die Entwürfe der Artikel, die ich für diesen Blog schreibe, zu verwalten.
In diesem Artikel werde ich die Möglichkeit untersuchen, dass die Nutzung von GitHub in Zukunft zunehmend über die Softwareentwicklung hinausgeht und zu einem Ort des offenen Wissensaustauschs wird.
Wiki-Site-Generierung durch DeepWiki
Viele Softwareentwicklungstools, die generative KI nutzen, sind darauf ausgelegt, menschliche Programmieraufgaben zu unterstützen. Menschen schreiben die Programme, und die KI leistet Unterstützung.
Andererseits entsteht ein neuer Typ von Softwareentwicklungstools, bei dem Menschen nur Anweisungen geben und generative KI die Aufgabe der Programmerstellung übernimmt.
Devin ist ein solches Werkzeug, das als Pionier Schlagzeilen machte. Manche sagten sogar, die Einführung von Devin sei wie die Hinzufügung eines weiteren Programmierers zum Entwicklungsteam. Obwohl immer noch gesagt wird, dass menschliche Ingenieure detaillierte Unterstützung leisten müssen, um es effektiv nutzen zu können, werden solche Daten sicherlich gesammelt und zur Verbesserung genutzt werden.
Die Ära, in der Softwareentwicklungsteams, bestehend aus einem Menschen und KI-Programmierern wie Devin als Teammitgliedern, alltäglich werden, steht unmittelbar bevor.
Cognition, der Entwickler von Devin, hat auch einen Dienst namens DeepWiki veröffentlicht.
DeepWiki ist ein Dienst, der automatisch eine Wiki-Site für jedes Softwareentwicklungsprojekt auf GitHub generiert. Das bedeutet, dass eine KI, ähnlich wie Devin, alle Programme und zugehörigen Dokumente dieses Projekts liest und analysiert und alle Handbücher und Entwurfsdokumente erstellt.
Cognition soll Berichten zufolge für über 50.000 große öffentliche Softwareentwicklungsprojekte auf GitHub, die für jedermann frei zugänglich sind, Wiki-Sites mit DeepWiki erstellt haben.
Da es sich um öffentliche Projekte handelt, ist dies absolut unproblematisch. Obwohl Wiki-Sites automatisch generiert werden können, muss es eine Vielzahl generativer KIs erfordert haben, die über einen langen Zeitraum unter Volllast liefen, und die Kosten müssen beträchtlich gewesen sein.
Durch die Übernahme dieser Kosten hat Cognition einer Vielzahl öffentlicher Projekte einen großen Nutzen gebracht, indem sie Erklärungen und Entwurfsdokumente kostenlos erhalten konnten.
Wenn statistische Daten zeigen, dass diese Wiki-Sites für jedes öffentliche Projekt nützlich sind und einen signifikanten Einfluss auf die Verbesserung von Qualität und Produktivität haben, werden Softwareentwicklungsunternehmen DeepWiki für ihre eigenen Projekte übernehmen.
Cognition muss in die Generierung von Wiki-Sites für eine Vielzahl öffentlicher Projekte investiert haben, in der Überzeugung, dass dies geschehen könnte. Dies zeigt Cognitions Vertrauen in DeepWiki. Und wenn DeepWiki übernommen wird, wird Devin automatisch folgen, was die Wahrscheinlichkeit einer weitreichenden Einführung von KI-Programmierern erheblich erhöht.
GitHub als Dokumenten-Teilungsplattform
GitHub hat sich zu einem populären und De-facto-Standard-Webdienst für das Teilen, gemeinsame Bearbeiten und Speichern von Programmen für die Entwicklung von Open-Source-Software entwickelt.
In den letzten Jahren wurden seine Verwaltungs- und Sicherheitsfunktionen für Unternehmen erweitert, was es zu einem gängigen Werkzeug in fortschrittlichen Unternehmen macht, die Software entwickeln.
Aus diesem Grund ruft GitHub stark das Bild eines Webdienstes zur Speicherung und Freigabe von Programmen hervor. Tatsächlich kann es jedoch verwendet werden, um verschiedene Dokumente und Materialien zu teilen, gemeinsam zu bearbeiten und zu speichern, die völlig unabhängig von Programmen sind.
Daher nutzen nicht wenige Menschen GitHub, um Dokumente zu verwalten, die sie breit gemeinsam bearbeiten möchten. Dies können Dokumente sein, die sich auf Software beziehen, oder völlig unabhängige Dokumente.
Darüber hinaus sind Blogs und Websites ebenfalls Dokumente, die eine Art von Programm enthalten oder durch Programme strukturiert und veröffentlicht werden.
Aus diesem Grund ist es nicht ungewöhnlich, dass Einzelpersonen und Unternehmen den Inhalt von Blogs und Websites zusammen mit den Programmen, die sie leicht lesbar machen, und den Programmen zur automatischen Site-Generierung als ein einziges Projekt auf GitHub speichern.
Es ist auch möglich, solche Blogs und Websites als öffentliche Projekte auf GitHub für die gemeinsame Bearbeitung ihrer Inhalte zu gestalten.
Darüber hinaus wird generative KI in jüngster Zeit nicht nur für die Softwareentwicklung eingesetzt, sondern auch häufig in Software integriert.
In diesem Fall sind Anweisungsätze, sogenannte Prompts, die detaillierte Anweisungen an die generative KI geben, in die Programme eingebettet.
Diese Prompts können auch als eine Art von Dokument betrachtet werden.
Intellektuelle Fabrik
Obwohl ich Softwareentwicklungsingenieur bin, schreibe ich auch Artikel für meinen Blog.
Obwohl ich möchte, dass viele Leute sie lesen, ist es ziemlich schwierig, die Anzahl der Leser zu erhöhen.
Man könnte natürlich in Betracht ziehen, Artikel zu erstellen, um Aufmerksamkeit zu erregen, oder einflussreiche Personen aktiv um Rat zu fragen, neben anderen Anstrengungen und Einfallsreichtum.
Angesichts meiner Persönlichkeit und des damit verbundenen Aufwands und Stresses bin ich jedoch zurückhaltend, mich in aggressive Werbung zu stürzen. Außerdem würde die Zeit, die ich für solche Aktivitäten aufwende, von meiner Kernarbeit ablenken, die das Programmieren, das Nachdenken über Ideen und deren Dokumentation umfasst.
Daher habe ich kürzlich beschlossen, eine Strategie namens Multimedia oder Omnichannel auszuprobieren, die darin besteht, die Reichweite meiner Blogbeiträge zu erweitern, indem ich sie in verschiedene Inhaltsformen entwickle.
Dies umfasst speziell das Übersetzen japanischer Artikel ins Englische und deren Veröffentlichung auf englischen Blog-Seiten sowie das Erstellen von Präsentationsvideos zur Erläuterung von Artikeln und deren Veröffentlichung auf YouTube.
Zusätzlich zur Veröffentlichung auf allgemeinen Blog-Diensten ziehe ich außerdem die Erstellung einer eigenen Blog-Site in Betracht, die meine früheren Blog-Beiträge auflistet und kategorisiert sowie verwandte Artikel verknüpft.
Wenn ich jedes Mal, wenn ein neuer Artikel geschrieben wird, Zeit für deren Erstellung aufwenden würde, wäre dies kontraproduktiv. Daher werden alle Aufgaben außer dem Schreiben des ursprünglichen japanischen Artikels mithilfe generativer KI automatisiert. Ich nenne dies eine intellektuelle Fabrik.
Ich muss Programme entwickeln, um diesen Mechanismus zu implementieren.
Derzeit habe ich bereits Programme erstellt, die die Übersetzung, die Erstellung von Präsentationsvideos und das Hochladen auf YouTube vollständig automatisieren können.
Ich bin gerade dabei, grundlegende Programme zum Kategorisieren und Verknüpfen bestehender Blog-Beiträge zu erstellen.
Sobald dies abgeschlossen ist und ich ein Programm zum Generieren meiner eigenen Blog-Site und zur automatischen Spiegelung auf einem Webserver erstelle, ist das ursprüngliche Konzept meiner intellektuellen Fabrik abgeschlossen.
Intellektuelle Fabrik im weiteren Sinne
Die Entwürfe meiner Blogbeiträge, die als Rohmaterial für diese intellektuelle Fabrik dienen, werden ebenfalls als GitHub-Projekt verwaltet. Vorerst sind sie privat und nicht öffentlich zugänglich, aber ich erwäge, sie zusammen mit den Programmen der intellektuellen Fabrik in Zukunft zu öffentlichen Projekten zu machen.
Die Kategorisierung von Blogbeiträgen, die Verknüpfung von Artikeln und die Erklärung von in Videos umgewandelten Blogbeiträgen, die ich derzeit entwickle, teilen das gleiche zugrunde liegende Konzept wie DeepWiki.
Mithilfe generativer KI werden verschiedene Inhalte aus originellen kreativen Werken als Rohmaterial produziert. Darüber hinaus kann sie Informationen und Wissen darin verbinden und so effektiv eine Wissensbasis schaffen.
Der einzige Unterschied ist, ob das Rohmaterial ein Programm oder ein Blogbeitrag ist. Und für DeepWiki und meine von generativer KI betriebene intellektuelle Fabrik ist dieser Unterschied fast bedeutungslos.
Mit anderen Worten, wenn der Begriff „intellektuelle Fabrik“ in einem allgemeinen, breiteren Sinne interpretiert wird, nicht beschränkt auf mein Programm, dann ist DeepWiki auch eine Art intellektuelle Fabrik.
Und was intellektuelle Fabriken produzieren, beschränkt sich nicht auf übersetzte Artikel in anderen Sprachen, Präsentationsvideos, selbst erstellte Blog-Sites oder Wiki-Sites.
Sie werden wahrscheinlich in der Lage sein, Inhalte in jedes erdenkliche Medium und Format umzuwandeln, wie z.B. Kurzvideos, Tweets, Comics, Animationen, Podcasts und E-Books.
Darüber hinaus kann der Inhalt dieser Medien und Formate auch diversifiziert werden, um dem Empfänger gerecht zu werden, z.B. breitere Mehrsprachigkeitsunterstützung, Versionen für Experten oder Anfänger und Versionen für Erwachsene oder Kinder.
Darüber hinaus ist sogar die On-Demand-Generierung von kundenspezifischen Inhalten realisierbar.
GitHub als intellektuelle Mine
Die Rohmaterialien für eine intellektuelle Fabrik können grundsätzlich überall gelagert werden.
Angesichts der Tatsache, dass GitHub zum De-facto-Standard für die gemeinsame Nutzung, Bearbeitung und Speicherung von Open-Source-Projektprogrammen geworden ist und dass viele Menschen, nicht nur ich selbst, GitHub als Speicherort für Dokumente nutzen, wird jedoch deutlich, dass GitHub das Potenzial hat, eine Hauptquelle für Rohmaterialien für intellektuelle Fabriken zu werden.
Mit anderen Worten, GitHub wird zu einer gemeinsamen intellektuellen Mine für die Menschheit, die intellektuelle Fabriken mit Rohmaterialien versorgt.
Der Begriff „von der Menschheit geteilt“ spiegelt hier die Vorstellung wider, dass Open-Source-Projekte ein gemeinsames Software-Asset für die Menschheit sind.
Die Open-Source-Philosophie, die GitHub unterstützt hat, wird auch gut zum Konzept offener Dokumente passen.
Darüber hinaus könnte eine Kultur der Verwaltung von Urheberrechtsinformationen und Lizenzen für jedes Dokument, ähnlich wie bei Programmen, entstehen. Inhalte, die automatisch aus Quelldokumenten generiert werden, können leicht mit derselben Lizenz versehen werden oder den in der Lizenz festgelegten Regeln entsprechen.
Aus der Perspektive der Entwicklung einer intellektuellen Fabrik ist die Zentralisierung der Rohmaterialdokumente auf GitHub ideal.
Dies bietet zwei Vorteile: eine verbesserte Entwicklungseffizienz durch einfaches Verbinden von GitHub mit der intellektuellen Fabrik und die Möglichkeit, die Funktionen und Leistungen der eigenen intellektuellen Fabrik mithilfe öffentlich zugänglicher Dokumente effektiv zu demonstrieren, ähnlich wie bei DeepWiki.
In Zukunft, wenn verschiedene intellektuelle Fabriken entwickelt werden und mit GitHub verbunden werden können, und wenn mehr Menschen und Unternehmen Dokumente auf GitHub verwalten und sie mit intellektuellen Fabriken verarbeiten, sollte sich die Position von GitHub als intellektuelle Mine fest etablieren.
Die gemeinsame öffentliche Wissensbasis der Menschheit
Mit GitHub im Zentrum als intellektuelle Mine und den verschiedenen Inhalten und Wissensbasen, die von intellektuellen Fabriken produziert werden, wird dieses gesamte Ökosystem eine öffentliche Wissensbasis schaffen, die von der Menschheit geteilt wird.
Darüber hinaus handelt es sich um eine dynamische und Echtzeit-Wissensbasis, die sich automatisch erweitert, wenn die Anzahl der auf GitHub veröffentlichten Dokumente zunimmt.
Obwohl diese riesige und komplexe Wissensbasis, die immenses Wissen enthält, für den Menschen nützlich sein wird, wird es schwierig sein, ihr Potenzial vollständig zu erschließen.
Allerdings wird die KI in der Lage sein, diese von der gesamten Menschheit geteilte öffentliche Wissensbasis vollständig zu nutzen.
Wissensadern der Öffentlichkeit
Wenn ein solches Ökosystem realisiert wird, werden verschiedene öffentliche Informationen natürlich auf GitHub zusammenlaufen.
Dies wird sich nicht auf Entwürfe persönlicher Blogs oder Unternehmenswebsites beschränken.
Auch akademische Erkenntnisse und Daten, wie z.B. vorab veröffentlichte Arbeiten und Forschungsideen, experimentelle Daten und Umfrageergebnisse, werden sich dort ansammeln.
Dies wird nicht nur diejenigen anziehen, die Wissen, Ideen und Daten zum Wohle der gesamten Menschheit nutzen möchten, sondern auch diejenigen, die ihre Entdeckungen schnell verbreiten und Anerkennung erlangen wollen.
Selbst für Wissenschaftler und Forscher würden viele es als wertvoll erachten, die Gültigkeit, Neuheit und den Einfluss ihrer Arbeit durch KI überprüfen zu lassen, durch verschiedene Inhalte ausgedrückt und auf eine Weise anerkannt zu werden, die viral geht, ohne den langwierigen Peer-Review-Prozess abwarten zu müssen.
Alternativ, wenn ihre Arbeit auf diese Weise die Aufmerksamkeit anderer Forscher oder Unternehmen erregt und zu kollaborativer Forschung oder Finanzierung führt, ergeben sich auch praktische Vorteile.
Darüber hinaus wird es wahrscheinlich einen Rückfluss des eigenen Wissens der KI geben.
Generative KI erwirbt durch Vortraining riesige Mengen an Wissen, aber sie erforscht während des Lernens nicht aktiv unerwartete Verbindungen oder ähnliche Strukturen zwischen diesem riesigen Wissen.
Das Gleiche gilt für neue Erkenntnisse, die aus der Verbindung verschiedener Wissensfragmente entstehen.
Wenn man andererseits solche Ähnlichkeiten und Verbindungen während Gesprächen mit einer vor-trainierten generativen KI erklärt, kann diese deren Wert recht genau einschätzen.
Daher ist es möglich, unerwartete Ähnlichkeiten und wertvolle Verbindungen zu entdecken, indem man verschiedene Wissensfragmente zufällig oder erschöpfend vergleicht und verbindet und sie in eine generative KI eingibt.
Da es eine enorme Anzahl von Kombinationen gibt, ist es natürlich unrealistisch, alle abzudecken. Durch eine entsprechende Rationalisierung und Automatisierung dieses Prozesses wird es jedoch möglich, nützliches Wissen aus vorhandenem Wissen automatisch zu entdecken.
Durch die Realisierung einer solchen automatischen Wissensentdeckung und die Speicherung des entdeckten Wissens auf GitHub scheint es möglich zu sein, diesen Kreislauf unbegrenzt zu wiederholen.
Auf diese Weise existieren in dieser intellektuellen Mine zahlreiche unentdeckte Wissensadern, und es wird möglich sein, sie zu erschließen.
Fazit
Sobald sich eine de facto standardisierte, gemeinsame menschliche Wissensbasis wie GitHub etabliert hat, wird sie voraussichtlich für das Vortraining generativer KI und für die Wissensabfrage wie RAG genutzt werden.
In diesem Szenario wird GitHub selbst wie ein riesiges Gehirn funktionieren. Und generative KI wird dieses Gehirn teilen, Wissen verbreiten und erweitern, während sie es teilt.
Das dort zusätzlich erfasste Wissen wird nicht nur Aufzeichnungen von Fakten, neue Daten oder Klassifizierungen umfassen. Es kann auch katalytisches Wissen beinhalten, das die Entdeckung anderer Kenntnisse oder neuer Kombinationen fördert.
Ich nenne solches Wissen mit katalytischer Wirkung „intellektuelle Kristalle“ oder „Wissenskristalle“. Dazu gehören zum Beispiel neue Denkrahmen.
Wenn ein Rahmen neu entdeckt oder entwickelt und ein intellektueller Kristall hinzugefügt wird, ermöglicht dessen katalytische Wirkung andere Kombinationen und Strukturierungen von Wissen als zuvor, was zum Wachstum neuen Wissens führt.
Darunter können sich weitere Wissenskristalle befinden. Dies wiederum wird das Wissen weiter vermehren.
Solches Wissen ist keine wissenschaftliche Entdeckung, sondern etwas, das der mathematischen Untersuchung, der technischen Entwicklung oder der Erfindung näherkommt. Es ist daher Wissen, das rein durch Denken wächst, anstatt durch neue Beobachtungsfakten wie wissenschaftliches Wissen.
Und GitHub als intellektuelle Mine wird zusammen mit unzähligen generativen KIs, die es nutzen, das Wachstum dieses Wissens beschleunigen.
Wissen, das in einem Tempo entdeckt wird, das die menschliche Entdeckungsrate bei weitem übersteigt, wird uns von Wissensfabriken in einer leicht verständlichen Form zur Verfügung gestellt.
Auf diese Weise wird Wissen, das rein durch Denken erforscht werden kann, rapide erschlossen.