Vai al Contenuto
Questo articolo è stato tradotto dal giapponese utilizzando l'AI
Leggi in giapponese
Questo articolo è di Pubblico Dominio (CC0). Sentiti libero di usarlo liberamente. CC0 1.0 Universal

GitHub come Miniera Intellettuale

Conoscete GitHub, il servizio web utilizzato come piattaforma di sviluppo collaborativo dagli sviluppatori di software open-source?

Negli ultimi anni, il suo utilizzo come spazio di lavoro collaborativo si è esteso oltre il software open-source, includendo lo sviluppo di software aziendale e persino applicazioni non strettamente legate al software.

Anch'io utilizzo GitHub per gestire i miei programmi e le bozze degli articoli che scrivo per questo blog.

In questo articolo, esplorerò la possibilità che l'uso di GitHub si estenda sempre più oltre il software, diventando uno spazio condiviso per la conoscenza aperta.

Generazione di Siti Wiki tramite DeepWiki

Molti strumenti di sviluppo software che utilizzano l'IA generativa sono progettati per assistere i programmatori umani. In questi strumenti, gli esseri umani scrivono il programma e l'IA fornisce supporto.

Tuttavia, sta emergendo un nuovo tipo di strumento di sviluppo software in cui gli esseri umani si limitano a dare istruzioni e l'IA generativa si assume il compito di creare il programma.

Uno di questi strumenti pionieristici che ha attirato l'attenzione è Devin. Alcuni hanno affermato che introdurre Devin è come aggiungere un altro programmatore al team di sviluppo. Sebbene si dica ancora che gli ingegneri umani debbano fornire supporto dettagliato per un uso efficace, tali dati saranno indubbiamente raccolti e utilizzati per ulteriori miglioramenti.

L'era in cui un tipico team di sviluppo software è composto da un umano e da programmatori IA come Devin come membri del team si sta avvicinando rapidamente.

Cognition, lo sviluppatore di Devin, ha anche rilasciato un servizio chiamato DeepWiki.

DeepWiki è un servizio che genera automaticamente un sito wiki per ogni progetto di sviluppo software su GitHub. Ciò significa che un'IA come Devin legge e analizza tutti i programmi e i documenti correlati di un progetto, e poi crea tutta la documentazione e le specifiche di progettazione.

Cognition ha riferito di aver generato siti wiki per oltre 50.000 dei principali progetti di sviluppo software pubblici su GitHub, liberamente accessibili a chiunque.

Trattandosi di progetti pubblici, non c'è alcun problema nel farlo. Sebbene i siti wiki possano essere generati automaticamente, ciò deve aver comportato l'impiego di numerose IA generative a pieno regime per un periodo prolungato, con costi considerevoli.

Grazie a Cognition che si è fatta carico di questi costi, un vasto numero di progetti pubblici ha beneficiato dell'acquisizione gratuita di documentazione e specifiche di progettazione.

Se i dati statistici dimostreranno che questi siti wiki sono utili per i progetti pubblici e hanno un impatto significativo sul miglioramento della qualità e della produttività, le aziende di sviluppo software probabilmente adotteranno DeepWiki per i propri progetti.

Cognition deve aver investito nella generazione di siti wiki per numerosi progetti pubblici, credendo che ciò sarebbe accaduto. Questo dimostra la fiducia di Cognition in DeepWiki. E se DeepWiki verrà adottato, Devin seguirà automaticamente, accelerando significativamente la diffusione dei programmatori IA.

GitHub come Piattaforma di Condivisione Documenti

GitHub è diventato un servizio web popolare e de facto standard per la condivisione, l'editing collaborativo e l'archiviazione di programmi per lo sviluppo di software open-source.

Negli ultimi anni, le sue robuste funzionalità di gestione e sicurezza per le aziende hanno portato al suo uso comune da parte delle aziende di sviluppo software più avanzate.

Di conseguenza, GitHub spesso porta l'immagine di un servizio web principalmente per l'archiviazione e la condivisione di programmi. Tuttavia, in realtà, consente la condivisione, l'editing collaborativo e l'archiviazione di vari documenti e materiali, completamente indipendenti dai programmi.

Per questo motivo, molte persone utilizzano GitHub per gestire documenti che desiderano modificare in modo collaborativo e su vasta scala. Questi documenti possono essere correlati al software o del tutto estranei.

Inoltre, blog e siti web sono anch'essi documenti che contengono un tipo di programma o sono strutturati da programmi per essere pubblicati.

Pertanto, non è raro che individui e aziende archivino contenuti di blog e siti web, insieme a programmi per la presentazione e la generazione automatica del sito, come un unico progetto GitHub.

È anche possibile rendere tali contenuti di blog e siti web progetti GitHub pubblici per consentire l'editing collaborativo.

Recentemente, oltre a utilizzare l'IA generativa per lo sviluppo di software, è sempre più comune incorporare funzionalità di IA generativa direttamente nel software.

In questi casi, istruzioni dettagliate per l'IA generativa, chiamate prompt, sono incorporate nel programma.

Anche questi prompt possono essere considerati un tipo di documento.

Fabbrica Intellettuale

Sebbene io sia un ingegnere del software, scrivo anche articoli per il mio blog.

Pur desiderando che molte persone li leggano, aumentare il numero dei lettori è piuttosto impegnativo.

Certamente, potrei considerare di creare articoli per attirare l'attenzione o di contattare direttamente persone influenti per consigli, mettendo impegno e ingegno.

Tuttavia, considerando la mia personalità e lo sforzo e lo stress che ne deriverebbero, non sono entusiasta di una promozione aggressiva. Inoltre, dedicare tempo a tali attività distoglierebbe tempo dagli aspetti centrali del mio lavoro: creare programmi, pensare e scrivere documenti.

Pertanto, di recente ho deciso di provare una strategia "multimediale" o "omnichannel" per ampliare la portata dei miei articoli del blog, diffondendoli in vari formati di contenuto.

In particolare, questo comporta la traduzione di articoli giapponesi in inglese e la loro pubblicazione su un blog in inglese, e la creazione di video di presentazione per spiegare gli articoli e la loro pubblicazione su YouTube.

Inoltre, oltre a pubblicare su servizi di blog generici, sto anche considerando di creare il mio sito blog con un indice dei miei articoli passati per categoria e collegando gli articoli correlati.

Se dovessi creare tutto questo manualmente ogni volta che viene aggiunto un nuovo articolo, sarebbe controproducente. Pertanto, tutte le attività, eccetto la stesura dell'articolo iniziale in giapponese, sono automatizzate utilizzando l'IA generativa. Chiamo questo una Fabbrica Intellettuale.

Ho bisogno di sviluppare programmi per realizzare questo sistema.

Attualmente, ho già creato programmi in grado di automatizzare completamente la traduzione, la generazione di video di presentazione e i caricamenti su YouTube.

Ora, sono in fase di creazione di programmi base per la categorizzazione e il collegamento degli articoli di blog esistenti.

Una volta completato ciò, e creato un programma per generare il mio sito blog personalizzato e distribuirlo automaticamente su un server web, il concetto iniziale della mia Fabbrica Intellettuale sarà pienamente realizzato.

Fabbrica Intellettuale in Senso Ampio

Le bozze dei miei articoli del blog, che fungono da materie prime per questa Fabbrica Intellettuale, sono anch'esse gestite come progetti GitHub. Attualmente, non sono divulgate pubblicamente come progetti privati, ma sto considerando di renderle progetti pubblici in futuro, insieme ai programmi della Fabbrica Intellettuale.

Inoltre, la categorizzazione degli articoli del blog, il collegamento degli articoli e le spiegazioni video degli articoli del blog che sto attualmente sviluppando condividono lo stesso concetto sottostante di DeepWiki.

Utilizzando l'IA generativa, le opere creative originali vengono utilizzate come materie prime per produrre vari contenuti. Inoltre, informazioni e conoscenze all'interno di questi contenuti possono essere connesse per creare quella che può essere definita una base di conoscenza.

L'unica differenza risiede nel fatto che la materia prima sia un programma o un articolo del blog. E per DeepWiki e la mia Fabbrica Intellettuale, alimentate dall'IA generativa, questa differenza è in gran parte insignificante.

In altre parole, se il termine "Fabbrica Intellettuale" viene interpretato in un senso generale e più ampio, non limitato ai miei programmi specifici, DeepWiki è anch'essa un tipo di Fabbrica Intellettuale.

Inoltre, ciò che una Fabbrica Intellettuale produce non si limita ad articoli tradotti in altre lingue, video di presentazione o siti di blog e wiki fatti in casa.

Sarà probabilmente in grado di convertire contenuti in ogni possibile mezzo e formato immaginabile, come brevi video, tweet, manga e anime, podcast ed e-book.

Inoltre, il contenuto all'interno di questi media e formati può anche essere diversificato per adattarsi a vari pubblici, includendo una più ampia multilinguizzazione, versioni per esperti o principianti e versioni per adulti o bambini.

In definitiva, sarà possibile anche la generazione su richiesta di contenuti personalizzati.

GitHub come Miniera Intellettuale

Le materie prime per una Fabbrica Intellettuale possono, in linea di principio, essere conservate ovunque.

Tuttavia, considerando che GitHub è diventato lo standard de facto per la condivisione, l'editing collaborativo e l'archiviazione di programmi per progetti open-source, e che diverse persone – non solo io – utilizzano GitHub come luogo di archiviazione di documenti, diventa evidente che GitHub ha il potenziale per diventare la fonte primaria di materie prime per le Fabbriche Intellettuali.

In altre parole, GitHub diventerà una Miniera Intellettuale condivisa dall'umanità, fornendo materie prime alle Fabbriche Intellettuali.

Il termine "condivisa dall'umanità" qui riecheggia l'idea che i progetti open-source siano un bene software condiviso dall'umanità.

La filosofia open-source che ha sostenuto GitHub si adatterà bene anche al concetto di documenti aperti.

Inoltre, potrebbe emergere una cultura di gestione delle informazioni sul copyright e delle licenze per ogni documento, simile ai programmi. I contenuti generati automaticamente dai documenti sorgente possono essere facilmente assegnati con la stessa licenza o rispettare le regole stabilite dalla licenza.

Dal punto di vista della creazione di una Fabbrica Intellettuale, il consolidamento dei documenti delle materie prime su GitHub è ideale.

Questo offre due vantaggi: il beneficio dell'efficienza nello sviluppo, poiché richiede semplicemente di collegare GitHub alla Fabbrica Intellettuale, e la capacità di dimostrare efficacemente le funzioni e le prestazioni della propria Fabbrica Intellettuale ai documenti pubblicamente disponibili, proprio come DeepWiki.

In futuro, man mano che verranno sviluppate diverse Fabbriche Intellettuali e connesse a GitHub, e più individui e aziende gestiranno documenti su GitHub per l'elaborazione da parte delle Fabbriche Intellettuali, la posizione di GitHub come Miniera Intellettuale dovrebbe affermarsi saldamente.

Base di Conoscenza Pubblica Condivisa dall'Umanità

Con GitHub al centro, a fungere da Miniera Intellettuale, e le Fabbriche Intellettuali che producono una vasta gamma di contenuti e basi di conoscenza, questo intero ecosistema creerà una base di conoscenza pubblica condivisa dall'umanità.

Inoltre, questa sarà una base di conoscenza dinamica e in tempo reale che si espanderà automaticamente all'aumentare del numero di documenti pubblicati su GitHub.

Sebbene questa complessa ed enorme base di conoscenza, contenente una vasta quantità di sapere, sarà benefica per gli esseri umani, estrarre appieno il suo valore potenziale sarà probabilmente difficile per noi.

Tuttavia, l'IA sarà in grado di sfruttare appieno questa base di conoscenza pubblicamente condivisa dall'umanità.

Giacimenti di Conoscenza Pubblica

Quando un tale ecosistema sarà realizzato, diverse informazioni pubbliche convergeranno naturalmente su GitHub.

Questo non si limiterà alle bozze di blog personali o siti web aziendali.

Anche intuizioni e dati accademici, come pre-print, idee di ricerca, dati sperimentali e risultati di sondaggi, si raccoglieranno lì.

Ciò attrarrà non solo coloro che desiderano contribuire con conoscenze, idee e dati a beneficio di tutta l'umanità, ma anche coloro che cercano di diffondere rapidamente scoperte per ottenere riconoscimento.

Anche accademici e ricercatori potrebbero trovare valore nel vedere il proprio lavoro convalidato dall'IA per validità, novità e impatto, espresso attraverso vari formati di contenuto, e riconosciuto diventando "virale", piuttosto che attendere il lungo e dispendioso processo di revisione paritaria per gli articoli.

In alternativa, se il loro lavoro attira l'attenzione di altri ricercatori o aziende in questo modo, portando a ricerche collaborative o finanziamenti, ci sono benefici tangibili.

Inoltre, ci sarà una ricircolazione della conoscenza propria dell'IA.

Mentre l'IA generativa acquisisce vaste quantità di conoscenza attraverso il pre-addestramento, non impara attivamente esplorando connessioni inaspettate o strutture simili tra quell'enorme corpo di conoscenza.

Lo stesso vale per le nuove intuizioni che emergono collegando diversi frammenti di conoscenza.

D'altra parte, discutendo tali somiglianze e connessioni con un'IA generativa pre-addestrata, essa può valutarne il valore in modo piuttosto accurato.

Pertanto, inserendo varie parti di conoscenza nell'IA generativa, confrontandole in modo casuale o esaustivo, è possibile scoprire somiglianze inaspettate e connessioni preziose.

Naturalmente, dato l'immenso numero di combinazioni, coprire tutto è impraticabile. Tuttavia, snellendo e automatizzando opportunamente questo processo, diventa possibile scoprire automaticamente conoscenze utili da quelle esistenti.

Realizzando una tale scoperta automatica della conoscenza e archiviando la conoscenza scoperta su GitHub, questo ciclo potrebbe apparentemente continuare indefinitamente.

Così, all'interno di questa Miniera Intellettuale, esistono numerosi giacimenti ancora da scoprire, e sarà possibile estrarli.

Conclusione

Man mano che una base di conoscenza condivisa dall'umanità, come GitHub, assume la forma di uno standard de facto, essa sarà probabilmente utilizzata per il pre-addestramento dell'IA generativa e per meccanismi di recupero della conoscenza come RAG.

In un tale scenario, GitHub stesso funzionerà come un enorme cervello. Le IA generative condivideranno quindi questo cervello, distribuendo ed espandendo la conoscenza.

La conoscenza aggiuntivamente registrata lì non sarà meramente registri di fatti, nuovi dati o classificazioni. Includerà anche conoscenza che agisce da catalizzatore, promuovendo la scoperta di altra conoscenza e nuove combinazioni.

Mi riferisco a tale conoscenza con effetto catalitico come un Cristallo Intellettuale, o un cristallo di conoscenza. Questo include, ad esempio, nuovi framework di pensiero.

Quando i framework vengono scoperti o sviluppati di recente, e vengono aggiunti Cristalli Intellettuali, il loro effetto catalitico consente nuove combinazioni e strutturazioni della conoscenza che prima erano impossibili, portando a un aumento di nuova conoscenza.

A volte, questi possono contenere un altro Cristallo Intellettuale, che poi amplifica ulteriormente la conoscenza.

Questo tipo di conoscenza è più vicino all'indagine matematica, allo sviluppo ingegneristico o all'invenzione, piuttosto che alla scoperta scientifica. Pertanto, è conoscenza che cresce puramente attraverso il pensiero, piuttosto che attraverso nuovi fatti osservativi come la conoscenza scientifica.

E GitHub, come Miniera Intellettuale, insieme a innumerevoli IA generative che lo utilizzano, accelererà la crescita di tale conoscenza.

Questa conoscenza rapidamente scoperta, superando di gran lunga il ritmo della scoperta su scala umana, sarà fornita in un formato facilmente comprensibile dalle Fabbriche Intellettuali.

In questo modo, la conoscenza che può essere esplorata puramente attraverso il pensiero sarà rapidamente portata alla luce.