Vai al Contenuto
Questo articolo è stato tradotto dal giapponese utilizzando l'AI
Leggi in giapponese
Questo articolo è di Pubblico Dominio (CC0). Sentiti libero di usarlo liberamente. CC0 1.0 Universal

GitHub come Miniera Intellettuale

Conosci GitHub, il servizio web utilizzato come piattaforma di sviluppo collaborativo tra gli sviluppatori di software open-source?

Negli ultimi anni, il suo utilizzo come piattaforma per il lavoro collaborativo si è esteso, non solo per il software open-source, ma anche per lo sviluppo di software aziendale e persino per scopi non legati al software.

Anch'io uso GitHub per gestire i miei programmi e le bozze degli articoli che scrivo per questo blog.

In questo articolo, esplorerò la possibilità che l'uso di GitHub si estenda sempre più oltre lo sviluppo di software in futuro, diventando un luogo per la condivisione aperta della conoscenza.

Generazione di siti Wiki tramite DeepWiki

Molti strumenti di sviluppo software che utilizzano l'IA generativa sono progettati per assistere le attività di programmazione umana. Gli esseri umani scrivono i programmi e l'IA fornisce supporto.

D'altra parte, sta emergendo un nuovo tipo di strumento di sviluppo software in cui gli esseri umani si limitano a dare istruzioni, e l'IA generativa si assume il compito di creare programmi.

Devin è uno di questi strumenti che è diventato un pioniere e ha attirato l'attenzione. Alcuni hanno persino affermato che introdurre Devin fosse come aggiungere un altro programmatore al team di sviluppo. Sebbene si dica ancora che gli ingegneri umani debbano fornire un supporto dettagliato per un uso efficace, tali dati verranno sicuramente raccolti e utilizzati per il miglioramento.

L'era in cui i team di sviluppo software saranno composti da un essere umano e da programmatori IA come Devin, come membri del team, è ormai prossima.

Cognition, lo sviluppatore di Devin, ha anche rilasciato un servizio chiamato DeepWiki.

DeepWiki è un servizio che genera automaticamente un sito wiki per ogni progetto di sviluppo software su GitHub. Ciò significa che un'IA, simile a Devin, legge e analizza tutti i programmi e i documenti correlati di quel progetto e crea tutti i manuali e i documenti di progettazione.

Cognition avrebbe creato siti wiki per oltre 50.000 importanti progetti di sviluppo software pubblici su GitHub, liberamente accessibili a chiunque, utilizzando DeepWiki.

Dato che si tratta di progetti pubblici, non c'è assolutamente alcun problema nel farlo. Sebbene i siti wiki possano essere generati automaticamente, deve aver richiesto a numerose IA generative di funzionare a pieno regime per un lungo periodo, e il costo deve essere stato considerevole.

Sostenendo questi costi, Cognition ha fornito un grande beneficio a un vasto numero di progetti pubblici, consentendo loro di ottenere spiegazioni e documenti di progettazione gratuitamente.

Se i dati statistici mostreranno che questi siti wiki sono utili per ogni progetto pubblico e hanno un effetto significativo sul miglioramento della qualità e della produttività, allora le aziende di sviluppo software adotteranno DeepWiki per i propri progetti.

Cognition deve aver investito nella generazione di siti wiki per un vasto numero di progetti pubblici, credendo che ciò potesse accadere. Questo dimostra la fiducia di Cognition in DeepWiki. E quando DeepWiki sarà adottato, Devin seguirà automaticamente, aumentando significativamente la probabilità di un'adozione diffusa dei programmatori IA.

GitHub come piattaforma di condivisione documenti

GitHub è diventato un servizio web popolare e uno standard di fatto per la condivisione, la co-editing e l'archiviazione di programmi per lo sviluppo di software open-source.

Negli ultimi anni, le sue funzionalità di gestione e sicurezza per le aziende sono state migliorate, rendendolo uno strumento comune nelle aziende all'avanguardia che sviluppano software.

Per questa ragione, GitHub evoca fortemente l'immagine di un servizio web per l'archiviazione e la condivisione di programmi. Tuttavia, in realtà, può essere utilizzato per condividere, co-editare e archiviare vari documenti e materiali, completamente estranei ai programmi.

Pertanto, non poche persone usano GitHub per gestire documenti che desiderano co-editare ampiamente. Questi possono essere documenti correlati al software o interamente non correlati.

Inoltre, blog e siti web sono anch'essi documenti che contengono un tipo di programma o che sono strutturati e pubblicati da programmi.

Per questo motivo, non è raro che individui e aziende archivino il contenuto di blog e siti web, insieme ai programmi che li rendono facili da visualizzare e ai programmi per la generazione automatica del sito, come un unico progetto su GitHub.

È anche possibile rendere tali blog e siti web progetti pubblici su GitHub per la co-editing del loro contenuto.

Inoltre, recentemente, l'IA generativa non è solo utilizzata per lo sviluppo di software, ma è anche spesso integrata nel software.

In questo caso, frasi di istruzione chiamate prompt, che danno istruzioni dettagliate all'IA generativa, sono incorporate all'interno dei programmi.

Questi prompt possono anche essere considerati un tipo di documento.

Fabbrica Intellettuale

Sebbene io sia un ingegnere dello sviluppo software, scrivo anche articoli per il mio blog.

Pur desiderando che molte persone li leggano, è piuttosto difficile aumentare il numero di lettori.

Naturalmente, si potrebbe pensare di creare articoli per attirare l'attenzione o di contattare attivamente persone influenti per consigli, tra gli altri sforzi e ingegni.

Tuttavia, considerando la mia personalità e lo sforzo e lo stress coinvolti, sono riluttante a impegnarmi in una promozione aggressiva. Inoltre, dedicare tempo a tali attività distrarrebbe dal nucleo del mio lavoro, che include la programmazione, la contemplazione di idee e la loro documentazione.

Pertanto, di recente ho deciso di provare una strategia nota come multimedialità o omnicanale, che implica l'espansione della portata dei miei post del blog sviluppandoli in varie forme di contenuto.

Specificamente, questo include la traduzione di articoli giapponesi in inglese e la loro pubblicazione su siti di blog inglesi, e la creazione di video di presentazione per spiegare gli articoli e la loro pubblicazione su YouTube.

Inoltre, oltre a pubblicare su servizi di blog generici, sto anche considerando di creare il mio sito blog che elenca e categorizza i miei precedenti post del blog e collega articoli correlati.

Se dovessi dedicare tempo a creare questi ogni volta che viene scritto un nuovo articolo, sarebbe controproducente. Pertanto, tutte le attività diverse dalla scrittura dell'articolo giapponese iniziale sono automatizzate utilizzando l'IA generativa. Chiamo questo una fabbrica intellettuale.

Ho bisogno di sviluppare programmi per implementare questo meccanismo.

Attualmente, ho già creato programmi in grado di automatizzare completamente la traduzione, la generazione di video di presentazione e il caricamento su YouTube.

Sono ora in fase di creazione di programmi di base per la categorizzazione e il collegamento dei post del blog esistenti.

Una volta completato ciò, e creato un programma per generare il mio sito blog e rifletterlo automaticamente su un server web, il concetto iniziale della mia fabbrica intellettuale sarà completo.

Fabbrica Intellettuale in senso ampio

Le bozze dei miei articoli del blog, che servono come materia prima per questa fabbrica intellettuale, sono anch'esse gestite come un progetto GitHub. Per ora, sono private e non pubblicamente disponibili, ma sto considerando di renderle progetti pubblici in futuro, insieme ai programmi della fabbrica intellettuale.

La categorizzazione dei post del blog, il collegamento degli articoli e la spiegazione dei post del blog trasformati in video, che sto attualmente sviluppando, condividono lo stesso concetto di base di DeepWiki.

Utilizzando l'IA generativa, vari contenuti vengono prodotti da opere creative originali come materie prime. Inoltre, essa può collegare informazioni e conoscenze al loro interno, creando efficacemente una base di conoscenza.

L'unica differenza è se la materia prima sia un programma o un post del blog. E per DeepWiki e la mia fabbrica intellettuale alimentata dall'IA generativa, questa differenza è quasi insignificante.

In altre parole, se il termine "fabbrica intellettuale" viene interpretato in un senso generale e più ampio, non limitato al mio programma, allora DeepWiki è anch'esso un tipo di fabbrica intellettuale.

E ciò che le fabbriche intellettuali producono non si limita ad articoli tradotti in altre lingue, video di presentazione, siti di blog auto-costruiti o siti wiki.

Saranno probabilmente in grado di convertire il contenuto in ogni mezzo e formato concepibile, come brevi video, tweet, fumetti, animazioni, podcast ed e-book.

Inoltre, il contenuto all'interno di questi media e formati può anche essere diversificato per adattarsi al destinatario, come un più ampio supporto multilingue, versioni per esperti o principianti, e versioni per adulti o bambini.

Inoltre, è persino realizzabile la generazione su richiesta di contenuti personalizzati.

GitHub come miniera intellettuale

Le materie prime per una fabbrica intellettuale possono, in linea di principio, essere collocate ovunque.

Tuttavia, considerando che GitHub è diventato lo standard de facto per la condivisione, la co-editing e l'archiviazione di programmi di progetti open-source, e che molte persone, non solo io, utilizzano GitHub come luogo di archiviazione di documenti, diventa evidente che GitHub ha il potenziale per diventare una fonte primaria di materie prime per le fabbriche intellettuali.

In altre parole, GitHub diventerà una miniera intellettuale condivisa per l'umanità, fornendo materie prime alle fabbriche intellettuali.

Il termine "condiviso dall'umanità" qui riecheggia l'idea che i progetti open-source siano un bene software condiviso per l'umanità.

La filosofia open-source che ha sostenuto GitHub si adatterà bene anche al concetto di documenti aperti.

Inoltre, potrebbe emergere una cultura di gestione delle informazioni sul copyright e delle licenze per ogni documento, simile ai programmi. Il contenuto generato automaticamente dai documenti sorgente può essere facilmente assegnato alla stessa licenza, o rispettare le regole stabilite dalla licenza.

Dal punto di vista dello sviluppo di una fabbrica intellettuale, avere i documenti di materia prima centralizzati su GitHub è l'ideale.

Ciò offre due vantaggi: una maggiore efficienza di sviluppo, semplicemente collegando GitHub alla fabbrica intellettuale, e la capacità di dimostrare efficacemente le funzioni e le prestazioni della propria fabbrica intellettuale utilizzando documenti pubblicamente disponibili, in modo simile a DeepWiki.

In futuro, man mano che varie fabbriche intellettuali verranno sviluppate e diventeranno collegabili a GitHub, e man mano che più persone e aziende gestiranno documenti su GitHub e li elaboreranno con le fabbriche intellettuali, la posizione di GitHub come miniera intellettuale dovrebbe diventare saldamente stabilita.

Base di Conoscenza Pubblica Condivisa dall'Umanità

Con GitHub al centro come miniera intellettuale, e vari contenuti e basi di conoscenza prodotti dalle fabbriche intellettuali, l'intero ecosistema creerà una base di conoscenza pubblica condivisa dall'umanità.

Inoltre, si tratta di una base di conoscenza dinamica e in tempo reale che si espanderà automaticamente all'aumentare del numero di documenti pubblicati su GitHub.

Sebbene questa vasta e complessa base di conoscenza, contenente un'immensa quantità di sapere, sarà utile agli esseri umani, sarà difficile estrarne appieno il suo potenziale valore.

Tuttavia, l'IA sarà in grado di utilizzare appieno questa base di conoscenza pubblica, condivisa da tutta l'umanità.

Vene di Conoscenza Pubblica

Se un tale ecosistema si realizzerà, varie informazioni pubbliche convergeranno naturalmente su GitHub.

Questo non si limiterà alle bozze di blog personali o ai siti web aziendali.

Si accumuleranno anche intuizioni e dati accademici, come articoli pre-pubblicazione e idee di ricerca, dati sperimentali e risultati di sondaggi.

Ciò attirerà non solo coloro che desiderano utilizzare conoscenze, idee e dati a beneficio di tutta l'umanità, ma anche coloro che desiderano diffondere rapidamente le proprie scoperte e ottenere riconoscimento.

Anche per studiosi e ricercatori, molti troverebbero valore nel far verificare la validità, la novità e l'impatto del proprio lavoro dall'IA, espresso attraverso vari contenuti, e riconosciuto in un modo che diventi virale, senza dover attendere il lungo processo di revisione paritaria.

In alternativa, se il loro lavoro attira l'attenzione di altri ricercatori o aziende in questo modo, portando a ricerche collaborative o finanziamenti, ci sono anche benefici pratici.

Inoltre, ci sarà probabilmente un flusso di ritorno della conoscenza propria dell'IA.

L'IA generativa acquisisce vaste quantità di conoscenza attraverso il pre-addestramento, ma non esplora attivamente connessioni inaspettate o strutture simili tra quella vasta conoscenza durante l'apprendimento.

Lo stesso vale per le nuove intuizioni che emergono collegando diversi pezzi di conoscenza.

D'altra parte, quando si spiegano tali somiglianze e connessioni durante le conversazioni con un'IA generativa pre-addestrata, essa può valutarne il valore in modo piuttosto accurato.

Pertanto, confrontando e collegando in modo casuale o esaustivo vari pezzi di conoscenza e inserendoli in un'IA generativa, è possibile scoprire somiglianze inaspettate e connessioni preziose.

Naturalmente, poiché ci sono un numero enorme di combinazioni, è irrealistico coprirle tutte. Tuttavia, snellendo e automatizzando in modo appropriato questo processo, diventa possibile scoprire automaticamente conoscenze utili dalla conoscenza esistente.

Realizzando una tale scoperta automatica di conoscenza e archiviando la conoscenza scoperta su GitHub, sembra possibile ripetere questo ciclo indefinitamente.

In questo modo, numerose vene di conoscenza non scoperte esistono all'interno di questa miniera intellettuale, e diventerà possibile scavarle.

Conclusione

Una volta stabilita una base di conoscenza umana condivisa, uno standard de facto come GitHub, essa sarà probabilmente utilizzata per il pre-addestramento dell'IA generativa e per il recupero della conoscenza come RAG (Retrieval Augmented Generation).

In questo scenario, GitHub stesso funzionerà come un gigantesco cervello. E l'IA generativa condividerà questo cervello, distribuendo ed espandendo la conoscenza pur condividendola.

La conoscenza aggiuntivamente registrata lì non includerà solo registrazioni di fatti, nuovi dati o classificazioni. Potrebbe anche includere conoscenza catalitica che promuove la scoperta di altra conoscenza o nuove combinazioni.

Chiamo questa conoscenza con un effetto catalitico "cristalli intellettuali" o "cristalli di conoscenza". Questo include, ad esempio, nuovi framework per il pensiero.

Quando un framework viene appena scoperto o sviluppato e viene aggiunto un cristallo intellettuale, il suo effetto catalitico consente combinazioni e strutturazioni della conoscenza diverse da prima, portando alla crescita di nuova conoscenza.

Tra questi, potrebbero esserci altri cristalli di conoscenza. Questo, a sua volta, aumenterà ulteriormente la conoscenza.

Tale conoscenza non è una scoperta scientifica ma qualcosa di più vicino all'indagine matematica, allo sviluppo ingegneristico o all'invenzione. Pertanto, è conoscenza che cresce puramente attraverso il pensiero, piuttosto che attraverso nuovi fatti osservazionali come la conoscenza scientifica.

E GitHub come miniera intellettuale, insieme a innumerevoli IA generative che la utilizzano, accelererà la crescita di tale conoscenza.

La conoscenza scoperta una dopo l'altra a un ritmo che supera di gran lunga la scala umana di scoperta sarà fornita in una forma che ci è facile comprendere dalle fabbriche di conoscenza.

In questo modo, la conoscenza che può essere esplorata puramente attraverso il pensiero sarà rapidamente scavata.