Conhece o GitHub, o serviço web que tem sido utilizado como plataforma de desenvolvimento colaborativo por programadores de software de código aberto?
Nos últimos anos, a sua utilização como espaço de trabalho colaborativo expandiu-se para além do software de código aberto, abrangendo o desenvolvimento de software empresarial e até aplicações não relacionadas com software.
Também utilizo o GitHub para gerir os meus próprios programas e os rascunhos dos artigos que escrevo para este blog.
Neste artigo, vou explorar a possibilidade de que o uso do GitHub se estenda cada vez mais para além do software, tornando-se um espaço partilhado para o conhecimento aberto.
Geração de Sites Wiki pelo DeepWiki
Muitas ferramentas de desenvolvimento de software que utilizam IA generativa são concebidas para auxiliar programadores humanos. Nessas ferramentas, os humanos escrevem o programa e a IA fornece suporte.
No entanto, está a surgir um novo tipo de ferramenta de desenvolvimento de software em que os humanos apenas dão instruções, e a IA generativa assume a tarefa de criar o programa.
Uma dessas ferramentas pioneiras que atraiu atenção é o Devin. Alguns disseram que introduzir o Devin é como adicionar mais um programador à equipa de desenvolvimento. Embora ainda se diga que os engenheiros humanos precisam de fornecer suporte detalhado para uma utilização eficaz, esses dados serão, sem dúvida, recolhidos e utilizados para melhorias futuras.
A era em que uma equipa de desenvolvimento de software típica consiste num humano e em programadores de IA como o Devin, como membros da equipa, está a aproximar-se rapidamente.
A Cognition, a criadora do Devin, também lançou um serviço chamado DeepWiki.
O DeepWiki é um serviço que gera automaticamente um site wiki para cada projeto de desenvolvimento de software no GitHub. Isso significa que uma IA como o Devin lê e analisa todos os programas e documentos relacionados de um projeto, e depois cria toda a documentação e especificações de design.
A Cognition terá gerado sites wiki para mais de 50.000 dos principais projetos de desenvolvimento de software públicos no GitHub, que são livremente acessíveis a qualquer pessoa.
Uma vez que são projetos públicos, não há problema em fazê-lo. Embora os sites wiki possam ser gerados automaticamente, isso deve ter envolvido inúmeras IAs generativas a funcionar em plena capacidade durante um longo período, incorrendo em custos consideráveis.
Ao a Cognition suportar esses custos, um vasto número de projetos públicos beneficiou ao adquirir documentação e especificações de design gratuitamente.
Se os dados estatísticos mostrarem que esses sites wiki são úteis para projetos públicos e têm um impacto significativo na melhoria da qualidade e produtividade, as empresas de desenvolvimento de software provavelmente adotarão o DeepWiki para os seus próprios projetos.
A Cognition deve ter investido na geração de sites wiki para inúmeros projetos públicos, acreditando que isso aconteceria. Isso demonstra a confiança da Cognition no DeepWiki. E se o DeepWiki for adotado, o Devin seguirá automaticamente, acelerando significativamente a popularização dos programadores de IA.
GitHub como Plataforma de Partilha de Documentos
O GitHub tornou-se um serviço web popular e padrão de facto para partilhar, editar colaborativamente e armazenar programas para o desenvolvimento de software de código aberto.
Nos últimos anos, as suas robustas funcionalidades de gestão e segurança para empresas levaram à sua utilização comum por empresas de desenvolvimento de software avançadas.
Como resultado, o GitHub frequentemente transmite a imagem de um serviço web principalmente para armazenamento e partilha de programas. No entanto, na realidade, permite a partilha, edição colaborativa e armazenamento de vários documentos e materiais, completamente independentes de programas.
Por esta razão, muitas pessoas utilizam o GitHub para gerir documentos que desejam editar colaborativamente de forma ampla. Estes documentos podem estar relacionados com software ou ser inteiramente não relacionados.
Além disso, blogs e websites são também documentos que contêm um tipo de programa ou são estruturados por programas para serem publicados.
Portanto, não é incomum para indivíduos e empresas armazenarem conteúdo de blogs e websites, juntamente com programas para apresentação e geração automática de sites, num único projeto GitHub.
Também é possível tornar esse conteúdo de blog e website projetos GitHub públicos para permitir a edição colaborativa.
Recentemente, para além de utilizar a IA generativa para o desenvolvimento de software, é cada vez mais comum incorporar funcionalidades de IA generativa diretamente no software.
Nestes casos, instruções detalhadas para a IA generativa, denominadas prompts, são incorporadas no programa.
Esses prompts também podem ser considerados um tipo de documento.
Fábrica Intelectual
Embora seja um engenheiro de software, também escrevo artigos para o meu blog.
Apesar de querer que muitas pessoas os leiam, aumentar o número de leitores é bastante desafiante.
Claro, poderia considerar criar artigos para chamar a atenção ou contactar diretamente várias pessoas influentes para obter conselhos, dedicando esforço e engenho.
No entanto, considerando a minha personalidade e o esforço e stress envolvidos, não estou entusiasmado com a promoção agressiva. Além disso, gastar tempo nessas atividades desviaria tempo dos aspetos centrais do meu trabalho: criar programas, pensar e escrever documentos.
Por isso, decidi recentemente experimentar uma estratégia "multimédia" ou "omnichannel" para expandir o alcance dos meus artigos de blog, divulgando-os em vários formatos de conteúdo.
Especificamente, isso envolve traduzir artigos em japonês para inglês e publicá-los num site de blog em inglês, e criar vídeos de apresentação para explicar os artigos e publicá-los no YouTube.
Além disso, para além de publicar em serviços de blog genéricos, também estou a considerar criar o meu próprio site de blog com um índice dos meus artigos anteriores por categoria e ligar artigos relacionados.
Se tivesse de criar tudo isto manualmente cada vez que um novo artigo é adicionado, seria contraproducente. Por conseguinte, todas as tarefas, exceto escrever o artigo japonês inicial, são automatizadas usando IA generativa. Chamo a isto uma Fábrica Intelectual.
Preciso de desenvolver programas para concretizar este sistema.
Atualmente, já criei programas que conseguem automatizar totalmente a tradução, a geração de vídeos de apresentação e os carregamentos para o YouTube.
Agora, estou a criar programas básicos para categorizar e ligar artigos de blog existentes.
Uma vez concluído, e após criar um programa para gerar o meu site de blog personalizado e o implementar automaticamente num servidor web, o conceito inicial da minha Fábrica Intelectual estará totalmente concretizado.
Fábrica Intelectual em Sentido Mais Amplo
Os rascunhos dos meus artigos de blog, que servem como matéria-prima para esta Fábrica Intelectual, também são geridos como projetos GitHub. Atualmente, não são divulgados publicamente como projetos privados, mas estou a considerar torná-los projetos públicos no futuro, juntamente com os programas da Fábrica Intelectual.
Além disso, a categorização dos artigos de blog, a ligação de artigos e as explicações em vídeo dos artigos de blog que estou atualmente a desenvolver partilham o mesmo conceito subjacente do DeepWiki.
Utilizando a IA generativa, obras criativas originais são usadas como matéria-prima para produzir vários conteúdos. Adicionalmente, informações e conhecimentos dentro deste conteúdo podem ser conectados para criar o que pode ser chamado de base de conhecimento.
A única diferença reside em se a matéria-prima é um programa ou um artigo de blog. E para o DeepWiki e para a minha Fábrica Intelectual, alimentados por IA generativa, esta diferença é em grande parte insignificante.
Por outras palavras, se o termo "Fábrica Intelectual" for interpretado num sentido geral e mais amplo, não limitado aos meus programas específicos, o DeepWiki é também um tipo de Fábrica Intelectual.
Além disso, o que uma Fábrica Intelectual produz não se limita a artigos traduzidos noutras línguas, vídeos de apresentação, ou sites de blog e wiki criados por mim.
Será provavelmente capaz de converter conteúdo para todos os meios e formatos concebíveis, como vídeos curtos, tweets, manga e anime, podcasts e e-books.
Além disso, o conteúdo dentro desses meios e formatos também pode ser diversificado para atender a várias audiências, incluindo uma multilinguização mais ampla, versões para especialistas ou iniciantes, e versões para adultos ou crianças.
Em última análise, será até possível a geração sob demanda de conteúdo personalizado.
GitHub como Mina Intelectual
As matérias-primas para uma Fábrica Intelectual podem, em princípio, ser armazenadas em qualquer lugar.
No entanto, considerando que o GitHub se tornou o padrão de facto para partilha, edição colaborativa e armazenamento de programas para projetos de código aberto, e que várias pessoas — não apenas eu — utilizam o GitHub como local de armazenamento de documentos, torna-se evidente que o GitHub tem o potencial de se tornar a principal fonte de matérias-primas para as Fábricas Intelectuais.
Por outras palavras, o GitHub tornar-se-á uma Mina Intelectual partilhada pela humanidade, fornecendo matérias-primas às Fábricas Intelectuais.
O termo "partilhada pela humanidade" aqui ecoa a ideia de que os projetos de código aberto são um ativo de software partilhado pela humanidade.
A filosofia de código aberto que tem sustentado o GitHub também se adequará bem ao conceito de documentos abertos.
Além disso, uma cultura de gestão de informações de direitos de autor e licenças para cada documento, semelhante aos programas, poderá emergir. O conteúdo gerado automaticamente a partir de documentos de origem pode facilmente ser-lhe atribuída a mesma licença ou cumprir as regras estipuladas pela licença.
Do ponto de vista da criação de uma Fábrica Intelectual, a consolidação de documentos de matéria-prima no GitHub é ideal.
Isto oferece duas vantagens: o benefício da eficiência do desenvolvimento, pois basta conectar o GitHub à Fábrica Intelectual, e a capacidade de demonstrar eficazmente as funções e o desempenho da própria Fábrica Intelectual a documentos publicamente disponíveis, tal como o DeepWiki.
No futuro, à medida que várias Fábricas Intelectuais forem desenvolvidas e conectadas ao GitHub, e mais indivíduos e empresas gerirem documentos no GitHub para processamento por Fábricas Intelectuais, a posição do GitHub como Mina Intelectual deverá tornar-se firmemente estabelecida.
Base de Conhecimento Pública Partilhada pela Humanidade
Com o GitHub no centro, a servir como uma Mina Intelectual, e as Fábricas Intelectuais a produzir uma vasta variedade de conteúdos e bases de conhecimento, este ecossistema completo criará uma base de conhecimento pública partilhada pela humanidade.
Além disso, esta será uma base de conhecimento dinâmica e em tempo real que se expandirá automaticamente à medida que o número de documentos publicados no GitHub aumentar.
Embora esta base de conhecimento complexa e enorme, contendo vastas quantidades de conhecimento, seja benéfica para os humanos, extrair totalmente o seu valor potencial será provavelmente um desafio para nós.
No entanto, a IA será capaz de aproveitar plenamente esta base de conhecimento publicamente partilhada pela humanidade.
Veios de Conhecimento Público
Quando tal ecossistema for concretizado, diversas informações públicas convergirão naturalmente para o GitHub.
Isto não se limitará a rascunhos de blogs pessoais ou websites corporativos.
Perceções e dados académicos, como artigos pré-publicados, ideias de pesquisa, dados experimentais e resultados de inquéritos, também se reunirão lá.
Isto atrairá não só aqueles que desejam contribuir com conhecimento, ideias e dados para o benefício de toda a humanidade, mas também aqueles que procuram disseminar rapidamente descobertas para obter reconhecimento.
Mesmo académicos e investigadores podem encontrar valor em ter o seu trabalho validado quanto à validade, novidade e impacto por IA, expresso através de vários formatos de conteúdo, e reconhecido por "tornar-se viral", em vez de esperar pelo longo e demorado processo de revisão por pares de artigos.
Alternativamente, se o seu trabalho chamar a atenção de outros investigadores ou empresas desta forma, levando a pesquisa colaborativa ou financiamento, há benefícios tangíveis.
Além disso, haverá uma recirculação do próprio conhecimento da IA.
Embora a IA generativa adquira vastas quantidades de conhecimento através do pré-treino, não aprende ativamente explorando conexões inesperadas ou estruturas semelhantes entre essa enorme quantidade de conhecimento.
O mesmo se aplica a novos insights que emergem da conexão de diferentes peças de conhecimento.
Por outro lado, ao discutir tais semelhanças e conexões com uma IA generativa pré-treinada, ela pode avaliar o seu valor com bastante precisão.
Portanto, ao inserir várias peças de conhecimento na IA generativa, comparando-as aleatoriamente ou exaustivamente, é possível descobrir semelhanças inesperadas e conexões valiosas.
Claro, dado o imenso número de combinações, cobrir tudo é impraticável. No entanto, ao otimizar e automatizar adequadamente este processo, torna-se possível desenterrar automaticamente conhecimento útil a partir do conhecimento existente.
Ao conseguir tal descoberta automática de conhecimento e ao armazenar o conhecimento descoberto no GitHub, este ciclo poderia, aparentemente, continuar indefinidamente.
Assim, dentro desta Mina Intelectual, existem numerosos veios por descobrir, e será possível escavá-los.
Conclusão
À medida que uma base de conhecimento partilhada pela humanidade, como o GitHub, assume esta forma de padrão de facto, será provavelmente utilizada para o pré-treino de IA generativa e para mecanismos de recuperação de conhecimento como o RAG.
Nesse cenário, o próprio GitHub funcionará como um cérebro massivo. As IAs generativas partilharão então este cérebro, distribuindo e expandindo o conhecimento.
O conhecimento adicionalmente registado aí não serão meramente registos factuais, novos dados ou classificações. Incluirá também conhecimento que atua como catalisador, promovendo a descoberta de outro conhecimento e novas combinações.
Refiro-me a esse conhecimento com um efeito catalítico como um Cristal Intelectual, ou um cristal de conhecimento. Isto inclui, por exemplo, novos frameworks de pensamento.
Quando frameworks são recém-descobertos ou desenvolvidos, e Cristais Intelectuais são adicionados, o seu efeito catalítico permite novas combinações e estruturação de conhecimento que eram anteriormente impossíveis, levando a um aumento de novo conhecimento.
Por vezes, estes podem conter outro Cristal Intelectual, que então amplifica ainda mais o conhecimento.
Este tipo de conhecimento está mais próximo da inquirição matemática, do desenvolvimento de engenharia ou da invenção, do que da descoberta científica. Portanto, é conhecimento que cresce puramente através do pensamento, em vez de através de novos factos observacionais como o conhecimento científico.
E o GitHub, como uma Mina Intelectual, juntamente com inúmeras IAs generativas que o utilizam, acelerará o crescimento desse conhecimento.
Este conhecimento rapidamente descoberto, excedendo em muito o ritmo da descoberta à escala humana, será fornecido num formato facilmente compreensível pelas Fábricas Intelectuais.
Desta forma, o conhecimento que pode ser explorado puramente através do pensamento será rapidamente desenterrado.