Saltar al Contenido
Este artículo ha sido traducido del japonés usando IA
Leer en japonés
Este artículo es de Dominio Público (CC0). Siéntete libre de usarlo libremente. CC0 1.0 Universal

GitHub como Mina Intelectual

¿Conoce GitHub, el servicio web que ha sido utilizado como plataforma de desarrollo colaborativo por los desarrolladores de software de código abierto?

En los últimos años, su uso como espacio de trabajo colaborativo se ha expandido más allá del software de código abierto para incluir el desarrollo de software corporativo e incluso aplicaciones no relacionadas con el software.

También utilizo GitHub para gestionar mis propios programas y los borradores de los artículos que escribo para este blog.

En este artículo, exploraré la posibilidad de que el uso de GitHub se extienda cada vez más allá del software, convirtiéndose en un espacio compartido para el conocimiento abierto.

Generación de Sitios Wiki con DeepWiki

Muchas herramientas de desarrollo de software que utilizan IA generativa están diseñadas para asistir a los programadores humanos. En estas herramientas, los humanos escriben el programa y la IA proporciona soporte.

Sin embargo, está surgiendo un nuevo tipo de herramienta de desarrollo de software en la que los humanos solo dan instrucciones, y la IA generativa asume la tarea de crear el programa.

Una de esas herramientas pioneras que captó la atención es Devin. Algunos han dicho que introducir Devin es como añadir otro programador al equipo de desarrollo. Aunque todavía se dice que los ingenieros humanos necesitan proporcionar soporte detallado para un uso efectivo, sin duda se recopilarán datos para futuras mejoras.

La era en la que un equipo de desarrollo de software típico consiste en un humano y programadores de IA como Devin como miembros del equipo se acerca rápidamente.

Cognition, el desarrollador de Devin, también ha lanzado un servicio llamado DeepWiki.

DeepWiki es un servicio que genera automáticamente un sitio wiki para cada proyecto de desarrollo de software en GitHub. Esto significa que una IA como Devin lee y analiza todos los programas y documentos relacionados de un proyecto, y luego crea toda la documentación y las especificaciones de diseño.

Según se informa, Cognition generó sitios wiki para más de 50.000 de los principales proyectos públicos de desarrollo de software en GitHub, que son de libre acceso para cualquiera.

Dado que son proyectos públicos, no hay ningún problema en hacerlo. Aunque los sitios wiki se pueden generar automáticamente, debe haber implicado a numerosas IAs generativas funcionando a plena capacidad durante un período prolongado, lo que supuso costes considerables.

Al asumir Cognition estos costes, un gran número de proyectos públicos se beneficiaron al adquirir documentación y especificaciones de diseño de forma gratuita.

Si los datos estadísticos muestran que estos sitios wiki son útiles para los proyectos públicos y tienen un impacto significativo en la mejora de la calidad y la productividad, es probable que las empresas de desarrollo de software adopten DeepWiki para sus propios proyectos.

Cognition debe haber invertido en la generación de sitios wiki para numerosos proyectos públicos, creyendo que esto sucedería. Esto demuestra la confianza de Cognition en DeepWiki. Y si se adopta DeepWiki, Devin le seguirá automáticamente, acelerando significativamente la popularización de los programadores de IA.

GitHub como Plataforma para Compartir Documentos

GitHub se ha convertido en un servicio web popular y un estándar de facto para compartir, editar colaborativamente y almacenar programas para el desarrollo de software de código abierto.

En los últimos años, sus sólidas características de gestión y seguridad para empresas han llevado a su uso generalizado por parte de empresas de desarrollo de software avanzadas.

Como resultado, GitHub a menudo proyecta la imagen de un servicio web principalmente para el almacenamiento y el intercambio de programas. Sin embargo, en realidad, permite compartir, editar colaborativamente y almacenar diversos documentos y materiales, completamente ajenos a los programas.

Por esta razón, muchas personas utilizan GitHub para gestionar documentos que desean editar de forma colaborativa y amplia. Estos documentos pueden estar relacionados con el software o ser completamente ajenos a él.

Además, los blogs y los sitios web también son documentos que contienen un tipo de programa o que están estructurados por programas para ser publicados.

Por lo tanto, no es raro que individuos y empresas almacenen el contenido de blogs y sitios web, junto con programas para la presentación y la generación automática de sitios, como un único proyecto de GitHub.

También es posible convertir dicho contenido de blogs y sitios web en proyectos públicos de GitHub para permitir la edición colaborativa.

Recientemente, además de utilizar la IA generativa para el desarrollo de software, es cada vez más común incrustar funcionalidades de IA generativa directamente en el software.

En tales casos, dentro del programa se incrustan instrucciones detalladas para la IA generativa, denominadas prompts.

Estas prompts también pueden considerarse un tipo de documento.

Fábrica Intelectual

Aunque soy ingeniero de software, también escribo artículos para mi blog.

Si bien deseo que muchas personas los lean, aumentar el número de lectores es todo un desafío.

Por supuesto, podría considerar crear artículos para llamar la atención o contactar directamente a diversas personas influyentes para pedirles consejo, esforzándome e ingeniándomelas.

Sin embargo, considerando mi personalidad y el esfuerzo y el estrés involucrados, no me entusiasma la promoción agresiva. Además, dedicar tiempo a tales actividades desviaría tiempo de los aspectos centrales de mi trabajo: crear programas, pensar y escribir documentos.

Por lo tanto, recientemente decidí probar una estrategia "multimedia" u "omnicanal" para expandir el alcance de los artículos de mi blog, desplegándolos en varios formatos de contenido.

Específicamente, esto implica traducir artículos en japonés al inglés y publicarlos en un sitio de blog en inglés, y crear videos de presentación para explicar los artículos y publicarlos en YouTube.

Además, más allá de la publicación en servicios de blog generales, también estoy considerando crear mi propio sitio de blog con un índice de mis artículos anteriores por categoría y vinculando artículos relacionados.

Si tuviera que crear todo esto manualmente cada vez que se añade un nuevo artículo, sería contraproducente. Por lo tanto, todas las tareas, excepto escribir el artículo inicial en japonés, se automatizan utilizando IA generativa. A esto lo llamo una Fábrica Intelectual.

Necesito desarrollar programas para hacer realidad este sistema.

Actualmente, ya he creado programas que pueden automatizar completamente la traducción, la generación de videos de presentación y las subidas a YouTube.

Ahora, estoy en proceso de crear programas básicos para categorizar y vincular artículos de blog existentes.

Una vez que eso esté completo, y cree un programa para generar mi sitio de blog personalizado y desplegarlo automáticamente en un servidor web, el concepto inicial de mi Fábrica Intelectual estará completamente realizado.

Fábrica Intelectual en un Sentido Amplio

Los borradores de los artículos de mi blog, que sirven como materia prima para esta Fábrica Intelectual, también se gestionan como proyectos de GitHub. Actualmente, no se divulgan públicamente como proyectos privados, pero estoy considerando convertirlos en proyectos públicos en el futuro, junto con los programas de la Fábrica Intelectual.

Además, la categorización de los artículos del blog, la vinculación de artículos y las explicaciones en video de los artículos del blog que estoy desarrollando actualmente comparten el mismo concepto subyacente que DeepWiki.

Utilizando IA generativa, las obras creativas originales se emplean como materia prima para producir diversos contenidos. Además, la información y el conocimiento dentro de este contenido pueden conectarse para crear lo que podría llamarse una base de conocimiento.

La única diferencia radica en si la materia prima es un programa o un artículo de blog. Y para DeepWiki y mi Fábrica Intelectual, impulsados por IA generativa, esta diferencia es en gran medida insignificante.

En otras palabras, si el término "Fábrica Intelectual" se interpreta en un sentido general y amplio, no limitado a mis programas específicos, DeepWiki es también un tipo de Fábrica Intelectual.

Además, lo que produce una Fábrica Intelectual no se limita a artículos traducidos a otros idiomas, videos de presentación o sitios de blog y wiki creados por uno mismo.

Probablemente será capaz de convertir contenido a todos los medios y formatos imaginables, como videos cortos, tuits, manga y anime, podcasts y libros electrónicos.

Además, el contenido dentro de estos medios y formatos también se puede diversificar para adaptarse a varias audiencias, incluyendo una multilingüización más amplia, versiones para expertos o principiantes, y versiones para adultos o niños.

En última instancia, incluso la generación bajo demanda de contenido personalizado será posible.

GitHub como Mina Intelectual

Las materias primas para una Fábrica Intelectual pueden, en principio, almacenarse en cualquier lugar.

Sin embargo, considerando que GitHub se ha convertido en el estándar de facto para compartir, editar colaborativamente y almacenar programas para proyectos de código abierto, y que diversas personas —no solo yo— utilizan GitHub como lugar de almacenamiento de documentos, resulta evidente que GitHub tiene el potencial de convertirse en la principal fuente de materias primas para las Fábricas Intelectuales.

En otras palabras, GitHub se convertirá en una Mina Intelectual compartida por la humanidad, que suministrará materias primas a las Fábricas Intelectuales.

El término "compartida por la humanidad" aquí hace eco de la idea de que los proyectos de código abierto son un activo de software compartido por la humanidad.

La filosofía de código abierto que ha sustentado GitHub también encajará bien con el concepto de documentos abiertos.

Además, podría surgir una cultura de gestión de la información de derechos de autor y las licencias para cada documento, de manera similar a los programas. El contenido generado automáticamente a partir de documentos fuente puede asignarse fácilmente la misma licencia o cumplir con las reglas estipuladas por la licencia.

Desde la perspectiva de crear una Fábrica Intelectual, la consolidación de los documentos de materia prima en GitHub es ideal.

Esto ofrece dos ventajas: el beneficio de la eficiencia del desarrollo, ya que simplemente requiere conectar GitHub a la Fábrica Intelectual, y la capacidad de demostrar eficazmente las funciones y el rendimiento de la propia Fábrica Intelectual a documentos disponibles públicamente, de manera muy similar a DeepWiki.

En el futuro, a medida que se desarrollen y conecten diversas Fábricas Intelectuales a GitHub, y más individuos y empresas gestionen documentos en GitHub para su procesamiento por las Fábricas Intelectuales, la posición de GitHub como Mina Intelectual debería consolidarse firmemente.

Base de Conocimiento Pública Compartida por la Humanidad

Con GitHub en el centro, sirviendo como una Mina Intelectual, y las Fábricas Intelectuales produciendo una amplia variedad de contenido y bases de conocimiento, todo este ecosistema creará una base de conocimiento pública compartida por la humanidad.

Además, esta será una base de conocimiento dinámica y en tiempo real que se expandirá automáticamente a medida que aumente el número de documentos publicados en GitHub.

Si bien esta compleja y enorme base de conocimiento, que contiene vastas cantidades de saber, será beneficiosa para los humanos, extraer completamente su valor potencial probablemente será un desafío para nosotros.

Sin embargo, la IA podrá aprovechar al máximo esta base de conocimiento pública compartida por la humanidad.

Vetas de Conocimiento Público

Cuando se concrete un ecosistema así, diversas informaciones públicas convergerán naturalmente en GitHub.

Esto no se limitará a borradores de blogs personales o sitios web corporativos.

También se reunirán allí ideas y datos académicos, como artículos preimpresos, ideas de investigación, datos experimentales y resultados de encuestas.

Esto atraerá no solo a quienes desean contribuir con conocimiento, ideas y datos para el beneficio de toda la humanidad, sino también a quienes buscan difundir rápidamente sus descubrimientos para obtener reconocimiento.

Incluso los académicos e investigadores podrían encontrar valor en que su trabajo sea validado por IA en cuanto a su validez, novedad e impacto, expresado a través de diversos formatos de contenido y reconocido por "volverse viral", en lugar de esperar el largo y tedioso proceso de revisión por pares de los artículos.

Alternativamente, si su trabajo capta la atención de otros investigadores o empresas de esta manera, lo que conduce a la investigación colaborativa o la financiación, existen beneficios tangibles.

Además, habrá una recirculación del propio conocimiento de la IA.

Si bien la IA generativa adquiere vastas cantidades de conocimiento a través del preentrenamiento, no aprende activamente explorando conexiones inesperadas o estructuras similares entre esa enorme cantidad de conocimiento.

Lo mismo se aplica a las nuevas perspectivas que surgen de la conexión de diferentes piezas de conocimiento.

Por otro lado, al discutir tales similitudes y conexiones con una IA generativa preentrenada, esta puede evaluar su valor con bastante precisión.

Por lo tanto, al introducir diversas piezas de conocimiento en la IA generativa, comparándolas de forma aleatoria o exhaustiva, es posible descubrir similitudes inesperadas y conexiones valiosas.

Por supuesto, dada la inmensa cantidad de combinaciones, cubrirlo todo es poco práctico. Sin embargo, al optimizar y automatizar este proceso de manera adecuada, se vuelve posible desenterrar automáticamente conocimiento útil del conocimiento existente.

Al lograr dicho descubrimiento automático de conocimiento y almacenar el conocimiento descubierto en GitHub, este ciclo aparentemente podría continuar indefinidamente.

Así, dentro de esta Mina Intelectual, existen numerosas vetas sin descubrir, y será posible excavarlas.

Conclusión

A medida que una base de conocimiento compartida por la humanidad, como GitHub, se consolide como estándar de facto, es probable que se utilice para el preentrenamiento de IA generativa y para mecanismos de recuperación de conocimiento como RAG.

En un escenario así, GitHub funcionará como un cerebro masivo. Las IAs generativas compartirán entonces este cerebro, distribuyendo y expandiendo el conocimiento.

El conocimiento adicionalmente registrado allí no serán meros registros fácticos, nuevos datos o clasificaciones. También incluirá conocimiento que actúe como catalizador, promoviendo el descubrimiento de otros conocimientos y nuevas combinaciones.

Me refiero a este conocimiento con efecto catalítico como un Cristal Intelectual, o un cristal de conocimiento. Esto incluye, por ejemplo, nuevos marcos de pensamiento.

Cuando se descubren o desarrollan nuevos marcos, y se añaden Cristales Intelectuales, su efecto catalítico permite nuevas combinaciones y estructuras de conocimiento que antes eran imposibles, lo que conduce a un aumento del nuevo conocimiento.

A veces, estos pueden contener otro Cristal Intelectual, que luego amplifica aún más el conocimiento.

Este tipo de conocimiento está más cerca de la investigación matemática, el desarrollo ingenieril o la invención, que del descubrimiento científico. Por lo tanto, es conocimiento que crece puramente a través del pensamiento, más que a través de nuevos hechos observacionales como el conocimiento científico.

Y GitHub, como Mina Intelectual, junto con innumerables IAs generativas que lo utilizan, acelerará el crecimiento de dicho conocimiento.

Este conocimiento rápidamente descubierto, superando con creces el ritmo del descubrimiento a escala humana, será proporcionado en un formato fácilmente comprensible por las Fábricas Intelectuales.

De esta manera, el conocimiento que puede explorarse puramente a través del pensamiento será desenterrado rápidamente.