Apakah Anda akrab dengan GitHub, layanan web yang telah digunakan sebagai platform pengembangan kolaboratif oleh para pengembang perangkat lunak sumber terbuka?
Dalam beberapa tahun terakhir, penggunaannya sebagai ruang kerja kolaboratif telah meluas melampaui perangkat lunak sumber terbuka, mencakup pengembangan perangkat lunak korporat, bahkan aplikasi yang tidak terkait dengan perangkat lunak.
Saya juga menggunakan GitHub untuk mengelola program-program saya sendiri dan draf artikel yang saya tulis untuk blog ini.
Dalam artikel ini, saya akan mengeksplorasi kemungkinan bahwa penggunaan GitHub akan semakin meluas di luar perangkat lunak, menjadi ruang bersama untuk pengetahuan terbuka.
Pembuatan Situs Wiki oleh DeepWiki
Banyak alat pengembangan perangkat lunak yang menggunakan AI generatif dirancang untuk membantu pemrogram manusia. Dalam alat ini, manusia menulis programnya, dan AI memberikan dukungan.
Namun, jenis alat pengembangan perangkat lunak baru sedang muncul di mana manusia hanya memberikan instruksi, dan AI generatif mengambil alih tugas pembuatan program.
Salah satu alat perintis yang menarik perhatian adalah Devin. Beberapa orang mengatakan bahwa memperkenalkan Devin seperti menambahkan satu pemrogram lagi ke tim pengembangan. Meskipun masih dikatakan bahwa insinyur manusia perlu memberikan dukungan terperinci untuk penggunaan yang efektif, data tersebut pasti akan dikumpulkan dan digunakan untuk perbaikan lebih lanjut.
Era di mana tim pengembangan perangkat lunak yang khas terdiri dari satu manusia dan pemrogram AI seperti Devin sebagai anggota tim semakin dekat.
Cognition, pengembang Devin, juga telah merilis layanan bernama DeepWiki.
DeepWiki adalah layanan yang secara otomatis menghasilkan situs wiki untuk setiap proyek pengembangan perangkat lunak di GitHub. Ini berarti bahwa AI seperti Devin membaca dan menganalisis semua program dan dokumen terkait dari sebuah proyek, dan kemudian membuat semua dokumentasi dan spesifikasi desain.
Cognition dilaporkan telah menghasilkan situs wiki untuk lebih dari 50.000 proyek pengembangan perangkat lunak publik utama teratas di GitHub, yang dapat diakses secara bebas oleh siapa saja.
Karena ini adalah proyek publik, tidak ada masalah dengan melakukannya. Meskipun situs wiki dapat dihasilkan secara otomatis, itu pasti melibatkan banyak AI generatif yang berjalan dengan kapasitas penuh untuk jangka waktu yang lama, menimbulkan biaya yang cukup besar.
Dengan Cognition menanggung biaya ini, sejumlah besar proyek publik diuntungkan dengan memperoleh dokumentasi dan spesifikasi desain secara gratis.
Jika data statistik menunjukkan bahwa situs wiki ini berguna untuk proyek publik dan memiliki dampak signifikan pada peningkatan kualitas dan produktivitas, perusahaan pengembangan perangkat lunak kemungkinan akan mengadopsi DeepWiki untuk proyek mereka sendiri.
Cognition pasti telah berinvestasi dalam menghasilkan situs wiki untuk banyak proyek publik, percaya bahwa ini akan terjadi. Ini menunjukkan kepercayaan Cognition pada DeepWiki. Dan jika DeepWiki diadopsi, Devin akan secara otomatis mengikuti, secara signifikan mempercepat popularisasi pemrogram AI.
GitHub sebagai Platform Berbagi Dokumen
GitHub telah menjadi layanan web populer dan standar de facto untuk berbagi, mengedit secara kolaboratif, dan menyimpan program untuk pengembangan perangkat lunak sumber terbuka.
Dalam beberapa tahun terakhir, fitur manajemen dan keamanan yang tangguh untuk perusahaan telah menyebabkan penggunaannya yang umum oleh perusahaan pengembangan perangkat lunak canggih.
Akibatnya, GitHub sering kali membawa citra layanan web yang terutama untuk penyimpanan dan berbagi program. Namun, pada kenyataannya, GitHub memungkinkan berbagi, pengeditan kolaboratif, dan penyimpanan berbagai dokumen dan materi, yang sama sekali tidak terkait dengan program.
Karena alasan ini, banyak orang menggunakan GitHub untuk mengelola dokumen yang ingin mereka edit secara kolaboratif secara luas. Dokumen-dokumen ini dapat terkait dengan perangkat lunak atau sama sekali tidak terkait.
Selain itu, blog dan situs web juga merupakan dokumen yang berisi jenis program atau terstruktur oleh program untuk diterbitkan.
Oleh karena itu, tidak jarang bagi individu dan perusahaan untuk menyimpan konten blog dan situs web, bersama dengan program untuk presentasi dan pembuatan situs otomatis, bersama-sama sebagai satu proyek GitHub.
Dimungkinkan juga untuk menjadikan konten blog dan situs web tersebut sebagai proyek GitHub publik untuk memungkinkan pengeditan kolaboratif.
Baru-baru ini, selain menggunakan AI generatif untuk pengembangan perangkat lunak, semakin umum untuk menyematkan fungsionalitas AI generatif langsung ke dalam perangkat lunak.
Dalam kasus seperti itu, instruksi terperinci untuk AI generatif, yang disebut prompt, disematkan dalam program.
Prompt ini juga dapat dianggap sebagai jenis dokumen.
Pabrik Intelektual
Meskipun saya seorang insinyur perangkat lunak, saya juga menulis artikel untuk blog saya.
Meskipun saya ingin banyak orang membacanya, meningkatkan jumlah pembaca cukup menantang.
Tentu saja, saya bisa mempertimbangkan untuk membuat artikel yang menarik perhatian atau menghubungi langsung berbagai orang berpengaruh untuk mendapatkan saran, mengerahkan upaya dan kecerdikan.
Namun, mengingat kepribadian saya serta usaha dan tekanan yang terlibat, saya tidak antusias dengan promosi agresif. Terlebih lagi, menghabiskan waktu untuk kegiatan semacam itu akan mengalihkan waktu dari aspek inti pekerjaan saya: membuat program, berpikir, dan menulis dokumen.
Oleh karena itu, baru-baru ini saya memutuskan untuk mencoba strategi "multimedia" atau "omnichannel" untuk memperluas jangkauan artikel blog saya dengan menyebarkannya ke berbagai format konten.
Secara khusus, ini melibatkan penerjemahan artikel berbahasa Jepang ke bahasa Inggris dan mempostingnya di situs blog berbahasa Inggris, serta membuat video presentasi untuk menjelaskan artikel dan mempublikasikannya di YouTube.
Selanjutnya, selain mempublikasikan di layanan blog umum, saya juga mempertimbangkan untuk membuat situs blog saya sendiri dengan indeks artikel-artikel saya sebelumnya berdasarkan kategori dan menghubungkan artikel-artikel terkait.
Jika saya harus membuat semua ini secara manual setiap kali artikel baru ditambahkan, itu akan mengalahkan tujuannya. Oleh karena itu, semua tugas kecuali menulis artikel Jepang awal diotomatisasi menggunakan AI generatif. Saya menyebutnya Pabrik Intelektual.
Saya perlu mengembangkan program untuk mewujudkan sistem ini.
Saat ini, saya telah membuat program yang dapat sepenuhnya mengotomatisasi terjemahan, pembuatan video presentasi, dan pengunggahan YouTube.
Sekarang, saya sedang dalam proses membuat program dasar untuk mengategorikan dan menghubungkan artikel blog yang sudah ada.
Setelah itu selesai, dan saya membuat program untuk menghasilkan situs blog kustom saya dan secara otomatis menyebarkannya ke server web, konsep awal Pabrik Intelektual saya akan sepenuhnya terwujud.
Pabrik Intelektual dalam Arti Luas
Draf artikel blog saya, yang berfungsi sebagai bahan baku untuk Pabrik Intelektual ini, juga dikelola sebagai proyek GitHub. Saat ini, draf tersebut tidak diungkapkan secara publik sebagai proyek pribadi, tetapi saya mempertimbangkan untuk menjadikannya proyek publik di masa mendatang, bersama dengan program-program Pabrik Intelektual.
Selain itu, kategorisasi artikel blog, penghubungan artikel, dan penjelasan video artikel blog yang sedang saya kembangkan memiliki konsep dasar yang sama dengan DeepWiki.
Menggunakan AI generatif, karya kreatif orisinal digunakan sebagai bahan baku untuk menghasilkan berbagai konten. Selain itu, informasi dan pengetahuan dalam konten ini dapat dihubungkan untuk menciptakan apa yang dapat disebut sebagai basis pengetahuan.
Satu-satunya perbedaan terletak pada apakah bahan bakunya adalah program atau artikel blog. Dan bagi DeepWiki dan Pabrik Intelektual saya, yang didukung oleh AI generatif, perbedaan ini sebagian besar tidak signifikan.
Dengan kata lain, jika istilah "Pabrik Intelektual" diinterpretasikan dalam arti umum yang lebih luas, tidak terbatas pada program spesifik saya, DeepWiki juga merupakan jenis Pabrik Intelektual.
Terlebih lagi, apa yang dihasilkan oleh Pabrik Intelektual tidak terbatas pada artikel terjemahan dalam bahasa lain, video presentasi, atau situs blog dan wiki buatan sendiri.
Pabrik ini kemungkinan akan mampu mengonversi konten ke setiap media dan format yang dapat dibayangkan, seperti video pendek, tweet, manga dan anime, podcast, serta e-book.
Selanjutnya, konten dalam media dan format ini juga dapat divariasikan agar sesuai dengan berbagai audiens, termasuk multilingualisasi yang lebih luas, versi untuk ahli atau pemula, dan versi untuk dewasa atau anak-anak.
Pada akhirnya, bahkan pembuatan konten yang disesuaikan berdasarkan permintaan pun akan dimungkinkan.
GitHub sebagai Tambang Intelektual
Bahan baku untuk Pabrik Intelektual, pada prinsipnya, dapat disimpan di mana saja.
Namun, mengingat GitHub telah menjadi standar de facto untuk berbagi, mengedit secara kolaboratif, dan menyimpan program untuk proyek sumber terbuka, dan bahwa berbagai orang—tidak hanya saya sendiri—menggunakan GitHub sebagai lokasi penyimpanan dokumen, menjadi jelas bahwa GitHub berpotensi menjadi sumber utama bahan baku bagi Pabrik Intelektual.
Dengan kata lain, GitHub akan menjadi Tambang Intelektual yang dibagikan oleh umat manusia, memasok bahan baku ke Pabrik Intelektual.
Istilah "dibagikan oleh umat manusia" di sini menggemakan gagasan bahwa proyek sumber terbuka adalah aset perangkat lunak bersama bagi umat manusia.
Filosofi sumber terbuka yang telah mendukung GitHub juga akan sangat cocok dengan konsep dokumen terbuka.
Selain itu, budaya pengelolaan informasi hak cipta dan lisensi untuk setiap dokumen, mirip dengan program, dapat muncul. Konten yang secara otomatis dihasilkan dari dokumen sumber dapat dengan mudah diberi lisensi yang sama atau mematuhi aturan yang ditetapkan oleh lisensi.
Dari perspektif pembuatan Pabrik Intelektual, konsolidasi dokumen bahan baku di GitHub adalah ideal.
Ini menawarkan dua keuntungan: manfaat efisiensi pengembangan, karena cukup menghubungkan GitHub ke Pabrik Intelektual, dan kemampuan untuk secara efektif menunjukkan fungsi dan kinerja Pabrik Intelektual sendiri kepada dokumen yang tersedia secara publik, mirip dengan DeepWiki.
Di masa depan, seiring dengan dikembangkannya berbagai Pabrik Intelektual dan dihubungkannya ke GitHub, dan semakin banyak individu dan perusahaan mengelola dokumen di GitHub untuk diproses oleh Pabrik Intelektual, posisi GitHub sebagai Tambang Intelektual akan semakin kokoh.
Basis Pengetahuan Publik Bersama Umat Manusia
Dengan GitHub sebagai inti, berfungsi sebagai Tambang Intelektual, dan Pabrik Intelektual memproduksi berbagai macam konten dan basis pengetahuan, seluruh ekosistem ini akan menciptakan basis pengetahuan publik yang dibagikan oleh umat manusia.
Terlebih lagi, ini akan menjadi basis pengetahuan yang dinamis, waktu nyata, yang secara otomatis berkembang seiring dengan meningkatnya jumlah dokumen yang diterbitkan di GitHub.
Meskipun basis pengetahuan yang kompleks dan sangat besar ini, yang mengandung banyak sekali pengetahuan, akan bermanfaat bagi manusia, mengekstraksi sepenuhnya nilai potensinya kemungkinan akan menjadi tantangan bagi kita.
Namun, AI akan dapat sepenuhnya memanfaatkan basis pengetahuan publik bersama umat manusia ini.
Urat Pengetahuan Publik
Ketika ekosistem seperti itu terwujud, berbagai informasi publik secara alami akan berkumpul di GitHub.
Ini tidak akan terbatas pada draf blog pribadi atau situs web perusahaan.
Wawasan dan data akademis, seperti makalah pra-cetak, ide penelitian, data eksperimen, dan hasil survei, juga akan berkumpul di sana.
Ini akan menarik tidak hanya mereka yang ingin menyumbangkan pengetahuan, ide, dan data demi kepentingan seluruh umat manusia, tetapi juga mereka yang ingin menyebarkan penemuan dengan cepat untuk mendapatkan pengakuan.
Bahkan akademisi dan peneliti mungkin menemukan nilai dalam karyanya divalidasi validitas, kebaruan, dan dampaknya oleh AI, diekspresikan melalui berbagai format konten, dan diakui dengan "menjadi viral," daripada menunggu proses tinjauan sejawat yang panjang dan memakan waktu untuk makalah.
Sebagai alternatif, jika karyanya menarik perhatian peneliti atau perusahaan lain dengan cara ini, yang mengarah pada penelitian kolaboratif atau pendanaan, ada manfaat nyata.
Selain itu, akan ada resirkulasi pengetahuan AI itu sendiri.
Meskipun AI generatif memperoleh banyak pengetahuan melalui pra-pelatihan, ia tidak secara aktif belajar dengan menjelajahi koneksi tak terduga atau struktur serupa di antara kumpulan pengetahuan yang sangat besar itu.
Hal yang sama berlaku untuk wawasan baru yang muncul dari menghubungkan berbagai bagian pengetahuan.
Di sisi lain, ketika mendiskusikan kesamaan dan koneksi tersebut dengan AI generatif yang telah dilatih sebelumnya, ia dapat mengevaluasi nilainya dengan cukup akurat.
Oleh karena itu, dengan memasukkan berbagai bagian pengetahuan ke AI generatif, membandingkannya secara acak atau menyeluruh, dimungkinkan untuk menemukan kesamaan tak terduga dan koneksi berharga.
Tentu saja, mengingat banyaknya kombinasi, mencakup semuanya tidak praktis. Namun, dengan merampingkan dan mengotomatiskan proses ini secara tepat, dimungkinkan untuk secara otomatis menggali pengetahuan yang berguna dari pengetahuan yang sudah ada.
Dengan mencapai penemuan pengetahuan otomatis semacam itu dan menyimpan pengetahuan yang ditemukan di GitHub, lingkaran ini tampaknya dapat terus berlanjut tanpa batas.
Dengan demikian, di dalam Tambang Intelektual ini, terdapat banyak urat yang belum ditemukan, dan akan menjadi mungkin untuk menggali mereka.
Kesimpulan
Sebagai standar de facto, basis pengetahuan bersama umat manusia, seperti GitHub, terbentuk dengan cara ini, kemungkinan besar akan dimanfaatkan untuk pra-pelatihan AI generatif dan untuk mekanisme pengambilan pengetahuan seperti RAG.
Dalam skenario tersebut, GitHub itu sendiri akan berfungsi seperti otak besar. AI generatif kemudian akan berbagi otak besar ini, mendistribusikan dan memperluas pengetahuan.
Pengetahuan yang dicatat tambahan di sana tidak hanya berupa catatan faktual, data baru, atau klasifikasi. Ini juga akan mencakup pengetahuan yang berfungsi sebagai katalis, mendorong penemuan pengetahuan lain dan kombinasi baru.
Saya menyebut pengetahuan dengan efek katalitik seperti itu sebagai Kristal Intelektual, atau kristal pengetahuan. Ini termasuk, misalnya, kerangka pemikiran baru.
Ketika kerangka kerja baru ditemukan atau dikembangkan, dan Kristal Intelektual ditambahkan, efek katalitiknya memungkinkan kombinasi dan strukturisasi pengetahuan baru yang sebelumnya tidak mungkin, yang mengarah pada peningkatan pengetahuan baru.
Terkadang, ini mungkin mengandung Kristal Intelektual lain, yang kemudian semakin memperkuat pengetahuan.
Jenis pengetahuan ini lebih dekat dengan penyelidikan matematis, pengembangan rekayasa, atau penemuan, daripada penemuan ilmiah. Oleh karena itu, ini adalah pengetahuan yang tumbuh murni melalui pemikiran, daripada melalui fakta observasional baru seperti pengetahuan ilmiah.
Dan GitHub, sebagai Tambang Intelektual, bersama dengan AI generatif yang tak terhitung jumlahnya yang memanfaatkannya, akan mempercepat pertumbuhan pengetahuan tersebut.
Pengetahuan yang ditemukan dengan cepat ini, jauh melampaui laju penemuan skala manusia, akan disediakan dalam format yang mudah dipahami oleh Pabrik Intelektual.
Dengan cara ini, pengetahuan yang dapat dieksplorasi murni melalui pemikiran akan dengan cepat digali.