Apakah Anda familiar dengan GitHub, layanan web yang telah digunakan sebagai platform pengembangan kolaboratif di antara pengembang perangkat lunak sumber terbuka?
Dalam beberapa tahun terakhir, penggunaannya sebagai platform untuk pekerjaan kolaboratif telah meluas, tidak hanya untuk perangkat lunak sumber terbuka tetapi juga untuk pengembangan perangkat lunak perusahaan dan bahkan untuk tujuan yang tidak terkait dengan perangkat lunak.
Saya juga menggunakan GitHub untuk mengelola program-program saya sendiri dan draf artikel yang saya tulis untuk blog ini.
Dalam artikel ini, saya akan mengeksplorasi kemungkinan bahwa penggunaan GitHub akan semakin melampaui pengembangan perangkat lunak di masa depan, menjadi tempat untuk berbagi pengetahuan secara terbuka.
Pembuatan Situs Wiki oleh DeepWiki
Banyak alat pengembangan perangkat lunak yang menggunakan AI generatif dirancang untuk membantu tugas pemrograman manusia. Manusia menulis program, dan AI memberikan dukungan.
Di sisi lain, jenis alat pengembangan perangkat lunak baru sedang muncul di mana manusia hanya memberikan instruksi, dan AI generatif mengambil alih tugas pembuatan program.
Devin adalah salah satu alat yang menjadi pelopor dan menarik perhatian. Beberapa orang bahkan mengatakan bahwa memperkenalkan Devin seperti menambahkan satu programmer lagi ke tim pengembangan. Meskipun masih dikatakan bahwa insinyur manusia perlu memberikan dukungan terperinci agar dapat digunakan secara efektif, data tersebut pasti akan dikumpulkan dan digunakan untuk perbaikan.
Era di mana tim pengembangan perangkat lunak yang terdiri dari satu manusia dan programmer AI seperti Devin sebagai anggota tim menjadi hal yang umum sudah di depan mata.
Cognition, pengembang Devin, juga telah merilis layanan bernama DeepWiki.
DeepWiki adalah layanan yang secara otomatis menghasilkan situs wiki untuk setiap proyek pengembangan perangkat lunak di GitHub. Ini berarti bahwa AI, mirip dengan Devin, membaca dan menganalisis semua program dan dokumen terkait proyek tersebut serta membuat semua manual dan dokumen desain.
Cognition dilaporkan telah membuat situs wiki untuk lebih dari 50.000 proyek pengembangan perangkat lunak publik utama di GitHub yang dapat diakses secara bebas oleh siapa saja, menggunakan DeepWiki.
Karena ini adalah proyek publik, sama sekali tidak ada masalah dengan melakukannya. Meskipun situs wiki dapat dihasilkan secara otomatis, hal itu pasti membutuhkan banyak AI generatif untuk berjalan pada kapasitas penuh dalam waktu yang lama, dan biayanya pasti sangat besar.
Dengan menanggung biaya-biaya ini, Cognition telah memberikan manfaat besar bagi sejumlah besar proyek publik, memungkinkan mereka untuk mendapatkan penjelasan dan dokumen desain secara gratis.
Jika data statistik menunjukkan bahwa situs wiki ini berguna untuk setiap proyek publik dan memiliki efek signifikan dalam meningkatkan kualitas dan produktivitas, maka perusahaan pengembangan perangkat lunak akan mengadopsi DeepWiki untuk proyek mereka sendiri.
Cognition pasti telah berinvestasi dalam menghasilkan situs wiki untuk sejumlah besar proyek publik, percaya bahwa ini bisa terjadi. Ini menunjukkan kepercayaan Cognition pada DeepWiki. Dan ketika DeepWiki diadopsi, Devin akan secara otomatis mengikuti, secara signifikan meningkatkan kemungkinan adopsi luas programmer AI.
GitHub sebagai Platform Berbagi Dokumen
GitHub telah menjadi layanan web yang populer dan standar de facto untuk berbagi, mengedit bersama, dan menyimpan program untuk pengembangan perangkat lunak sumber terbuka.
Dalam beberapa tahun terakhir, fitur manajemen dan keamanannya untuk perusahaan telah ditingkatkan, menjadikannya alat yang umum di perusahaan-perusahaan maju yang mengembangkan perangkat lunak.
Karena alasan ini, GitHub sangat membangkitkan citra layanan web untuk menyimpan dan berbagi program. Namun, pada kenyataannya, GitHub dapat digunakan untuk berbagi, mengedit bersama, dan menyimpan berbagai dokumen dan materi, yang sama sekali tidak terkait dengan program.
Oleh karena itu, tidak sedikit orang yang menggunakan GitHub untuk mengelola dokumen yang ingin mereka edit secara luas. Ini bisa berupa dokumen yang terkait dengan perangkat lunak atau yang sama sekali tidak terkait.
Selain itu, blog dan situs web juga merupakan dokumen yang berisi sejenis program atau distrukturkan dan diterbitkan oleh program.
Karena hal ini, tidak jarang individu dan perusahaan menyimpan konten blog dan situs web, bersama dengan program yang membuatnya mudah dilihat dan program untuk pembuatan situs otomatis, secara bersamaan sebagai satu proyek di GitHub.
Dimungkinkan juga untuk menjadikan blog dan situs web tersebut sebagai proyek publik di GitHub untuk mengedit kontennya secara bersama.
Selanjutnya, baru-baru ini, AI generatif tidak hanya digunakan untuk pengembangan perangkat lunak tetapi juga sering diintegrasikan ke dalam perangkat lunak.
Dalam kasus ini, kalimat instruksi yang disebut prompts, yang memberikan instruksi terperinci kepada AI generatif, disematkan di dalam program.
Prompts ini juga dapat dianggap sebagai jenis dokumen.
Pabrik Intelektual
Meskipun saya seorang insinyur pengembangan perangkat lunak, saya juga menulis artikel untuk blog saya.
Meskipun saya ingin banyak orang membacanya, cukup sulit untuk meningkatkan jumlah pembaca.
Tentu saja, seseorang dapat mempertimbangkan untuk membuat artikel untuk menarik perhatian atau secara aktif menghubungi individu berpengaruh untuk meminta nasihat, di antara upaya dan kecerdikan lainnya.
Namun, mempertimbangkan kepribadian saya serta upaya dan stres yang terlibat, saya enggan untuk terlibat dalam promosi agresif. Terlebih lagi, menghabiskan waktu untuk kegiatan semacam itu akan mengalihkan perhatian dari inti pekerjaan saya, yaitu memprogram, merenungkan ide, dan mendokumentasikannya.
Oleh karena itu, saya baru-baru ini memutuskan untuk mencoba strategi yang dikenal sebagai multimedia atau omnichannel, yang melibatkan perluasan jangkauan postingan blog saya dengan mengembangkannya ke dalam berbagai bentuk konten.
Secara spesifik, ini termasuk menerjemahkan artikel berbahasa Jepang ke dalam bahasa Inggris dan mempostingnya di situs blog berbahasa Inggris, serta membuat video presentasi untuk menjelaskan artikel dan memublikasikannya di YouTube.
Selanjutnya, selain memublikasikan di layanan blog umum, saya juga sedang mempertimbangkan untuk membuat situs blog saya sendiri yang mencantumkan dan mengkategorikan postingan blog saya sebelumnya dan menautkan artikel terkait.
Jika saya harus menghabiskan waktu untuk membuat ini setiap kali artikel baru ditulis, itu akan menjadi kontraproduktif. Oleh karena itu, semua tugas selain menulis artikel awal berbahasa Jepang diotomatisasi menggunakan AI generatif. Saya menyebut ini pabrik intelektual.
Saya perlu mengembangkan program untuk mengimplementasikan mekanisme ini.
Saat ini, saya telah membuat program yang dapat sepenuhnya mengotomatiskan terjemahan, pembuatan video presentasi, dan pengunggahan ke YouTube.
Saya sekarang sedang dalam proses membuat program dasar untuk mengkategorikan dan menautkan postingan blog yang sudah ada.
Setelah itu selesai, dan saya membuat program untuk menghasilkan situs blog saya sendiri dan secara otomatis mencerminkannya di server web, konsep awal pabrik intelektual saya akan selesai.
Pabrik Intelektual dalam Arti Luas
Draf postingan blog saya, yang berfungsi sebagai bahan mentah untuk pabrik intelektual ini, juga dikelola sebagai proyek GitHub. Untuk saat ini, draf tersebut bersifat pribadi dan tidak tersedia untuk umum, tetapi saya mempertimbangkan untuk menjadikannya proyek publik bersama dengan program pabrik intelektual di masa mendatang.
Dan kategorisasi postingan blog, penautan artikel, serta penjelasan postingan blog yang diubah menjadi video, yang sedang saya kembangkan, memiliki konsep dasar yang sama dengan DeepWiki.
Menggunakan AI generatif, berbagai konten diproduksi dari karya kreatif asli sebagai bahan mentah. Selain itu, AI dapat menghubungkan informasi dan pengetahuan di dalamnya, secara efektif menciptakan basis pengetahuan.
Satu-satunya perbedaan adalah apakah bahan mentah tersebut berupa program atau postingan blog. Dan bagi DeepWiki dan pabrik intelektual saya yang ditenagai oleh AI generatif, perbedaan itu hampir tidak berarti.
Dengan kata lain, jika istilah "pabrik intelektual" diinterpretasikan dalam arti yang umum dan lebih luas, tidak terbatas pada program saya, maka DeepWiki juga merupakan jenis pabrik intelektual.
Dan apa yang dihasilkan oleh pabrik intelektual tidak terbatas pada artikel terjemahan dalam bahasa lain, video presentasi, situs blog buatan sendiri, atau situs wiki.
Mereka kemungkinan akan dapat mengkonversi konten ke setiap media dan format yang dapat dibayangkan, seperti video pendek, tweet, komik, animasi, podcast, dan e-book.
Selain itu, konten dalam media dan format ini juga dapat divariasikan agar sesuai dengan penerima, seperti dukungan multibahasa yang lebih luas, versi untuk ahli atau pemula, dan versi untuk dewasa atau anak-anak.
Terlebih lagi, bahkan pembuatan konten yang disesuaikan sesuai permintaan pun dapat dicapai.
GitHub sebagai Tambang Intelektual
Bahan mentah untuk sebuah pabrik intelektual pada dasarnya dapat terletak di mana saja.
Namun, mengingat bahwa GitHub telah menjadi standar de facto untuk berbagi, mengedit bersama, dan menyimpan program proyek sumber terbuka, dan bahwa banyak orang, tidak hanya saya, menggunakan GitHub sebagai lokasi penyimpanan dokumen, menjadi jelas bahwa GitHub memiliki potensi untuk menjadi sumber utama bahan mentah bagi pabrik intelektual.
Dengan kata lain, GitHub akan menjadi tambang intelektual bersama bagi umat manusia, memasok bahan mentah ke pabrik-pabrik intelektual.
Istilah "dibagi oleh umat manusia" di sini menggemakan gagasan bahwa proyek sumber terbuka adalah aset perangkat lunak bersama bagi umat manusia.
Filosofi sumber terbuka yang telah mendukung GitHub juga akan sangat cocok dengan konsep dokumen terbuka.
Selain itu, budaya pengelolaan informasi hak cipta dan lisensi untuk setiap dokumen, mirip dengan program, dapat muncul. Konten yang dihasilkan secara otomatis dari dokumen sumber dapat dengan mudah diberikan lisensi yang sama, atau mematuhi aturan yang ditetapkan oleh lisensi.
Dari perspektif pengembangan pabrik intelektual, memiliki dokumen bahan mentah yang terpusat di GitHub adalah ideal.
Ini menawarkan dua manfaat: peningkatan efisiensi pengembangan dengan hanya menghubungkan GitHub dengan pabrik intelektual, dan kemampuan untuk secara efektif menunjukkan fungsi dan kinerja pabrik intelektual seseorang menggunakan dokumen yang tersedia untuk umum, mirip dengan DeepWiki.
Di masa depan, seiring berbagai pabrik intelektual dikembangkan dan dapat terhubung ke GitHub, dan seiring semakin banyak orang dan perusahaan mengelola dokumen di GitHub dan memprosesnya dengan pabrik intelektual, posisi GitHub sebagai tambang intelektual akan semakin kokoh.
Basis Pengetahuan Publik Bersama Umat Manusia
Dengan GitHub sebagai pusatnya, berfungsi sebagai tambang intelektual, dan berbagai konten serta basis pengetahuan yang dihasilkan oleh pabrik-pabrik intelektual, seluruh ekosistem ini akan menciptakan basis pengetahuan publik yang dibagikan oleh umat manusia.
Terlebih lagi, ini adalah basis pengetahuan yang dinamis dan real-time yang akan secara otomatis berkembang seiring dengan peningkatan jumlah dokumen yang dipublikasikan di GitHub.
Meskipun basis pengetahuan yang luas dan kompleks ini, yang mengandung pengetahuan yang sangat besar, akan berguna bagi manusia, akan sulit untuk sepenuhnya mengekstrak nilai potensialnya.
Namun, AI akan mampu memanfaatkan sepenuhnya basis pengetahuan publik ini, yang dibagikan oleh seluruh umat manusia.
Urat-Urat Pengetahuan Publik
Jika ekosistem semacam itu terwujud, berbagai informasi publik secara alami akan berkumpul di GitHub.
Ini tidak hanya terbatas pada draf blog pribadi atau situs web perusahaan.
Wawasan dan data akademis, seperti makalah pra-publikasi dan ide penelitian, data eksperimen, serta hasil survei, juga akan terkumpul.
Ini akan menarik tidak hanya mereka yang ingin menggunakan pengetahuan, ide, dan data untuk kepentingan seluruh umat manusia, tetapi juga mereka yang ingin menyebarkan penemuan mereka dengan cepat dan mendapatkan pengakuan.
Bahkan bagi para cendekiawan dan peneliti, banyak yang akan menemukan nilai dalam validitas, kebaruan, dan dampak pekerjaan mereka diverifikasi oleh AI, diekspresikan melalui berbagai konten, dan diakui dengan cara yang menjadi viral, tanpa harus menunggu proses peninjauan sejawat yang panjang.
Atau, jika pekerjaan mereka menarik perhatian peneliti atau perusahaan lain dengan cara ini, yang mengarah pada penelitian kolaboratif atau pendanaan, ada manfaat praktis juga.
Selain itu, kemungkinan akan ada aliran balik dari pengetahuan AI itu sendiri.
AI generatif memperoleh sejumlah besar pengetahuan melalui pre-training, tetapi tidak secara aktif menjelajahi koneksi tak terduga atau struktur serupa di antara pengetahuan yang luas itu selama pembelajaran.
Hal yang sama berlaku untuk wawasan baru yang muncul dari menghubungkan berbagai potongan pengetahuan.
Di sisi lain, ketika menjelaskan kemiripan dan koneksi tersebut selama percakapan dengan AI generatif yang telah dilatih sebelumnya, AI dapat dengan cukup akurat menilai nilainya.
Oleh karena itu, dengan secara acak atau menyeluruh membandingkan dan menghubungkan berbagai potongan pengetahuan dan memasukkannya ke dalam AI generatif, dimungkinkan untuk menemukan kemiripan tak terduga dan koneksi yang berharga.
Tentu saja, karena ada jumlah kombinasi yang sangat besar, tidak realistis untuk mencakup semuanya. Namun, dengan merampingkan dan mengotomatisasi proses ini secara tepat, menjadi mungkin untuk secara otomatis menemukan pengetahuan yang berguna dari pengetahuan yang ada.
Dengan mencapai penemuan pengetahuan otomatis seperti itu dan menyimpan pengetahuan yang ditemukan di GitHub, tampaknya mungkin untuk mengulang lingkaran ini tanpa batas.
Dengan cara ini, banyak urat pengetahuan yang belum ditemukan ada di dalam tambang intelektual ini, dan akan menjadi mungkin untuk menggalinya.
Kesimpulan
Ketika basis pengetahuan manusia yang dibagikan, yang menjadi standar de facto seperti GitHub, terbentuk, kemungkinan besar basis tersebut akan dimanfaatkan untuk pre-training AI generatif dan untuk pengambilan pengetahuan seperti RAG.
Dalam skenario tersebut, GitHub itu sendiri akan berfungsi seperti otak besar yang raksasa. Dan AI generatif akan berbagi otak besar ini, mendistribusikan dan memperluas pengetahuan sambil membaginya.
Pengetahuan yang dicatat di sana tidak hanya mencakup catatan fakta, data baru, atau klasifikasi. Ini mungkin juga mencakup pengetahuan katalitik yang mendorong penemuan pengetahuan lain atau kombinasi baru.
Saya menyebut pengetahuan dengan efek katalitik semacam itu "kristal intelektual" atau "kristal pengetahuan." Ini termasuk, misalnya, kerangka berpikir baru.
Ketika sebuah kerangka kerja baru ditemukan atau dikembangkan dan kristal intelektual ditambahkan, efek katalitiknya memungkinkan kombinasi dan struktur pengetahuan yang berbeda dari sebelumnya, yang mengarah pada pertumbuhan pengetahuan baru.
Di antara ini, mungkin ada kristal pengetahuan lain. Ini, pada gilirannya, akan semakin meningkatkan pengetahuan.
Pengetahuan semacam itu bukanlah penemuan ilmiah tetapi sesuatu yang lebih dekat dengan penyelidikan matematika, pengembangan teknik, atau penemuan. Oleh karena itu, ini adalah pengetahuan yang tumbuh murni melalui pemikiran, bukan melalui fakta observasi baru seperti pengetahuan ilmiah.
Dan GitHub sebagai tambang intelektual, bersama dengan AI generatif yang tak terhitung jumlahnya yang memanfaatkannya, akan mempercepat pertumbuhan pengetahuan semacam itu.
Pengetahuan yang ditemukan satu demi satu dengan kecepatan yang jauh melebihi skala penemuan manusia akan disediakan dalam bentuk yang mudah kita pahami oleh pabrik-pabrik pengetahuan.
Dengan cara ini, pengetahuan yang dapat dijelajahi murni melalui pemikiran akan digali dengan cepat.