Перейти к содержимому
Эта статья была переведена с японского с помощью ИИ
Читать на японском
Эта статья находится в общественном достоянии (CC0). Чувствуйте себя свободно использовать ее. CC0 1.0 Universal

GitHub как интеллектуальный рудник

Знакомы ли вы с GitHub — веб-сервисом, который использовался как платформа для совместной разработки среди разработчиков открытого программного обеспечения?

В последние годы его использование в качестве платформы для совместной работы расширилось, охватывая не только программное обеспечение с открытым исходным кодом, но и корпоративную разработку ПО, а также цели, не связанные с разработкой программного обеспечения.

Я также использую GitHub для управления собственными программами и черновиками статей, которые пишу для этого блога.

В этой статье я рассмотрю возможность того, что использование GitHub в будущем будет все шире выходить за рамки разработки программного обеспечения, становясь местом для открытого обмена знаниями.

Генерация вики-сайтов с помощью DeepWiki

Многие инструменты для разработки программного обеспечения, использующие генеративный ИИ, предназначены для помощи в программировании человеку. Люди пишут программы, а ИИ оказывает поддержку.

С другой стороны, появляется новый тип инструментов для разработки ПО, где люди только дают инструкции, а генеративный ИИ берет на себя задачу по созданию программ.

Devin — один из таких инструментов, который стал пионером и привлек к себе внимание. Некоторые даже говорили, что внедрение Devin было похоже на добавление еще одного программиста в команду разработчиков. Хотя по-прежнему считается, что для эффективного использования человеческим инженерам требуется детальная поддержка, такие данные, безусловно, будут собираться и использоваться для улучшений.

Эпоха, когда команды разработчиков программного обеспечения будут состоять из одного человека и программистов-ИИ, таких как Devin, в качестве членов команды, уже не за горами.

Компания Cognition, разработчик Devin, также выпустила сервис под названием DeepWiki.

DeepWiki — это сервис, который автоматически генерирует вики-сайт для каждого проекта разработки программного обеспечения на GitHub. Это означает, что ИИ, подобный Devin, читает и анализирует все программы и связанные документы этого проекта и создает все руководства и проектную документацию.

Сообщается, что Cognition создала вики-сайты для более чем 50 000 крупных публичных проектов разработки программного обеспечения на GitHub, которые свободно доступны для любого желающего, используя DeepWiki.

Поскольку это публичные проекты, в этом абсолютно нет никаких проблем. Хотя вики-сайты могут генерироваться автоматически, для этого, должно быть, потребовалось, чтобы многочисленные генеративные ИИ работали на полную мощность в течение длительного периода, и затраты, должно быть, были значительными.

Понеся эти расходы, Cognition предоставила огромную выгоду огромному числу публичных проектов, позволив им бесплатно получать пояснения и проектную документацию.

Если статистические данные покажут, что эти вики-сайты полезны для каждого публичного проекта и оказывают значительное влияние на повышение качества и производительности, то компании-разработчики программного обеспечения будут внедрять DeepWiki для своих собственных проектов.

Cognition, должно быть, инвестировала в создание вики-сайтов для огромного числа публичных проектов, полагая, что это может произойти. Это демонстрирует уверенность Cognition в DeepWiki. И когда DeepWiki будет внедрен, Devin автоматически последует за ним, значительно увеличивая вероятность широкого внедрения программистов-ИИ.

GitHub как платформа для обмена документами

GitHub стал популярным веб-сервисом и де-факто стандартом для совместного использования, редактирования и хранения программ в рамках разработки программного обеспечения с открытым исходным кодом.

В последние годы его функции управления и безопасности для предприятий были улучшены, что сделало его распространенным инструментом в передовых компаниях, занимающихся разработкой программного обеспечения.

По этой причине GitHub прочно ассоциируется с веб-сервисом для хранения и обмена программами. Однако в действительности его можно использовать для обмена, совместного редактирования и хранения различных документов и материалов, совершенно не связанных с программами.

Поэтому немало людей используют GitHub для управления документами, которые они хотят широко редактировать совместно. Это могут быть как документы, связанные с программным обеспечением, так и совершенно не связанные с ним.

Более того, блоги и веб-сайты также являются документами, которые содержат своего рода программу или структурируются и публикуются с помощью программ.

Из-за этого нередко отдельные лица и компании хранят содержимое блогов и веб-сайтов, а также программы, которые делают их удобными для просмотра, и программы для автоматической генерации сайтов, вместе как единый проект на GitHub.

Также возможно сделать такие блоги и веб-сайты публичными проектами на GitHub для совместного редактирования их содержимого.

Кроме того, в последнее время генеративный ИИ не только используется для разработки программного обеспечения, но и часто интегрируется в программное обеспечение.

В этом случае инструкции, называемые промптами, которые дают подробные указания генеративному ИИ, встраиваются в программы.

Эти промпты также можно рассматривать как тип документа.

Интеллектуальная фабрика

Хотя я инженер-разработчик программного обеспечения, я также пишу статьи для своего блога.

Хотя я хочу, чтобы их читало много людей, увеличить число читателей довольно сложно.

Конечно, можно было бы рассмотреть создание статей для привлечения внимания или активное обращение к влиятельным людям за советом, среди прочих усилий и изобретательности.

Однако, учитывая мою личность, а также затраты усилий и стресс, я неохотно занимаюсь агрессивным продвижением. Более того, трата времени на такую деятельность отвлекла бы меня от основной работы, которая включает программирование, обдумывание идей и их документирование.

Поэтому недавно я решил попробовать стратегию, известную как мультимедиа или омниканальность, которая предполагает расширение охвата моих публикаций в блоге путем их преобразования в различные формы контента.

В частности, это включает перевод японских статей на английский язык и их публикацию на англоязычных блог-сайтах, а также создание презентационных видеороликов для объяснения статей и их публикацию на YouTube.

Кроме того, помимо публикации на общих блог-сервисах, я также рассматриваю возможность создания собственного блог-сайта, который будет перечислять и категоризировать мои прошлые публикации, а также связывать связанные статьи.

Если бы я тратил время на создание всего этого каждый раз при написании новой статьи, это было бы контрпродуктивно. Поэтому все задачи, кроме написания исходной статьи на японском языке, автоматизированы с использованием генеративного ИИ. Я называю это интеллектуальной фабрикой.

Мне нужно разработать программы для реализации этого механизма.

В настоящее время я уже создал программы, которые могут полностью автоматизировать перевод, генерацию презентационных видеороликов и загрузку на YouTube.

Сейчас я нахожусь в процессе создания базовых программ для категоризации и связывания существующих записей в блоге.

Как только это будет завершено, и я создам программу для генерации моего собственного блог-сайта и автоматического его отображения на веб-сервере, первоначальная концепция моей интеллектуальной фабрики будет завершена.

Интеллектуальная фабрика в широком смысле

Черновики моих статей в блоге, которые служат сырьем для этой интеллектуальной фабрики, также управляются как проект GitHub. На данный момент они являются частными и не общедоступны, но я рассматриваю возможность сделать их общедоступными проектами вместе с программами интеллектуальной фабрики в будущем.

И категоризация записей в блоге, связывание статей и объяснение преобразованных в видео записей в блоге, которые я сейчас разрабатываю, имеют ту же основную концепцию, что и DeepWiki.

Используя генеративный ИИ, из оригинальных творческих работ как сырья производится различное содержимое. Кроме того, он может связывать информацию и знания внутри них, эффективно создавая базу знаний.

Единственное отличие заключается в том, является ли сырье программой или записью в блоге. И для DeepWiki и моей интеллектуальной фабрики, работающей на основе генеративного ИИ, эта разница почти бессмысленна.

Другими словами, если термин «интеллектуальная фабрика» интерпретировать в общем, более широком смысле, не ограничиваясь моей программой, то DeepWiki также является типом интеллектуальной фабрики.

И то, что производят интеллектуальные фабрики, не ограничивается переведенными статьями на других языках, презентационными видеороликами, самодельными блогами или вики-сайтами.

Они, вероятно, смогут преобразовывать контент во все мыслимые носители и форматы, такие как короткие видеоролики, твиты, комиксы, анимация, подкасты и электронные книги.

Кроме того, содержимое этих носителей и форматов также может быть диверсифицировано в соответствии с получателем, например, более широкая многоязычная поддержка, версии для экспертов или новичков, а также версии для взрослых или детей.

Более того, даже генерация персонализированного контента по запросу достижима.

GitHub как интеллектуальный рудник

Сырье для интеллектуальной фабрики в принципе может располагаться где угодно.

Однако, учитывая, что GitHub стал де-факто стандартом для совместного использования, редактирования и хранения программ с открытым исходным кодом, и что многие люди, не только я, используют GitHub для хранения документов, становится очевидным, что GitHub имеет потенциал стать основным источником сырья для интеллектуальных фабрик.

Иными словами, GitHub станет общим интеллектуальным рудником для человечества, поставляя сырье интеллектуальным фабрикам.

Термин «разделяемое человечеством» здесь перекликается с идеей о том, что проекты с открытым исходным кодом являются общим программным активом для человечества.

Философия открытого исходного кода, лежащая в основе GitHub, также хорошо впишется в концепцию открытых документов.

Более того, может возникнуть культура управления информацией об авторских правах и лицензиях для каждого документа, аналогично программам. Содержимому, автоматически сгенерированному из исходных документов, можно легко присвоить ту же лицензию или обеспечить соответствие правилам, предусмотренным лицензией.

С точки зрения разработки интеллектуальной фабрики, централизация исходных документов на GitHub является идеальным решением.

Это дает два преимущества: повышение эффективности разработки за счет простого подключения GitHub к интеллектуальной фабрике и возможность эффективно демонстрировать функции и производительность собственной интеллектуальной фабрики с использованием общедоступных документов, аналогично DeepWiki.

В будущем, по мере того как будут разрабатываться различные интеллектуальные фабрики и они смогут подключаться к GitHub, и по мере того как все больше людей и компаний будут управлять документами на GitHub и обрабатывать их с помощью интеллектуальных фабрик, положение GitHub как интеллектуального рудника должно прочно утвердиться.

Общедоступная база знаний человечества

С GitHub в центре как интеллектуальным рудником, а также с различными содержимым и базами знаний, производимыми интеллектуальными фабриками, вся эта экосистема создаст общедоступную базу знаний, разделяемую человечеством.

Более того, это динамичная и обновляемая в реальном времени база знаний, которая будет автоматически расширяться по мере увеличения числа документов, опубликованных на GitHub.

Хотя эта обширная и сложная база знаний, содержащая огромное количество информации, будет полезна людям, извлечь ее потенциальную ценность в полной мере будет трудно.

Однако ИИ сможет полностью использовать эту общедоступную базу знаний, разделяемую всем человечеством.

Жилы публичных знаний

Если такая экосистема будет реализована, различная общедоступная информация естественным образом будет стекаться на GitHub.

Это не будет ограничиваться черновиками личных блогов или корпоративных веб-сайтов.

Также будут накапливаться академические идеи и данные, такие как предпубликационные статьи и исследовательские идеи, экспериментальные данные и результаты опросов.

Это привлечет не только тех, кто хочет использовать знания, идеи и данные на благо всего человечества, но и тех, кто желает быстро распространить свои открытия и получить признание.

Даже для ученых и исследователей многие найдут ценность в том, чтобы их работа была проверена ИИ на достоверность, новизну и влияние, выражена в различных форматах контента и получила вирусное признание, не дожидаясь длительного процесса рецензирования.

В качестве альтернативы, если их работа таким образом привлечет внимание других исследователей или компаний, что приведет к совместным исследованиям или финансированию, это также принесет практическую выгоду.

Кроме того, вероятно, будет обратный поток собственных знаний ИИ.

Генеративный ИИ приобретает огромные объемы знаний в процессе предварительного обучения, но он не активно исследует неожиданные связи или схожие структуры между этими обширными знаниями во время обучения.

То же самое относится и к новым идеям, которые возникают в результате соединения различных фрагментов знаний.

С другой стороны, объясняя такие сходства и связи во время бесед с предварительно обученным генеративным ИИ, он может довольно точно оценивать их ценность.

Поэтому, случайно или исчерпывающе сравнивая и связывая различные фрагменты знаний и вводя их в генеративный ИИ, можно обнаружить неожиданные сходства и ценные связи.

Конечно, поскольку существует огромное количество комбинаций, нереально охватить их все. Однако, путем соответствующего упрощения и автоматизации этого процесса, становится возможным автоматически обнаруживать полезные знания из существующих знаний.

Достигнув такого автоматического открытия знаний и сохраняя обнаруженные знания на GitHub, кажется возможным повторять этот цикл бесконечно.

Таким образом, в этом интеллектуальном руднике существует множество неразведанных жил знаний, и станет возможным их добыча.

Заключение

По мере того как GitHub утвердится в качестве де-факто стандарта, общей базы знаний человечества, он, вероятно, будет использоваться для предварительного обучения генеративного ИИ и для извлечения знаний, как в RAG.

В таком сценарии сам GitHub будет функционировать как гигантский мозг. А генеративный ИИ будет делиться этим мозгом, распределяя и расширяя знания, одновременно используя их совместно.

Знания, дополнительно записанные там, будут включать не только записи фактов, новые данные или классификации. Они также могут включать каталитические знания, которые способствуют открытию других знаний или новых комбинаций.

Я называю такие знания с каталитическим эффектом «интеллектуальными кристаллами» или «кристаллами знаний». Это включает, например, новые рамки для мышления.

Когда фреймворк вновь открывается или разрабатывается и добавляется интеллектуальный кристалл, его каталитический эффект позволяет создавать и структурировать знания по-другому, чем раньше, что приводит к росту новых знаний.

Среди них могут быть и другие кристаллы знаний. Это, в свою очередь, еще больше увеличит объем знаний.

Такие знания не являются научным открытием, но ближе к математическому исследованию, инженерной разработке или изобретению. Следовательно, это знания, которые растут чисто через мысль, а не через новые наблюдательные факты, как научные знания.

И GitHub как интеллектуальный рудник, наряду с бесчисленными генеративными ИИ, использующими его, ускорит рост таких знаний.

Знания, открываемые одно за другим со скоростью, намного превышающей человеческий масштаб открытий, будут предоставляться фабриками знаний в форме, легкой для нашего понимания.

Таким образом, знания, которые можно исследовать чисто через мысль, будут быстро извлекаться.