Перейти к содержимому
Эта статья была переведена с японского с помощью ИИ
Читать на японском
Эта статья находится в общественном достоянии (CC0). Чувствуйте себя свободно использовать ее. CC0 1.0 Universal

На пути к эпохе без барьеров: создание блога на 30 языках

Для систематизации статей, написанных для моего блога, я использовал генеративный ИИ (Gemini) для создания собственного веб-сайта.

Заметки Катоши по исследованиям https://katoshi-mfacet.github.io/

Этот сайт автоматически генерируется из моих черновиков статей, написанных на японском языке.

Его особенности включают:

  • Автоматическая генерация из черновиков статей
  • Организация статей по категориям и тегам
  • Поддержка 30 языков и доступность

Базовый механизм

Базовый механизм включает в себя самостоятельно созданную программу, основанную на фреймворке Astro, которая автоматически генерирует HTML-файлы из черновиков статей.

Эту программу я создал в процессе общения с Google Gemini.

Благодаря этому механизму, как только черновик статьи написан и запущен процесс регенерации, HTML-файлы автоматически обновляются и отображаются на этом веб-сайте.

Категоризация и тегирование

Я также разработал отдельную программу для категоризации и тегирования.

Эта программа передает статьи Gemini через API для их автоматической категоризации и тегирования.

При предоставлении списка категорий и тегов вместе со статьей Gemini интерпретирует смысл статьи и умело предлагает подходящие варианты.

Более того, сами списки категорий и тегов определяются другой пользовательской программой, которая извлекает их из прошлых статей. Здесь я также использую Gemini.

Прошлые статьи последовательно передаются Gemini через API, которая затем выводит предлагаемые категории и теги. Эти извлеченные предложения из всех статей затем возвращаются Gemini для окончательного формирования полных списков категорий и тегов.

Весь этот процесс также автоматизирован программой.

Многоязычный перевод

Перевод необходим для многоязычности. Естественно, для этого также используется Gemini.

Существует две модели перевода:

Одна — это перевод общих строк на веб-сайте, независимых от конкретных статей, таких как названия пунктов меню и самопрезентации.

Другая — это перевод самих черновиков статей.

Для обоих случаев я создал собственную программу, которая использует API Gemini для выполнения переводов.

Доступность

Учитывая пользователей с нарушениями зрения, которые прослушивают содержимое статей с помощью аудио, и тех, кто испытывает трудности с использованием мыши и просматривает веб-сайты исключительно с помощью клавиатуры, внедрение нескольких улучшений в HTML-файлы повышает доступность.

Что касается доступности, у меня было очень мало знаний; Gemini фактически предложил эти улучшения во время нашего чата по программированию.

И для этих модификаций HTML, направленных на повышение доступности, я также узнал, как их реализовать, общаясь с Gemini.

Исчезновение стен

Генеративный ИИ использовался по-разному при создании этого веб-сайта, включая разработку программ, обработку естественного языка для перевода и организации категорий и тегов, и даже для предложения тонких моментов, таких как доступность, которые я мог бы упустить из виду.

Более того, создав механизм для автоматических обновлений при добавлении статей, включая генерацию HTML и обработку естественного языка для категорий и тегов, я смог сделать этот веб-сайт таким, который будет продолжать расти с каждой новой статьей.

Благодаря созданию этого веб-сайта я по-настоящему почувствовал, насколько легко можно преодолеть различные барьеры с помощью генеративного ИИ.

В первую очередь, это языковой барьер. Поддержка 30 языков традиционно была бы совершенно невозможна для одного человека, даже с учетом перевода.

Кроме того, существуют опасения относительно того, передают ли переведенные блоги предполагаемый нюанс и не являются ли выражения неестественными или оскорбительными для носителей языка.

Переводы генеративного ИИ могут передавать нюансы более точно и использовать более естественные выражения, чем традиционный машинный перевод. Более того, переведенный вывод можно повторно ввести в генеративный ИИ для проверки на неестественные или неуместные формулировки.

С точки зрения многоязычности веб-сайта, правильная обработка элементов, которые различаются в выражении в зависимости от языка, таких как даты и единицы измерения, была еще одним сложным моментом.

Например, если в трех соответствующих категориях по 1, 2 и 10 статей, то в японском языке достаточно просто добавить единицу измерения "記事" (кидзи — статья/пункт) после числа, например "1記事" (1 статья), "2記事" (2 статьи), "10記事" (10 статей).

Однако в английском языке необходимо различать формы единственного и множественного числа, например «1 article» (1 статья), «2 articles» (2 статьи), «10 articles» (10 статей). Кроме того, в некоторых языках, как сообщается, выражения могут меняться даже для небольшого и большого количества во множественном числе.

Более того, для языков, таких как арабский, которые пишутся справа налево, весь макет веб-сайта должен быть естественным, следуя линии взгляда читателя справа налево. Если в тексте или изображениях используются стрелки, необходимо также рассмотреть необходимость их горизонтального отражения. Эти моменты также решаются с помощью генеративного ИИ.

Работая над многоязычием веб-сайта с генеративным ИИ, я смог тщательно учесть детали, которые я бы упустил и не смог бы учесть традиционными методами.

То же самое относится и к соображениям доступности. Раньше я мог предоставлять соображения только для людей, которые могли просматривать веб-сайт так же, как и я.

Однако генеративный ИИ легко включает соображения, которые я бы не заметил или которые я мог бы не решиться рассматривать из-за требуемых усилий.

Хотя многоязычие и доступность, возможно, еще не идеальны, я считаю, что качество значительно выше, чем то, что я мог бы достичь, думая и исследуя самостоятельно.

Таким образом, генеративный ИИ устранил множество барьеров на пути распространения информации через статьи в блоге.

Заключение

Я системный инженер с большим опытом программирования. Хотя я не создаю веб-сайты для работы, в прошлом я несколько раз делал домашние страницы в качестве хобби.

Используя этот опыт и мои взаимодействия с генеративным ИИ, я смог создать автоматизированную систему генерации этого многоязычного блога примерно за две недели.

Без генеративного ИИ я бы даже не подумал о многоязычной поддержке. В этом смысле можно сказать, что я преодолел барьер воображения.

Более того, учитывая усилия, связанные с категоризацией и тегированием статей каждый раз при их добавлении, весьма вероятно, что я бы перестал обновлять сайт после его первоначального создания. Благодаря автоматизации, обеспечиваемой обработкой естественного языка генеративным ИИ, я смог преодолеть также барьеры обслуживания и обновления.

Кроме того, эту систему могут создать и люди без опыта программирования или создания веб-сайтов, такие как я. Если вы передадите эту статью генеративному ИИ, например Gemini, и выразите свое желание создать что-то подобное, он должен будет провести вас через весь процесс.

Хотя я мог бы опубликовать созданную мной программу для широкого использования, учитывая, что генеративный ИИ становится полноценным инженером-программистом, наиболее ценной информацией для обмена сейчас, вероятно, является объяснение идей и механизмов, представленное в этой статье, а не сама программа. Идеи и фундаментальные механизмы еще легче изменять, улучшать или комбинировать, чем программы.

Это говорит о том, что, хотя барьеры для разработки программного обеспечения и создания веб-сайтов исчезают, исчезают и барьеры для индивидуального распространения информации.

Технологически Интернет практически устранил барьеры для обмена информацией, однако мы по-прежнему сталкиваемся с такими барьерами, как язык и доступность.

Хотя получатели могут в некоторой степени преодолеть некоторые барьеры собственными усилиями, например, с помощью машинного перевода и преобразования текста в речь, есть также части, которые нельзя преодолеть, если отправитель информации не обеспечит поддержку и внимание.

Именно эти барьеры, которые должны преодолевать отправители информации, устраняет генеративный ИИ.

Даже если исчезнут барьеры языка и доступности, несомненно, появятся новые барьеры, такие как различия в культуре, обычаях и ценностях. Их может быть еще труднее преодолеть.

Однако, чтобы преодолеть эти трудные барьеры, мы должны сначала преодолеть те, что лежат перед ними. Как только мы достигнем подножия этих стен, непременно появятся новые идеи и методы для их преодоления.

Возможно, мы вступаем в эпоху, когда стены исчезают из мира. Именно это я почувствовал, создавая этот веб-сайт.