Перейти до вмісту
Ця стаття була перекладена з японської мови за допомогою ШІ
Читати японською
Ця стаття знаходиться в суспільному надбанні (CC0). Ви можете вільно використовувати її. CC0 1.0 Universal

Вступаємо в еру без кордонів: Створення блог-сайту 30 мовами

Я використав генеративний ШІ (Gemini), щоб створити власний вебсайт для упорядкування статей, які я написав для свого блогу.

Наукові записки Катоші https://katoshi-mfacet.github.io/

Цей сайт автоматично генерується з чорнових записів блогу, написаних японською мовою.

Його особливості:

  • Автоматичне генерування з чернеток статей
  • Організація статей за категоріями та тегами
  • Підтримка 30 мов та доступність

Базовий механізм

Базовий механізм включає власну програму, побудовану на фреймворку Astro, яка автоматично генерує HTML-файли з чернеток статей.

Я розробив цю програму, спілкуючись з Google Gemini.

Завдяки цьому механізму, як тільки я пишу чернетку статті та запускаю процес регенерації, HTML-файли автоматично оновлюються та відображаються на вебсайті.

Категоризація та тегування

Я також розробив окрему програму для категоризації та тегування.

Ця програма передає статті Gemini через API для автоматичної категоризації та тегування.

Надаючи список категорій і тегів разом зі статтею, Gemini інтерпретує значення статті та вміло пропонує відповідні.

Крім того, самі списки категорій і тегів визначаються шляхом їх вилучення з попередніх статей за допомогою іншої спеціальної програми. Тут також використовується Gemini.

Попередні статті послідовно передаються Gemini через API для виведення кандидатів категорій та тегів. Потім ці кандидати категорій та тегів, вилучені з усіх статей, передаються Gemini для остаточного формування списків категорій та тегів.

Весь цей процес також автоматизовано за допомогою програми.

Багатомовний переклад

Для багатомовної підтримки необхідний переклад. Звісно, для цього перекладу також використовується Gemini.

Існує два шаблони перекладу:

Один — це переклад рядків, спільних для всього вебсайту, незалежно від статті. Сюди входять назви пунктів меню, самопрезентації та інші подібні тексти.

Інший — це переклад самих чернеток статей.

Для обох цих типів перекладу я створив власну програму, яка виконує переклади за допомогою API Gemini.

Доступність

Доступність покращується шляхом додавання кількох функцій до HTML-файлів, враховуючи, що люди з вадами зору можуть захотіти слухати вміст статті через аудіо, або ті, хто має труднощі з використанням миші, можуть захотіти переглядати вебсайт лише за допомогою клавіатури.

Я мав дуже мало знань про доступність; саме Gemini запропонував ці покращення під час нашої розмови про програмування.

І щодо цих змін до HTML для покращення доступності, я запитав Gemini, як їх реалізувати під час нашого чату, і застосував модифікації.

Зникнення бар'єрів

Генеративний ШІ був використаний різними способами для створення цього вебсайту, включаючи створення програм, обробку природної мови для перекладу та організації категорій і тегів, а також пропозиції тонких моментів, таких як доступність.

Крім того, створивши систему для автоматичних оновлень при додаванні статей, включаючи генерацію HTML та обробку природної мови для категорій і тегів, я зміг створити вебсайт, який зростає з кожною новою статтею.

Завдяки створенню цього вебсайту я справді відчув, що різні бар'єри тепер можна легко подолати за допомогою генеративного ШІ.

По-перше, це мовний бар'єр. Підтримка 30 мов традиційно була б неможливою для однієї людини, навіть враховуючи переклад.

Крім того, існують побоювання щодо того, чи передають перекладені блоги задумані нюанси, і чи не можуть вирази бути незграбними або образливими для носіїв мови.

Переклад генеративного ШІ може передавати нюанси точніше та використовувати більш природні вирази, ніж традиційний машинний переклад. Більше того, перекладений результат можна повернути до генеративного ШІ, щоб перевірити на наявність неприродних або недоречних фраз.

З точки зору багатомовності вебсайту, належна обробка таких елементів, як дати та одиниці виміру, які відрізняються у вираженні в різних мовах, була викликом.

Наприклад, якщо є одна стаття в першій категорії, дві в другій і десять у третій, японською мовою це просто "1記事 (1 стаття), 2記事 (2 статті), 10記事 (10 статей)", додаючи одиницю "記事" після числа.

Однак, в англійській мові потрібно розрізняти однину та множину, наприклад "1 article, 2 articles, 10 articles". Крім того, в деяких мовах вирази можуть змінюватися для малих множинних чисел порівняно з великими множинними числами.

Більше того, для таких мов, як арабська, які пишуться справа наліво, потрібно також врахувати, щоб весь макет вебсайту відповідав руху очей читача справа наліво для природного потоку. Якщо в тексті чи зображеннях використовуються стрілки, їх, можливо, доведеться перевернути горизонтально. Ці моменти також вирішуються за допомогою генеративного ШІ, який їх перевіряє.

Працюючи над багатомовністю вебсайту з генеративним ШІ, я зміг ретельно розглянути аспекти, які залишилися б непоміченими або нерозглянутими традиційними методами.

Те саме стосується міркувань доступності. Раніше я міг розглядати лише тих, хто переглядає вебсайти так само, як і я.

Однак, генеративний ШІ легко враховує міркування, які я міг би не помітити, або якими я міг би знехтувати через необхідні зусилля.

Хоча багатомовність та доступність все ще не ідеальні, я вважаю, що їхня якість є значно вищою, ніж те, що я міг би досягти, думаючи та досліджуючи самостійно.

Таким чином, генеративний ШІ усунув багато бар'єрів для моїх зусиль з розповсюдження інформації через статті в блозі.

Нарешті

Я системний інженер з великим досвідом програмування. Хоча я не створюю вебсайти для роботи, у минулому я створював кілька особистих домашніх сторінок як хобі.

Завдяки цьому досвіду та взаємодії в чаті з генеративним ШІ, мені вдалося створити цю автоматизовану багатомовну систему генерації блог-сайту приблизно за два тижні.

Без генеративного ШІ я б навіть не розглядав багатомовну підтримку. У цьому сенсі можна сказати, що він подолав бар'єр уяви.

Крім того, враховуючи зусилля з категоризації та тегування кожного разу при додаванні статті, дуже ймовірно, що сайт перестав би оновлюватися після його початкового створення. Завдяки автоматизації, що стала можливою завдяки обробці природної мови генеративним ШІ, мені вдалося подолати бар'єри підтримки та оновлень.

Більше того, цю систему можуть створити навіть люди без досвіду програмування чи створення вебсайтів, як я. Якщо ви покажете цю статтю генеративному ШІ, такому як Gemini, і висловите бажання створити такий, він повинен навчити вас, як це зробити.

Хоча я міг би випустити свою програму для широкого використання, тепер, коли генеративний ШІ стає повноцінним інженером-програмістом, найціннішою інформацією для обміну буде не сама програма, а скоріше пояснення ідей та механізмів, як ця стаття. Ідеї та базові механізми можна змінювати, покращувати та комбінувати навіть легше, ніж програми.

Це свідчить про те, що зі зникненням бар'єрів у розробці програмного забезпечення та створенні вебсайтів, зникнуть і бар'єри для індивідуального поширення інформації.

Технологічно, Інтернет фактично усунув бар'єр обміну інформацією, проте ми все ще стикаємося з такими бар'єрами, як мова та доступність.

Хоча ми можемо певною мірою подолати ці бар'єри завдяки винахідливості одержувача за допомогою машинного перекладу та синтезу мовлення, є також частини, які неможливо подолати, якщо відправник інформації не вживе заходів та не проявить уваги.

Генеративний ШІ усуває саме ті бар'єри, які повинні подолати відправники інформації.

Навіть якщо зникнуть мовні бар'єри та бар'єри доступності, безсумнівно, виникнуть подальші бар'єри, такі як відмінності в культурі, звичаях та цінностях. Їх може бути ще важче подолати.

Однак, щоб подолати ці складні бар'єри, ми повинні спочатку подолати ті, що передують їм. Як тільки ми опинимося прямо перед таким бар'єром, ймовірно, з'являться нові ідеї та техніки для його подолання.

Таким чином, ми, можливо, наближаємося до епохи, коли бар'єри зникають зі світу. Це те, що я відчув під час створення цього вебсайту.