Aby uporządkować artykuły, które napisałem na swój blog, wykorzystałem generatywną AI (Gemini) do stworzenia własnej strony internetowej.
Notatki Badawcze katoshi https://katoshi-mfacet.github.io/
Ta witryna jest automatycznie generowana z moich oryginalnych szkiców artykułów blogowych, napisanych po japońsku.
Jej cechy to:
- Automatyczne generowanie ze szkiców artykułów
- Organizacja artykułów według kategorii i tagów
- Obsługa 30 języków i dostępność
Podstawowy Mechanizm
Podstawowy mechanizm polega na własnoręcznie stworzonym programie bazującym na frameworku Astro, który automatycznie generuje pliki HTML ze szkiców artykułów.
Sam ten program stworzyłem, czatując z Google Gemini.
Dzięki temu mechanizmowi, po napisaniu szkicu artykułu i wykonaniu procesu regeneracji, pliki HTML są automatycznie aktualizowane i odzwierciedlane na tej stronie internetowej.
Kategoryzacja i Tagowanie
Opracowałem również osobny program do kategoryzacji i tagowania.
Program ten przesyła artykuły do Gemini za pośrednictwem API, aby automatycznie je kategoryzować i tagować.
Po dostarczeniu listy kategorii i tagów wraz z artykułem, Gemini interpretuje znaczenie artykułu i umiejętnie sugeruje odpowiednie.
Co więcej, same listy kategorii i tagów są określane przez inny, niestandardowy program, który wyodrębnia je z poprzednich artykułów. Również w tym przypadku wykorzystuję Gemini.
Poprzednie artykuły są kolejno przesyłane do Gemini za pośrednictwem API, które następnie generuje kandydatów na kategorie i tagi. Wyodrębnione kandydatury ze wszystkich artykułów są następnie ponownie przesyłane do Gemini w celu ostatecznego ustalenia kompleksowych list kategorii i tagów.
Cały ten proces jest również automatyzowany przez program.
Tłumaczenie Wielojęzyczne
Tłumaczenie jest kluczowe dla wielojęzyczności. Oczywiście, Gemini jest również wykorzystywane do tego celu.
Istnieją dwa schematy tłumaczenia:
Jeden to tłumaczenie wspólnych ciągów znaków na stronie internetowej, niezależnie od konkretnych artykułów, takich jak nazwy pozycji menu i autoreklamy.
Drugi to tłumaczenie samych szkiców artykułów.
Dla obu tych celów stworzyłem niestandardowy program, który wykorzystuje API Gemini do wykonywania tłumaczeń.
Dostępność
Biorąc pod uwagę użytkowników z wadami wzroku, którzy słuchają treści artykułów za pośrednictwem dźwięku, oraz osoby z trudnościami w obsłudze myszy, które poruszają się po stronach internetowych wyłącznie za pomocą klawiatury, wprowadzenie kilku ulepszeń do plików HTML poprawia dostępność.
Jeśli chodzi o dostępność, miałem bardzo małą wiedzę; Gemini faktycznie zasugerowało te ulepszenia podczas naszej programistycznej rozmowy.
A co do tych modyfikacji HTML w celu zwiększenia dostępności, również nauczyłem się, jak je wdrożyć, rozmawiając z Gemini.
Zanik Ścian
Generatywna sztuczna inteligencja została wykorzystana na różne sposoby do stworzenia tej strony internetowej, w tym do rozwoju programu, przetwarzania języka naturalnego w celu tłumaczenia i organizowania kategorii oraz tagów, a nawet do sugerowania subtelnych kwestii, takich jak dostępność, które mogłem przeoczyć.
Ponadto, dzięki stworzeniu mechanizmu automatycznych aktualizacji po dodaniu artykułów, w tym generowania HTML i przetwarzania języka naturalnego dla kategorii i tagów, udało mi się sprawić, że ta strona internetowa będzie nadal rosła wraz z każdym nowym artykułem.
Poprzez stworzenie tej strony internetowej naprawdę poczułem, jak łatwo można pokonać różne bariery dzięki generatywnej sztucznej inteligencji.
Przede wszystkim jest to bariera językowa. Obsługa 30 języków byłaby tradycyjnie niemożliwa dla osoby indywidualnej, nawet biorąc pod uwagę tłumaczenie.
Dodatkowo istnieją obawy, czy przetłumaczone blogi przekazują zamierzony niuans i czy wyrażenia nie są nienaturalne lub obraźliwe dla native speakerów.
Tłumaczenia generatywnej sztucznej inteligencji potrafią przekazywać niuanse dokładniej i używać bardziej naturalnych wyrażeń niż tradycyjne tłumaczenie maszynowe. Co więcej, przetłumaczony wynik można ponownie wprowadzić do generatywnej sztucznej inteligencji, aby sprawdzić, czy nie zawiera nienaturalnych lub nieodpowiednich sformułowań.
Z perspektywy wielojęzyczności stron internetowych, właściwe obsłużenie elementów, które różnią się sposobem wyrażania w zależności od języka, takich jak daty i jednostki, stanowiło kolejny trudny punkt.
Na przykład, jeśli istnieją 1, 2 i 10 artykułów w trzech odpowiednich kategoriach, w języku japońskim wystarczy po prostu dodać jednostkę "記事" (kiji - artykuł/elementy) po liczbie, np. "1記事" (1 artykuł), "2記事" (2 artykuły), "10記事" (10 artykułów).
Jednak w języku angielskim konieczne jest rozróżnianie formy pojedynczej i mnogiej, np. „1 article”, „2 articles”, „10 articles”. Co więcej, w niektórych językach, jak się donosi, wyrażenia mogą zmieniać się nawet dla małych i dużych liczebników mnogich.
Co więcej, w przypadku języków pisanych od prawej do lewej, takich jak arabski, cały układ strony internetowej musi być naturalny, zgodny z kierunkiem czytania od prawej do lewej. Jeśli w tekście lub obrazach używane są strzałki, należy również rozważyć konieczność ich odwrócenia w poziomie. Te kwestie są również rozwiązywane poprzez sprawdzenie ich przez generatywną sztuczną inteligencję.
Pracując nad wielojęzycznością strony internetowej z generatywną sztuczną inteligencją, byłem w stanie drobiazgowo zająć się szczegółami, które w innym przypadku przeoczyłbym i których nie byłbym w stanie uwzględnić tradycyjnymi metodami.
To samo dotyczy kwestii dostępności. Wcześniej mogłem zapewnić udogodnienia tylko dla osób, które mogły przeglądać stronę internetową w ten sam sposób, co ja.
Jednak generatywna sztuczna inteligencja z łatwością uwzględnia aspekty, których sam bym nie zauważył, lub które mógłbym zrezygnować z implementacji ze względu na nakład pracy.
Chociaż wielojęzyczność i dostępność mogą jeszcze nie być doskonałe, uważam, że jakość jest przytłaczająco wyższa niż to, co mógłbym osiągnąć samodzielnie, poprzez myślenie i badania.
W ten sposób generatywna sztuczna inteligencja usunęła wiele barier w dążeniu do rozpowszechniania informacji za pośrednictwem artykułów blogowych.
Podsumowanie
Jestem inżynierem systemowym z bogatym doświadczeniem w programowaniu. Chociaż nie tworzę stron internetowych w ramach pracy zawodowej, w przeszłości hobbystycznie stworzyłem kilka stron.
Wykorzystując to doświadczenie oraz moje interakcje z generatywną sztuczną inteligencją, byłem w stanie zbudować system automatycznego generowania tej wielojęzycznej witryny blogowej w około dwa tygodnie.
Bez generatywnej sztucznej inteligencji, nigdy nawet nie rozważyłbym wsparcia wielojęzycznego. W tym sensie można powiedzieć, że pokonałem barierę wyobraźni.
Ponadto, biorąc pod uwagę wysiłek związany z kategoryzowaniem i tagowaniem artykułów za każdym razem, gdy są dodawane, jest bardzo prawdopodobne, że przestałbym aktualizować stronę po jej początkowym utworzeniu. Dzięki automatyzacji zapewnionej przez przetwarzanie języka naturalnego przez generatywną sztuczną inteligencję, byłem w stanie pokonać również bariery związane z konserwacją i aktualizacją.
Co więcej, system ten może być zbudowany przez osoby bez doświadczenia w programowaniu lub tworzeniu stron internetowych, takie jak ja. Jeśli przekazałbyś ten artykuł generatywnej sztucznej inteligencji, takiej jak Gemini, i wyraził chęć zbudowania czegoś podobnego, powinna być w stanie poprowadzić Cię przez proces.
Chociaż mógłbym opublikować stworzony przeze mnie program do powszechnego użytku, biorąc pod uwagę, że generatywna sztuczna inteligencja staje się pełnoprawnym inżynierem oprogramowania, najcenniejszą informacją do udostępnienia jest obecnie prawdopodobnie wyjaśnienie pomysłów i mechanizmów, przedstawione w tym artykule, a nie sam program. Pomysły i podstawowe mechanizmy są nawet łatwiejsze do modyfikowania, ulepszania lub łączenia niż programy.
To sugeruje, że podczas gdy bariery w tworzeniu oprogramowania i stron internetowych znikają, znikają również bariery w indywidualnym rozpowszechnianiu informacji.
Technologicznie, internet praktycznie wyeliminował bariery w wymianie informacji, jednak nadal jesteśmy utrudnieni przez takie bariery, jak język i dostępność.
Podczas gdy odbiorcy mogą w pewnym stopniu pokonać niektóre bariery poprzez własne wysiłki, takie jak tłumaczenie maszynowe i zamiana tekstu na mowę, istnieją również części, których nie można pokonać, chyba że nadawca informacji zapewni wsparcie i uwagę.
To właśnie te bariery, które nadawcy informacji muszą pokonać, eliminuje generatywna sztuczna inteligencja.
Nawet jeśli znikną bariery językowe i dostępności, niewątpliwie pojawią się kolejne, takie jak różnice kulturowe, obyczajowe i wartości. Mogą one być jeszcze trudniejsze do pokonania.
Aby jednak pokonać te trudne bariery, musimy najpierw pokonać te, które leżą przed nami. Gdy już dotrzemy do podnóża tych ścian, z pewnością pojawią się nowe pomysły i techniki ich pokonywania.
Być może wkraczamy w erę, w której znikają ściany ze świata. Przez stworzenie tej strony internetowej właśnie to poczułem.