Passer au contenu
Cet article a été traduit du japonais à l'aide de l'IA
Lire en japonais
Cet article est dans le domaine public (CC0). N'hésitez pas à l'utiliser librement. CC0 1.0 Universal

Vers une ère sans murs : Création d'un site de blog en 30 langues

Pour organiser les articles que j'ai rédigés pour mon blog, j'ai utilisé l'IA générative (Gemini) afin de créer mon propre site web.

Notes de recherche de katoshi https://katoshi-mfacet.github.io/

Ce site est généré automatiquement à partir de mes ébauches d'articles de blog originaux, écrits en japonais.

Ses caractéristiques incluent :

  • Génération automatique à partir des ébauches d'articles
  • Organisation des articles par catégorie et étiquetage
  • Prise en charge de 30 langues et de l'accessibilité

Mécanisme de Base

Le mécanisme de base repose sur un programme auto-conçu, basé sur le cadre Astro, qui génère automatiquement des fichiers HTML à partir des ébauches d'articles.

J'ai même créé ce programme moi-même en discutant avec Gemini de Google.

Grâce à ce mécanisme, une fois qu'une ébauche d'article est rédigée et que le processus de régénération est exécuté, les fichiers HTML sont automatiquement mis à jour et reflétés sur ce site web.

Catégorisation et Balisage

J'ai également développé un programme distinct pour la catégorisation et le balisage.

Ce programme transmet les articles à Gemini via une API pour les catégoriser et les baliser automatiquement.

Lorsqu'on lui fournit une liste de catégories et de balises avec l'article, Gemini interprète le sens de l'article et suggère habilement les plus appropriées.

De plus, les listes de catégories et de balises elles-mêmes sont déterminées par un autre programme personnalisé qui les extrait des articles précédents. Là encore, j'utilise Gemini.

Les articles passés sont transmis séquentiellement à Gemini via une API, qui génère ensuite des catégories et des balises candidates. Ces candidats extraits de tous les articles sont ensuite renvoyés à Gemini pour finaliser les listes complètes de catégories et de balises.

L'ensemble de ce processus est également automatisé par le programme.

Traduction Multilingue

La traduction est essentielle pour la multilinguisation. Naturellement, Gemini est également utilisé pour cette tâche.

Il existe deux types de traduction :

L'un concerne la traduction des chaînes de caractères communes au sein du site web, indépendamment des articles spécifiques, comme les noms des éléments de menu et les auto-présentations.

L'autre est la traduction des ébauches d'articles elles-mêmes.

Pour ces deux cas, j'ai créé un programme personnalisé qui utilise l'API de Gemini pour effectuer les traductions.

Accessibilité

En tenant compte des utilisateurs malvoyants qui écoutent le contenu des articles via l'audio, et de ceux qui ont des difficultés à utiliser une souris et naviguent sur les sites web uniquement avec le clavier, l'intégration de plusieurs améliorations dans les fichiers HTML augmente l'accessibilité.

Concernant l'accessibilité, j'avais très peu de connaissances ; c'est Gemini qui m'a suggéré ces améliorations lors de notre discussion de programmation.

Et pour ces modifications HTML visant à améliorer l'accessibilité, j'ai également appris comment les implémenter en discutant avec Gemini.

Disparition des Murs

L'IA générative a été utilisée de diverses manières pour la création de ce site web, y compris le développement de programmes, le traitement du langage naturel pour la traduction et l'organisation des catégories et des balises, et même la suggestion de points subtils comme l'accessibilité que j'aurais pu négliger.

De plus, en créant un mécanisme de mises à jour automatiques lors de l'ajout d'articles, incluant la génération HTML et le traitement du langage naturel pour les catégories et les balises, j'ai pu faire de ce site web un site qui continuera à croître avec chaque nouvel article.

Grâce à la création de ce site web, j'ai vraiment ressenti à quel point diverses barrières peuvent être facilement surmontées avec l'IA générative.

En premier lieu, la barrière linguistique. La prise en charge de 30 langues aurait été absolument impossible pour un individu traditionnellement, même en tenant compte de la traduction.

De plus, il y a des inquiétudes quant à savoir si les blogs traduits transmettent la nuance voulue et si les expressions sont peu naturelles ou offensantes pour les locuteurs natifs.

Les traductions de l'IA générative peuvent transmettre les nuances plus précisément et utiliser des expressions plus naturelles que la traduction automatique traditionnelle. De plus, le résultat traduit peut être réintroduit dans l'IA générative pour vérifier l'absence de formulations peu naturelles ou inappropriées.

Du point de vue de la multilinguisation des sites web, la gestion appropriée des éléments dont l'expression varie selon la langue, tels que les dates et les unités, était un autre point difficile.

Par exemple, s'il y a 1, 2 et 10 articles dans trois catégories respectives, en japonais, il suffit d'ajouter l'unité "記事" (kiji - article/éléments) après le compte, comme "1記事" (1 article), "2記事" (2 articles), "10記事" (10 articles).

Cependant, en anglais, il est nécessaire de distinguer les formes singulier et pluriel, comme "1 article", "2 articles", "10 articles". De plus, dans certaines langues, les expressions peuvent apparemment changer même pour des nombres pluriels petits ou grands.

De plus, pour les langues comme l'arabe qui s'écrivent de droite à gauche, la mise en page complète du site web doit être naturelle, en suivant le sens de lecture du lecteur de droite à gauche. Si des flèches sont utilisées dans le texte ou les images, la nécessité de les inverser horizontalement doit également être prise en compte. Ces points sont également traités en les faisant vérifier par l'IA générative.

En travaillant sur la multilinguisation du site web avec l'IA générative, j'ai pu aborder méticuleusement des détails que j'aurais négligés et que je n'aurais pas pu prendre en compte avec les méthodes traditionnelles.

Il en va de même pour les considérations d'accessibilité. Auparavant, je ne pouvais prendre en compte que les personnes qui pouvaient consulter le site web de la même manière que moi.

Cependant, l'IA générative intègre facilement des considérations que je ne remarquerais pas, ou que j'hésiterais à aborder en raison de l'effort que cela impliquerait.

Bien que la multilinguisation et l'accessibilité ne soient peut-être pas encore parfaites, je crois que la qualité est nettement supérieure à ce que j'aurais pu obtenir en réfléchissant et en recherchant par moi-même.

C'est ainsi que l'IA générative a éliminé de nombreuses barrières à l'effort de diffusion d'informations par le biais d'articles de blog.

Conclusion

Je suis ingénieur système avec une vaste expérience en programmation. Bien que je ne crée pas de sites web dans le cadre de mon travail, j'ai réalisé plusieurs pages d'accueil en tant que hobby par le passé.

En tirant parti de cette expérience et de mes interactions avec l'IA générative, j'ai pu construire le système de génération automatisée pour ce site de blog multilingue en environ deux semaines.

Sans l'IA générative, je n'aurais même jamais envisagé le support multilingue. En ce sens, on peut dire que j'ai surmonté la barrière de l'imagination.

De plus, compte tenu de l'effort que représente la catégorisation et le balisage des articles à chaque ajout, il est fort probable que j'aurais cessé de mettre à jour le site après sa création initiale. Grâce à l'automatisation fournie par le traitement du langage naturel de l'IA générative, j'ai également pu surmonter les barrières de maintenance et de mise à jour.

De surcroît, ce système peut être construit par des personnes n'ayant aucune expérience en programmation ou en création de sites web, comme moi. Si vous présentiez cet article à une IA générative comme Gemini et exprimiez votre désir de construire quelque chose de similaire, elle devrait être en mesure de vous guider tout au long du processus.

Bien que je pourrais publier le programme que j'ai créé pour une utilisation généralisée, étant donné que l'IA générative est en passe de devenir un ingénieur logiciel à part entière, l'information la plus précieuse à partager maintenant est probablement l'explication des idées et des mécanismes, tels que présentés dans cet article, plutôt que le programme lui-même. Les idées et les mécanismes fondamentaux sont encore plus faciles à modifier, à améliorer ou à combiner que les programmes.

Cela suggère que, tandis que les barrières au développement logiciel et à la création de sites web disparaissent, il en va de même pour les barrières à la diffusion d'informations individuelles.

Sur le plan technologique, l'internet a pratiquement éliminé les barrières à l'échange d'informations, mais nous sommes toujours entravés par des barrières telles que la langue et l'accessibilité.

Si les destinataires peuvent surmonter certaines barrières dans une certaine mesure grâce à leurs propres efforts, comme la traduction automatique et la synthèse vocale, il y a aussi des parties qui ne peuvent être surmontées que si l'émetteur d'informations apporte son soutien et sa considération.

Ce sont précisément ces barrières que les émetteurs d'informations doivent surmonter que l'IA générative élimine.

Même si les barrières linguistiques et d'accessibilité disparaissent, il y aura sans aucun doute d'autres barrières telles que les différences de culture, de coutumes et de valeurs. Celles-ci pourraient être encore plus difficiles à surmonter.

Cependant, pour surmonter ces barrières difficiles, nous devons d'abord surmonter celles qui se dressent devant elles. Une fois que nous atteindrons le pied de ces murs, de nouvelles idées et techniques pour les franchir émergeront sûrement.

Il se pourrait que nous entrions dans une ère où les murs disparaissent du monde. C'est précisément ce que j'ai ressenti à travers la création de ce site web.