跳到内容
本文已通过AI从日语翻译
阅读日语原文
本文属于公共领域(CC0)。请随意自由使用。 CC0 1.0 Universal

走向无壁垒时代:创建一个30种语言的博客网站

为了整理我为博客撰写的文章,我利用生成式AI(Gemini)创建了自己的网站。

katoshi的研究笔记 https://katoshi-mfacet.github.io/

这个网站是根据我用日语撰写的博客文章原稿自动生成的。

其特点包括:

  • 从文章原稿自动生成
  • 通过分类和标签整理文章
  • 支持30种语言和辅助功能

基本机制

其基本机制涉及一个基于Astro框架的自制程序,该程序能自动从文章草稿生成HTML文件。

这个程序本身也是我在与谷歌的Gemini聊天过程中创建的。

得益于这一机制,一旦文章草稿撰写完毕并执行了再生成处理,HTML文件就会自动更新并反映在这个网站上。

分类与标签

我还开发了另一个用于分类和标签的程序。

该程序通过API将文章传递给Gemini,由Gemini自动进行分类和标签。

当与文章一同提供分类和标签列表时,Gemini会解读文章的含义并巧妙地推荐合适的选项。

此外,分类和标签列表本身也是由另一个自定义程序从过往文章中提取并确定的。在这方面,我也利用了Gemini。

通过API,过往文章会依次传递给Gemini,Gemini随后输出分类和标签的候选列表。然后,将所有文章中提取出的这些候选列表再次输入给Gemini,以最终确定全面的分类和标签列表。

整个过程也由程序自动完成。

多语言翻译

多语言化离不开翻译。当然,Gemini也用于此翻译工作。

翻译有两种模式:

一种是网站内部通用字符串的翻译,与具体文章无关,例如菜单项名称和自我介绍。

另一种是文章草稿本身的翻译。

对于这两种翻译,我都创建了自定义程序,并利用Gemini的API来执行翻译。

辅助功能

考虑到视觉障碍用户通过音频收听文章内容,以及鼠标操作困难用户仅通过键盘操作浏览网站的情况,在HTML文件中加入多项增强功能可以提升辅助功能。

在辅助功能方面,我知之甚少;实际上,是Gemini在我们的编程聊天中提出了这些改进建议。

而对于这些旨在增强辅助功能的HTML修改,我也是通过与Gemini聊天学习如何实现的。

壁障的消失

生成式AI在创建这个网站的过程中发挥了多种作用,包括程序开发、用于翻译以及组织分类和标签的自然语言处理,甚至提出了我可能忽略的辅助功能等细微之处。

此外,通过建立文章添加后自动更新的机制,包括HTML生成以及分类和标签的自然语言处理,我得以让这个网站随着每篇新文章的发布而持续成长。

通过创建这个网站,我真切地感受到生成式AI如何轻而易举地克服各种壁障。

首当其冲的是语言壁障。传统上,即使考虑到翻译,个人要支持30种语言也是完全不可能的。

此外,还存在一些担忧,例如翻译后的博客是否传达了预期的细微差别,以及表达方式是否对母语使用者而言显得不自然或具有冒犯性。

生成式AI的翻译比传统机器翻译能更准确地传达细微差别,并使用更自然的表达方式。此外,翻译后的输出可以再次输入生成式AI,以检查是否存在不自然或不当的措辞。

从网站多语言化的角度来看,正确处理因语言而异的表达元素,例如日期和单位,是另一个难点。

例如,如果三个类别中分别有1篇、2篇和10篇文章,在日语中,只需在数量后加上单位“記事”(kiji - 文章/项目),如“1記事”、“2記事”、“10記事”即可。

然而,在英语中,则需要区分单数和复数形式,如“1 article”、“2 articles”、“10 articles”。此外,据报道,在某些语言中,即使是少量和大量复数,表达方式也可能发生变化。

再者,对于像阿拉伯语这种从右到左书写的语言,整个网站布局必须遵循读者从右到左的视线路径,使其自然。如果在文本或图片中使用了箭头,则必须考虑将其水平翻转的必要性。这些问题也通过生成式AI进行检查并得到了解决。

通过与生成式AI合作进行网站多语言化,我得以细致入微地处理传统方法下会忽略或无法顾及的细节。

辅助功能的考量也同样如此。以前,我只能为那些能像我一样浏览网站的人提供便利。

然而,生成式AI可以轻而易举地整合那些我不会注意到,或者即使注意到也可能因为耗时而放弃的考量。

虽然多语言化和辅助功能可能尚未完美,但我相信其质量远超我独自思考和研究所能达到的水平。

通过这种方式,生成式AI消除了通过博客文章传播信息过程中的诸多壁障。

结论

我是一名拥有丰富编程经验的系统工程师。虽然我工作上不负责创建网站,但过去曾作为爱好制作过一些个人主页。

凭借这些经验以及与生成式AI的互动,我仅用了大约两周时间就构建了这套多语言博客网站的自动化生成系统。

如果没有生成式AI,我根本不会考虑多语言支持。从这个意义上说,可以说我跨越了想象力的壁垒。

此外,考虑到每次添加文章时都需要进行分类和打标签的工作量,我很有可能在网站初次创建后就停止更新。而借助于生成式AI的自然语言处理所实现的自动化,我也克服了维护和更新的壁垒。

更重要的是,像我这样没有编程或网站创建经验的人也能构建这个系统。如果你将这篇文章喂给像Gemini这样的生成式AI,并表达你也想创建类似系统的愿望,它应该能指导你完成整个过程。

虽然我可以公开发布我创建的程序以供广泛使用,但鉴于生成式AI正在成为一名成熟的软件工程师,目前最有价值的共享信息可能不是程序本身,而是像本文这样对思想和机制的解释。思想和基本机制比程序更容易修改、增强或组合。

这表明,在软件开发和网站创建的壁垒正在消失的同时,个人信息传播的壁垒也在消退。

从技术上讲,互联网已经几乎消除了信息交流的壁垒,但我们仍然受语言和辅助功能等壁垒的阻碍。

虽然信息接收者可以通过机器翻译和文本转语音等自身努力,在一定程度上克服一些壁垒,但也有些部分是除非信息发送者提供支持和考量,否则无法克服的。

正是这些信息发送者必须克服的壁垒,生成式AI将其消除了。

即使语言和辅助功能的壁垒消失了,无疑还会存在文化、习俗和价值观差异等更深的壁垒。这些可能更难以克服。

然而,要克服这些困难的壁垒,我们首先必须克服摆在它们面前的壁垒。一旦我们抵达那些壁垒的脚下,跨越它们的新思想和新技术必将涌现。

或许,我们正迈入一个世界壁垒逐渐消失的时代。通过创建这个网站,我深切感受到了这一点。