我利用生成式AI(Gemini)创建了一个自己的网站,用于整理我为博客撰写的文章。
Katoshi的研究笔记 https://katoshi-mfacet.github.io/
该网站是从日文撰写的博客文章草稿自动生成的。
其特点包括:
- 从文章草稿自动生成
- 通过分类和标签整理文章
- 支持30种语言和无障碍访问
基本机制
基本机制是基于 Astro 框架构建的自定义程序,它能自动从文章草稿生成 HTML 文件。
这个程序本身也是我通过与 Google 的 Gemini 聊天开发的。
多亏了这种机制,一旦我写好文章草稿并运行重新生成过程,HTML 文件就会自动更新并反映在网站上。
分类和标签
我还开发了一个独立的程序,用于文章的分类和标签。
该程序通过 API 将文章发送给 Gemini,由 Gemini 自动进行分类和打标签。
通过向 Gemini 提供文章以及一份类别和标签列表,Gemini 能够理解文章的含义,并巧妙地推荐出合适的类别和标签。
此外,类别和标签列表本身也是通过另一个自定义程序从过往文章中提取确定的。在这个过程中,同样也利用了 Gemini。
过往文章会通过 API 依次传递给 Gemini,以输出候选类别和标签。然后,将从所有文章中提取出的这些候选类别和标签传递给 Gemini,最终确定类别和标签列表。
整个过程也都是通过程序自动完成的。
多语言翻译
为了支持多语言,翻译是必不可少的。当然,Gemini 也被用于这项翻译工作。
翻译有两种模式:
一种是翻译网站中与文章无关的通用字符串。这包括菜单项名称、自我介绍以及其他类似文本。
另一种是翻译文章草稿本身。
对于这两种翻译类型,我都创建了一个自定义程序,利用 Gemini 的 API 来执行翻译。
无障碍访问
为了提高无障碍访问性,我们在 HTML 文件中添加了多项功能,考虑到视障人士可能希望通过音频收听文章内容,或者那些使用鼠标有困难的人可能希望仅通过键盘控制来浏览网站。
我对无障碍访问的知识知之甚少;是 Gemini 在我们编程聊天期间提出了这些改进建议。
而对于这些增强无障碍访问性的 HTML 更改,我在聊天中询问了 Gemini 如何实现它们,并应用了修改。
障碍的消失
生成式 AI 以各种方式应用于本网站的创建,包括程序编写、用于翻译和组织类别与标签的自然语言处理,以及提出无障碍性等细微之处。
此外,通过建立文章添加后自动更新的系统,包括 HTML 生成和类别与标签的自然语言处理,我得以创建一个能随着每篇新文章而不断成长的网站。
通过创建这个网站,我真切地感受到,现在通过生成式 AI 可以轻松克服各种障碍。
首先是语言障碍。即使考虑到翻译,支持 30 种语言对于个人而言,在传统上也是不可能实现的。
此外,还存在翻译后的博客是否能传达预期细微差别,以及表达方式是否会令母语人士感到别扭或冒犯的担忧。
生成式 AI 的翻译比传统机器翻译能更准确地传达细微差别,并使用更自然的表达。而且,翻译后的输出可以再次输入生成式 AI,以检查是否存在不自然或不恰当的措辞。
从网站多语言化的角度来看,正确处理日期和单位等在不同语言中表达方式各异的元素,一直是一个挑战。
例如,如果第一个类别有一篇文章,第二个类别有两篇,第三个类别有十篇,在日语中,只需简单地写成“1記事(1 article)、2記事(2 articles)、10記事(10 articles)”,在数字后面加上单位“記事”即可。
然而,在英语中,你需要区分单数和复数,例如“1 article, 2 articles, 10 articles”。此外,据报道,在某些语言中,少量复数和大量复数之间的表达方式也会有所不同。
此外,对于阿拉伯语等从右向左书写的语言,还必须考虑使整个网站布局遵循读者从右向左的视线移动,以实现自然的阅读流。如果在文本或图像中使用了箭头,可能还需要将其水平翻转。这些问题也通过让生成式 AI 进行检查来解决。
通过与生成式 AI 合作进行网站多语言化,我能够细致地解决传统方法中可能被忽视或未曾考虑的方面。
无障碍性考量亦是如此。以前,我只能考虑那些与我以相同方式浏览网站的人。
然而,生成式 AI 可以轻松融入我可能没有注意到,或者由于需要付出努力而可能忽视的考量。
虽然多语言化和无障碍性仍不完美,但我相信它们的质量远高于我独自思考和研究所能达到的水平。
通过这种方式,生成式 AI 消除了我在通过博客文章传播信息方面遇到的许多障碍。
最后
我是一名拥有丰富编程经验的系统工程师。虽然我不以创建网站为工作,但过去我曾出于爱好制作过几个个人主页。
凭借这些经验,并通过与生成式 AI 的聊天互动,我得以在大约两周内构建出这个自动化的多语言博客网站生成系统。
如果没有生成式 AI,我甚至不会考虑多语言支持。从这个意义上说,可以说它超越了想象力的障碍。
此外,考虑到每次添加文章时进行分类和打标签的精力,网站很可能在首次创建后就停止更新。而通过生成式 AI 的自然语言处理实现的自动化,我得以克服维护和更新的障碍。
而且,这个系统即使像我这样没有编程或网站创建经验的人也能构建。如果你把这篇文章展示给像 Gemini 这样的生成式 AI,并表达你想要构建一个网站的愿望,它应该会教你如何去做。
虽然我可以发布我的程序供广泛使用,但既然生成式 AI 正在成为一名成熟的软件工程师,最有价值的共享信息将不再是程序本身,而是像这篇文章一样对思想和机制的解释。思想和基本机制比程序更容易改变、增强和组合。
这表明,随着软件开发和网站创建的障碍消失,个人信息传播的障碍也将随之消失。
从技术上讲,互联网实际上已经消除了信息交换的障碍,但我们仍然受到语言和可访问性等障碍的阻碍。
虽然我们可以在一定程度上通过接收者借助机器翻译和文本转语音的巧妙运用克服这些障碍,但也有一些部分,除非信息发送者采取行动和考虑,否则是无法克服的。
生成式 AI 正好消除了信息发送者必须克服的那些障碍。
即使语言和可访问性的障碍消失了,无疑还会存在文化、习俗和价值观差异等进一步的障碍。这些可能更难克服。
然而,要克服那些困难的障碍,我们必须首先克服摆在我们面前的障碍。一旦我们来到这样的障碍面前,克服它的新想法和新技术很可能会出现。
通过创建这个网站,我感受到了我们可能正在进入一个世界上的障碍正在消失的时代。