Bỏ qua đến nội dung
Bài viết này đã được dịch từ tiếng Nhật bằng AI
Đọc bằng tiếng Nhật
Bài viết này thuộc Miền Công Cộng (CC0). Hãy thoải mái sử dụng nó một cách tự do. CC0 1.0 Universal

Bước vào kỷ nguyên không biên giới: Tạo một trang blog 30 ngôn ngữ

Tôi đã sử dụng AI tạo sinh (Gemini) để tạo trang web của riêng mình nhằm sắp xếp các bài viết tôi đã viết cho blog.

Ghi chú nghiên cứu của Katoshi https://katoshi-mfacet.github.io/

Trang web này được tự động tạo từ các bản nháp bài đăng blog được viết bằng tiếng Nhật.

Các tính năng của nó bao gồm:

  • Tự động tạo từ các bản nháp bài viết
  • Tổ chức bài viết theo danh mục và thẻ
  • Hỗ trợ 30 ngôn ngữ và khả năng tiếp cận

Cơ chế cơ bản

Cơ chế cơ bản bao gồm một chương trình tùy chỉnh được xây dựng trên framework Astro, tự động tạo các tệp HTML từ bản nháp bài viết.

Tôi đã tự phát triển chương trình này bằng cách trò chuyện với Gemini của Google.

Nhờ cơ chế này, một khi tôi viết bản nháp bài viết và chạy quy trình tạo lại, các tệp HTML sẽ tự động được cập nhật và phản ánh trên trang web.

Phân loại và Gắn thẻ

Tôi cũng đã phát triển một chương trình riêng để phân loại và gắn thẻ.

Chương trình này chuyển các bài viết đến Gemini thông qua API để tự động phân loại và gắn thẻ cho chúng.

Bằng cách cung cấp danh sách các danh mục và thẻ cùng với bài viết, Gemini sẽ diễn giải ý nghĩa của bài viết và khéo léo đề xuất những cái phù hợp.

Hơn nữa, các danh sách danh mục và thẻ này được xác định bằng cách trích xuất chúng từ các bài viết trước đó bằng một chương trình tùy chỉnh khác. Ở đây, Gemini cũng được sử dụng.

Các bài viết trước đó được tuần tự chuyển đến Gemini thông qua API để xuất ra các danh mục và thẻ ứng cử viên. Sau đó, các danh mục và thẻ ứng cử viên được trích xuất từ tất cả các bài viết này sẽ được chuyển đến Gemini để hoàn thiện danh sách danh mục và thẻ.

Toàn bộ quá trình này cũng được tự động hóa bằng một chương trình.

Dịch đa ngôn ngữ

Dịch thuật là cần thiết để hỗ trợ đa ngôn ngữ. Tất nhiên, Gemini cũng được sử dụng cho việc dịch thuật này.

Có hai hình thức dịch:

Một là dịch các chuỗi ký tự chung trên toàn bộ trang web, không phụ thuộc vào bài viết. Điều này bao gồm tên mục menu, phần tự giới thiệu và các văn bản tương tự khác.

Hai là dịch các bản nháp bài viết.

Đối với cả hai loại dịch thuật này, tôi đã tạo một chương trình tùy chỉnh thực hiện các bản dịch bằng cách sử dụng API của Gemini.

Khả năng tiếp cận

Khả năng tiếp cận được cải thiện bằng cách thêm một số tính năng vào các tệp HTML, xem xét rằng những người khiếm thị có thể muốn nghe nội dung bài viết qua âm thanh, hoặc những người gặp khó khăn khi sử dụng chuột có thể muốn duyệt trang web chỉ bằng các điều khiển bàn phím.

Tôi có rất ít kiến thức về khả năng tiếp cận; chính Gemini đã gợi ý những cải tiến này trong cuộc trò chuyện lập trình của chúng tôi.

Và đối với những thay đổi này đối với HTML để nâng cao khả năng tiếp cận, tôi đã hỏi Gemini cách triển khai chúng trong cuộc trò chuyện của chúng tôi và đã áp dụng các sửa đổi.

Sự biến mất của các rào cản

AI tạo sinh đã được sử dụng theo nhiều cách khác nhau để tạo trang web này, bao gồm tạo chương trình, xử lý ngôn ngữ tự nhiên để dịch và sắp xếp các danh mục và thẻ, cũng như đề xuất các điểm tinh tế như khả năng tiếp cận.

Hơn nữa, bằng cách thiết lập một hệ thống tự động cập nhật khi thêm bài viết, bao gồm tạo HTML và xử lý ngôn ngữ tự nhiên cho các danh mục và thẻ, tôi đã có thể tạo ra một trang web phát triển cùng với mỗi bài viết mới.

Thông qua việc tạo trang web này, tôi thực sự cảm thấy rằng nhiều rào cản giờ đây có thể dễ dàng vượt qua bằng AI tạo sinh.

Đầu tiên, đó là rào cản ngôn ngữ. Hỗ trợ 30 ngôn ngữ theo truyền thống sẽ là điều không thể đối với một cá nhân, ngay cả khi xét đến việc dịch thuật.

Ngoài ra, còn có những lo ngại về việc liệu các blog được dịch có truyền tải được sắc thái ý nghĩa mong muốn hay không và liệu cách diễn đạt có thể gây khó chịu hoặc xúc phạm người bản xứ hay không.

Bản dịch của AI tạo sinh có thể truyền tải sắc thái chính xác hơn và sử dụng cách diễn đạt tự nhiên hơn so với dịch máy truyền thống. Hơn nữa, kết quả dịch có thể được đưa trở lại AI tạo sinh để kiểm tra các cụm từ không tự nhiên hoặc không phù hợp.

Từ góc độ đa ngôn ngữ hóa trang web, việc xử lý đúng cách các yếu tố như ngày tháng và đơn vị, vốn có cách diễn đạt khác nhau giữa các ngôn ngữ, là một thách thức.

Ví dụ, nếu có một bài viết trong danh mục đầu tiên, hai bài trong danh mục thứ hai và mười bài trong danh mục thứ ba, trong tiếng Nhật, đó chỉ đơn giản là "1記事 (1 bài viết), 2記事 (2 bài viết), 10記事 (10 bài viết)," thêm đơn vị "記事" sau số lượng.

Tuy nhiên, trong tiếng Anh, bạn cần phân biệt giữa số ít và số nhiều, chẳng hạn như "1 article, 2 articles, 10 articles." Hơn nữa, ở một số ngôn ngữ, cách diễn đạt có thể thay đổi đối với số nhiều nhỏ so với số nhiều lớn.

Hơn nữa, đối với các ngôn ngữ như tiếng Ả Rập, được viết từ phải sang trái, người ta cũng phải xem xét việc bố cục toàn bộ trang web phải tuân theo hướng đọc từ phải sang trái để có luồng tự nhiên. Nếu mũi tên được sử dụng trong văn bản hoặc hình ảnh, chúng có thể cần được lật ngang. Những điểm này cũng được giải quyết bằng cách nhờ AI tạo sinh kiểm tra.

Bằng cách làm việc về đa ngôn ngữ hóa trang web với AI tạo sinh, tôi đã có thể giải quyết tỉ mỉ các khía cạnh mà lẽ ra sẽ không được chú ý hoặc không được xem xét với các phương pháp truyền thống.

Điều tương tự cũng áp dụng cho các cân nhắc về khả năng tiếp cận. Trước đây, tôi chỉ có thể xem xét những người xem trang web theo cách giống như tôi.

Tuy nhiên, AI tạo sinh dễ dàng kết hợp các cân nhắc mà tôi có thể không nhận thấy, hoặc mà tôi có thể bỏ qua do nỗ lực liên quan.

Mặc dù đa ngôn ngữ hóa và khả năng tiếp cận vẫn chưa hoàn hảo, tôi tin rằng chất lượng của chúng cao hơn rất nhiều so với những gì tôi có thể đạt được bằng cách tự mình suy nghĩ và nghiên cứu.

Bằng cách này, AI tạo sinh đã loại bỏ nhiều rào cản đối với nỗ lực của tôi trong việc phổ biến thông tin thông qua các bài viết blog.

Cuối cùng

Tôi là một kỹ sư hệ thống với kinh nghiệm lập trình sâu rộng. Mặc dù tôi không tạo trang web cho công việc, tôi đã tự làm một số trang chủ cá nhân như một sở thích trong quá khứ.

Với kinh nghiệm này và thông qua các tương tác trò chuyện với AI tạo sinh, tôi đã có thể xây dựng hệ thống tạo trang blog đa ngôn ngữ tự động này trong khoảng hai tuần.

Nếu không có AI tạo sinh, tôi thậm chí sẽ không cân nhắc đến việc hỗ trợ đa ngôn ngữ. Theo nghĩa đó, có thể nói rằng nó đã vượt qua rào cản của trí tưởng tượng.

Hơn nữa, nếu xét đến công sức phân loại và gắn thẻ mỗi khi thêm một bài viết, rất có khả năng trang web sẽ ngừng được cập nhật sau khi tạo ban đầu. Với sự tự động hóa được thực hiện bởi khả năng xử lý ngôn ngữ tự nhiên của AI tạo sinh, tôi đã có thể vượt qua các rào cản về bảo trì và cập nhật.

Hơn nữa, hệ thống này có thể được xây dựng ngay cả bởi những người không có kinh nghiệm lập trình hoặc tạo trang web như tôi. Nếu bạn đưa bài viết này cho một AI tạo sinh như Gemini và bày tỏ mong muốn xây dựng một cái, nó sẽ hướng dẫn bạn cách làm.

Mặc dù tôi có thể phát hành chương trình của mình để sử dụng rộng rãi, nhưng hiện nay khi AI tạo sinh đang trở thành một kỹ sư phần mềm thực thụ, thông tin có giá trị nhất để chia sẻ sẽ không phải là chính chương trình, mà là giải thích về các ý tưởng và cơ chế, như bài viết này. Các ý tưởng và cơ chế cơ bản có thể được thay đổi, nâng cao và kết hợp dễ dàng hơn nhiều so với các chương trình.

Điều này cho thấy rằng khi các rào cản đối với phát triển phần mềm và tạo trang web biến mất, thì các rào cản đối với việc phổ biến thông tin cá nhân cũng sẽ biến mất.

Về mặt công nghệ, internet đã loại bỏ gần như hoàn toàn rào cản trao đổi thông tin, nhưng chúng ta vẫn bị cản trở bởi các rào cản như ngôn ngữ và khả năng tiếp cận.

Mặc dù chúng ta có thể vượt qua những rào cản này ở một mức độ nào đó thông qua sự khéo léo của người nhận với dịch máy và chuyển văn bản thành giọng nói, nhưng cũng có những phần không thể vượt qua trừ khi người gửi thông tin hành động và cân nhắc.

AI tạo sinh chính xác là loại bỏ những rào cản mà người gửi thông tin phải vượt qua.

Ngay cả khi các rào cản về ngôn ngữ và khả năng tiếp cận biến mất, chắc chắn sẽ có những rào cản khác như sự khác biệt về văn hóa, phong tục và giá trị. Những điều này thậm chí có thể khó vượt qua hơn.

Tuy nhiên, để vượt qua những rào cản khó khăn đó, trước tiên chúng ta phải vượt qua những rào cản trước chúng. Một khi chúng ta đứng ngay trước một rào cản như vậy, những ý tưởng và kỹ thuật mới để vượt qua nó có thể sẽ xuất hiện.

Bằng cách này, chúng ta có thể đang tiếp cận một kỷ nguyên mà các rào cản đang biến mất khỏi thế giới. Đây là điều tôi cảm nhận được thông qua việc tạo ra trang web này.