Bỏ qua đến nội dung
Bài viết này đã được dịch từ tiếng Nhật bằng AI
Đọc bằng tiếng Nhật
Bài viết này thuộc Miền Công Cộng (CC0). Hãy thoải mái sử dụng nó một cách tự do. CC0 1.0 Universal

Hướng tới kỷ nguyên không rào cản: Tạo trang blog 30 ngôn ngữ

Để sắp xếp các bài viết mà tôi đã viết cho blog của mình, tôi đã tận dụng AI tạo sinh (Gemini) để tạo trang web riêng.

Ghi chú Nghiên cứu của katoshi https://katoshi-mfacet.github.io/

Trang web này được tự động tạo ra từ các bản nháp bài viết blog gốc của tôi, được viết bằng tiếng Nhật.

Các tính năng của nó bao gồm:

  • Tự động tạo từ các bản nháp bài viết
  • Sắp xếp bài viết theo danh mục và thẻ
  • Hỗ trợ 30 ngôn ngữ và khả năng tiếp cận

Cơ chế cơ bản

Cơ chế cơ bản bao gồm một chương trình tự tạo dựa trên khuôn khổ Astro, tự động tạo các tệp HTML từ các bản nháp bài viết.

Tôi thậm chí còn tự tạo chương trình này bằng cách trò chuyện với Gemini của Google.

Nhờ cơ chế này, sau khi bản nháp bài viết được viết và quá trình tái tạo được thực thi, các tệp HTML sẽ tự động được cập nhật và hiển thị trên trang web này.

Phân loại và Gắn thẻ

Tôi cũng đã phát triển một chương trình riêng để phân loại và gắn thẻ.

Chương trình này chuyển các bài viết đến Gemini thông qua một API để tự động phân loại và gắn thẻ cho chúng.

Khi được cung cấp danh sách các danh mục và thẻ cùng với bài viết, Gemini sẽ diễn giải ý nghĩa của bài viết và khéo léo đề xuất những cái phù hợp.

Hơn nữa, các danh sách danh mục và thẻ này được xác định bởi một chương trình tùy chỉnh khác trích xuất chúng từ các bài viết trước đây. Ở đây, tôi cũng tận dụng Gemini.

Các bài viết trước đây được tuần tự chuyển đến Gemini thông qua một API, sau đó Gemini xuất ra các danh mục và thẻ ứng cử viên. Các ứng cử viên được trích xuất từ tất cả các bài viết này sau đó được đưa trở lại Gemini để hoàn thiện các danh sách danh mục và thẻ toàn diện.

Toàn bộ quá trình này cũng được tự động hóa bằng chương trình.

Dịch thuật đa ngôn ngữ

Dịch thuật là yếu tố cần thiết để đa ngôn ngữ hóa. Đương nhiên, Gemini cũng được sử dụng cho việc dịch thuật này.

Có hai hình thức dịch thuật:

Một là dịch các chuỗi phổ biến trong trang web, không phụ thuộc vào các bài viết cụ thể, chẳng hạn như tên mục menu và phần tự giới thiệu.

Hình thức còn lại là dịch chính các bản nháp bài viết.

Đối với cả hai hình thức này, tôi đã tạo một chương trình tùy chỉnh sử dụng API của Gemini để thực hiện các bản dịch.

Khả năng tiếp cận

Để hỗ trợ người dùng khiếm thị nghe nội dung bài viết qua âm thanh, và những người khó sử dụng chuột có thể điều hướng trang web chỉ bằng bàn phím, việc tích hợp một số cải tiến vào các tệp HTML sẽ giúp tăng cường khả năng tiếp cận.

Về khả năng tiếp cận, tôi có rất ít kiến thức; Gemini thực sự đã đề xuất những cải tiến này trong cuộc trò chuyện lập trình của chúng tôi.

Và đối với những sửa đổi HTML này nhằm tăng cường khả năng tiếp cận, tôi cũng đã học cách triển khai chúng bằng cách trò chuyện với Gemini.

Sự biến mất của các bức tường

AI tạo sinh đã được sử dụng theo nhiều cách khác nhau để tạo ra trang web này, bao gồm phát triển chương trình, xử lý ngôn ngữ tự nhiên để dịch thuật và tổ chức các danh mục và thẻ, và thậm chí đề xuất những điểm tinh tế như khả năng tiếp cận mà tôi có thể đã bỏ qua.

Hơn nữa, bằng cách tạo ra một cơ chế cập nhật tự động khi thêm bài viết, bao gồm tạo HTML và xử lý ngôn ngữ tự nhiên cho các danh mục và thẻ, tôi đã có thể biến trang web này thành một trang web sẽ tiếp tục phát triển với mỗi bài viết mới.

Thông qua việc tạo ra trang web này, tôi thực sự cảm thấy các rào cản khác nhau có thể dễ dàng vượt qua như thế nào với AI tạo sinh.

Trước hết là rào cản ngôn ngữ. Việc hỗ trợ 30 ngôn ngữ sẽ hoàn toàn bất khả thi đối với một cá nhân theo cách truyền thống, ngay cả khi xét đến việc dịch thuật.

Ngoài ra, còn có những lo ngại về việc liệu các blog đã dịch có truyền tải được sắc thái ý định hay không và liệu các cách diễn đạt có không tự nhiên hoặc gây khó chịu cho người bản xứ hay không.

Các bản dịch của AI tạo sinh có thể truyền tải sắc thái chính xác hơn và sử dụng các cách diễn đạt tự nhiên hơn so với dịch máy truyền thống. Hơn nữa, kết quả dịch có thể được nhập lại vào AI tạo sinh để kiểm tra xem có bất kỳ cách diễn đạt nào không tự nhiên hoặc không phù hợp hay không.

Từ góc độ đa ngôn ngữ hóa trang web, việc xử lý đúng đắn các yếu tố có biểu hiện khác nhau theo ngôn ngữ, chẳng hạn như ngày tháng và đơn vị, là một điểm khó khăn khác.

Ví dụ, nếu có 1, 2 và 10 bài viết trong ba danh mục tương ứng, trong tiếng Nhật, chỉ cần thêm đơn vị "記事" (kiji - bài viết/mục) sau số lượng, như "1記事" (1 bài viết), "2記事" (2 bài viết), "10記事" (10 bài viết) là đủ.

Tuy nhiên, trong tiếng Anh, cần phải phân biệt giữa dạng số ít và số nhiều, chẳng hạn như "1 article," "2 articles," "10 articles." Hơn nữa, ở một số ngôn ngữ, các cách diễn đạt được cho là có thể thay đổi ngay cả đối với số ít so với số nhiều lớn.

Hơn nữa, đối với các ngôn ngữ như tiếng Ả Rập được viết từ phải sang trái, toàn bộ bố cục trang web phải được làm tự nhiên, theo hướng nhìn của người đọc từ phải sang trái. Nếu các mũi tên được sử dụng trong văn bản hoặc hình ảnh, sự cần thiết phải lật ngược chúng theo chiều ngang cũng phải được xem xét. Những điểm này cũng được giải quyết bằng cách để AI tạo sinh kiểm tra.

Bằng cách làm việc trên đa ngôn ngữ hóa trang web với AI tạo sinh, tôi đã có thể giải quyết tỉ mỉ các chi tiết mà tôi có thể đã bỏ qua và không thể tính đến bằng các phương pháp truyền thống.

Điều tương tự cũng áp dụng cho các cân nhắc về khả năng tiếp cận. Trước đây, tôi chỉ có thể cung cấp các cân nhắc cho những người có thể xem trang web theo cách tôi có thể.

Tuy nhiên, AI tạo sinh dễ dàng tích hợp các cân nhắc mà tôi sẽ không nhận thấy, hoặc mà tôi có thể do dự không giải quyết vì cần nhiều nỗ lực.

Mặc dù việc đa ngôn ngữ hóa và khả năng tiếp cận có thể chưa hoàn hảo, nhưng tôi tin rằng chất lượng đã cao hơn rất nhiều so với những gì tôi có thể đạt được bằng cách tự mình suy nghĩ và nghiên cứu.

Theo cách này, AI tạo sinh đã loại bỏ nhiều rào cản đối với nỗ lực truyền bá thông tin thông qua các bài viết blog.

Kết luận

Tôi là một kỹ sư hệ thống với kinh nghiệm lập trình sâu rộng. Dù không tạo trang web trong công việc, tôi đã từng làm một số trang chủ như một sở thích trong quá khứ.

Tận dụng kinh nghiệm này và những tương tác của tôi với AI tạo sinh, tôi đã có thể xây dựng hệ thống tạo tự động cho trang blog đa ngôn ngữ này trong khoảng hai tuần.

Nếu không có AI tạo sinh, tôi thậm chí sẽ không bao giờ nghĩ đến việc hỗ trợ đa ngôn ngữ ngay từ đầu. Theo nghĩa đó, có thể nói rằng tôi đã vượt qua rào cản về trí tưởng tượng.

Hơn nữa, xét đến nỗ lực liên quan đến việc phân loại và gắn thẻ bài viết mỗi khi chúng được thêm vào, rất có thể tôi sẽ ngừng cập nhật trang web sau khi tạo ban đầu. Với khả năng tự động hóa do xử lý ngôn ngữ tự nhiên của AI tạo sinh cung cấp, tôi cũng đã vượt qua các rào cản về bảo trì và cập nhật.

Hơn nữa, hệ thống này có thể được xây dựng bởi những cá nhân không có kinh nghiệm lập trình hoặc tạo trang web, giống như tôi. Nếu bạn cung cấp bài viết này cho một AI tạo sinh như Gemini và bày tỏ mong muốn xây dựng một cái gì đó tương tự, nó sẽ có thể hướng dẫn bạn trong suốt quá trình.

Mặc dù tôi có thể xuất bản chương trình mà tôi đã tạo để sử dụng rộng rãi, nhưng với việc AI tạo sinh đang trở thành một kỹ sư phần mềm thực thụ, thông tin có giá trị nhất để chia sẻ bây giờ có lẽ là lời giải thích về các ý tưởng và cơ chế, như được trình bày trong bài viết này, hơn là chính chương trình. Các ý tưởng và cơ chế cơ bản thậm chí còn dễ dàng sửa đổi, nâng cao hoặc kết hợp hơn các chương trình.

Điều này cho thấy rằng trong khi các rào cản đối với phát triển phần mềm và tạo trang web đang biến mất, thì các rào cản đối với việc truyền bá thông tin cá nhân cũng vậy.

Về mặt công nghệ, internet đã thực sự loại bỏ các rào cản đối với việc trao đổi thông tin, nhưng chúng ta vẫn bị cản trở bởi các rào cản như ngôn ngữ và khả năng tiếp cận.

Mặc dù người nhận có thể vượt qua một số rào cản ở một mức độ nhất định thông qua nỗ lực của chính họ, chẳng hạn như dịch máy và chuyển văn bản thành giọng nói, nhưng cũng có những phần không thể vượt qua trừ khi người gửi thông tin cung cấp hỗ trợ và xem xét.

Chính những rào cản mà người gửi thông tin phải vượt qua đó được AI tạo sinh loại bỏ.

Ngay cả khi các rào cản về ngôn ngữ và khả năng tiếp cận biến mất, chắc chắn sẽ có thêm các rào cản khác như sự khác biệt về văn hóa, phong tục và giá trị. Những rào cản này thậm chí có thể khó vượt qua hơn.

Tuy nhiên, để vượt qua những rào cản khó khăn này, trước tiên chúng ta phải vượt qua những rào cản nằm trước chúng. Một khi chúng ta đến chân những bức tường đó, những ý tưởng và kỹ thuật mới để vượt qua chúng chắc chắn sẽ xuất hiện.

Có lẽ chúng ta đang bước vào một kỷ nguyên mà các bức tường đang biến mất khỏi thế giới. Thông qua việc tạo ra trang web này, đó chính xác là điều tôi cảm thấy.