Bỏ qua đến nội dung
Bài viết này đã được dịch từ tiếng Nhật bằng AI
Đọc bằng tiếng Nhật
Bài viết này thuộc Miền Công Cộng (CC0). Hãy thoải mái sử dụng nó một cách tự do. CC0 1.0 Universal

Hệ thống Trí tuệ Học tập Nhân tạo: Khái niệm ALIS

Tại đây, tôi muốn trình bày Hệ thống Trí tuệ Học tập Nhân tạo (Artificial Learning Intelligence System: ALIS) bằng cách đi sâu vào khái niệm, nguyên lý, thiết kế cơ bản và phương pháp phát triển của nó.

Khái niệm

AI tạo sinh hiện nay, chủ yếu là các mô hình ngôn ngữ lớn, được huấn luyện dựa trên học có giám sát bằng mạng nơ-ron.

Chúng ta định nghĩa quá trình học của mạng nơ-ron này là học tập bẩm sinh.

ALIS tích hợp một quá trình học tập thu nhận, tách biệt với học tập bẩm sinh, để cho phép suy luận kết hợp cả hai quá trình học tập này.

Trong học tập thu nhận, kiến thức đã học được tích lũy bên ngoài mạng nơ-ron và được sử dụng trong quá trình suy luận.

Do đó, cốt lõi kỹ thuật của ALIS nằm ở việc trích xuất, lưu trữ, cũng như lựa chọn và sử dụng kiến thức có thể tái sử dụng trong quá trình suy luận.

Hơn nữa, ALIS không chỉ là một công nghệ thành phần đơn lẻ, mà là một công nghệ hệ thống kết hợp học tập bẩm sinhhọc tập thu nhận.

Các yếu tố của Hệ thống Trí tuệ Học tập

ALIS hoạt động dựa trên nguyên lý rằng cả học tập bẩm sinh hiện có và học tập thu nhận trong tương lai đều tuân theo cùng một khuôn khổ của việc học và suy luận.

Để giải thích các nguyên lý học tập trong ALIS, chúng ta định nghĩa năm yếu tố của một hệ thống trí tuệ học tập:

Đầu tiên là bộ xử lý thông minh. Đây là một hệ thống xử lý thực hiện suy luận bằng cách sử dụng kiến thức và trích xuất kiến thức để học hỏi.

Các Mô hình Ngôn ngữ Lớn (LLM) và một phần não bộ con người là những ví dụ điển hình của bộ xử lý thông minh.

Thứ hai là kho lưu trữ tri thức. Đây là một vị trí lưu trữ nơi kiến thức được trích xuất có thể được lưu và truy xuất khi cần.

Trong LLM, kho lưu trữ tri thức bao gồm các tham số của mạng nơ-ron. Ở con người, nó tương ứng với bộ nhớ dài hạn trong não.

Thứ ba là thế giới. Đây là môi trường bên ngoài được nhận thức bởi một hệ thống trí tuệ học tập, chẳng hạn như con người hoặc ALIS.

Đối với con người, thế giới là chính thực tại. Trong trường hợp LLM, một cơ chế nhận đầu ra từ LLM và cung cấp phản hồi cho nó có thể được coi là tương đương với thế giới.

Thứ tư là bộ nhớ trạng thái. Đây là một thành phần giống như bộ nhớ tạm thời nội bộ được một hệ thống trí tuệ học tập sử dụng trong quá trình suy luận.

Trong LLM, đây là không gian bộ nhớ được sử dụng trong quá trình suy luận, được gọi là các trạng thái ẩn. Ở con người, nó tương ứng với bộ nhớ ngắn hạn.

Thứ năm là khuôn khổ. Đây, có thể nói, là một cấu trúc tư duy. Theo thuật ngữ của hệ thống trí tuệ học tập, nó đề cập đến các tiêu chí để chọn kiến thức cần thiết trong quá trình suy luận và một cấu trúc không gian trạng thái logic để tổ chức bộ nhớ trạng thái.

Trong LLM, đó là cấu trúc ngữ nghĩa của các trạng thái ẩn, và nội dung của nó thường mơ hồ và khó hiểu đối với con người. Hơn nữa, việc lựa chọn kiến thức được nhúng vào cơ chế chú ý, cơ chế này chọn các token hiện có để tham chiếu cho mỗi token đang được xử lý.

Ở con người, như đã đề cập ở trên, đó là một cấu trúc tư duy. Khi tư duy bằng cách sử dụng một khuôn khổ cụ thể, một tập hợp kiến thức chuyên môn cụ thể được gợi nhớ từ bộ nhớ dài hạn và được tải vào bộ nhớ ngắn hạn. Sau đó, thông tin được nhận thức hiện tại được tổ chức theo khuôn khổ tư duy để hiểu tình huống.

Nguyên lý của Hệ thống Trí tuệ Học tập

Một hệ thống trí tuệ học tập hoạt động như sau:

Một bộ xử lý thông minh tác động lên thế giới. Thế giới, để đáp lại hành động này, trả về kết quả.

Bộ xử lý thông minh trích xuất kiến thức có thể tái sử dụng từ những kết quả này và lưu trữ nó trong kho lưu trữ tri thức.

Khi tác động lên thế giới một cách lặp đi lặp lại, bộ xử lý thông minh sẽ chọn kiến thức từ kho lưu trữ tri thức và sử dụng nó để điều chỉnh hành động của mình.

Đây là cơ chế cơ bản.

Tuy nhiên, về cơ bản, các phương pháp trích xuất, lưu trữ, lựa chọn và sử dụng kiến thức sẽ quyết định liệu hệ thống có thể thực hiện học tập một cách có ý nghĩa hay không.

Con người sở hữu các cơ chế xử lý hiệu quả việc trích xuất, lưu trữ, lựa chọn và sử dụng kiến thức này, cho phép họ học hỏi.

Các mạng nơ-ron, bao gồm LLM, có quá trình trích xuất được xử lý bởi các giáo viên bên ngoài, nhưng chúng sở hữu các cơ chế để lưu trữ, lựa chọn và sử dụng. Điều này cho phép chúng học hỏi miễn là chúng được cung cấp một giáo viên.

Hơn nữa, một hệ thống trí tuệ học tập cũng có thể học cách trích xuất, lưu trữ và lựa chọn các khuôn khổ, và các phương pháp sử dụng chúng trong bộ nhớ trạng thái, như là kiến thức, từ đó cho phép học tập phức tạp hơn.

Các loại Kiến thức

Dựa trên những nguyên lý này, khi thiết kế học tập thu nhận, cần làm rõ hình thức của kiến thức thu nhận.

Có thể xem xét một phương pháp trong đó kiến thức thu nhận cũng được học riêng biệt dưới dạng các tham số mạng nơ-ron.

Tuy nhiên, kiến thức thu nhận không nhất thiết phải giới hạn chỉ ở các tham số mạng nơ-ron. Một lựa chọn thực tế là kiến thức được văn bản hóa bằng ngôn ngữ tự nhiên.

Kiến thức được văn bản hóa bằng ngôn ngữ tự nhiên có thể được trích xuất và sử dụng bằng cách tận dụng khả năng xử lý ngôn ngữ tự nhiên của LLM. Hơn nữa, vì nó có thể được xử lý như dữ liệu trong các hệ thống CNTT tiêu chuẩn, việc lưu trữ và lựa chọn cũng dễ dàng.

Ngoài ra, kiến thức được văn bản hóa bằng ngôn ngữ tự nhiên dễ dàng cho con người và các LLM khác kiểm tra, hiểu, và trong một số trường hợp, thậm chí chỉnh sửa nội dung của nó.

Nó cũng có thể được chia sẻ, hợp nhất hoặc phân tách với các hệ thống trí tuệ học tập khác.

Vì những lý do này, kiến thức thu nhận trong khái niệm ALIS ban đầu sẽ được thiết kế để nhắm mục tiêu vào kiến thức được văn bản hóa bằng ngôn ngữ tự nhiên.

Bộ nhớ trạng thái thu nhận và Khuôn khổ

Chúng ta đã giải thích những lợi ích của việc chọn văn bản ngôn ngữ tự nhiên làm định dạng cho kiến thức thu nhận.

Tương tự, văn bản ngôn ngữ tự nhiên cũng có thể được sử dụng cho bộ nhớ trạng tháikhuôn khổ để suy luận.

Các khuôn khổ, với tư cách là các cấu trúc khái niệm, có thể được lưu trữ và sử dụng trong kho lưu trữ tri thức dưới dạng kiến thức được văn bản hóa bằng ngôn ngữ tự nhiên.

Ngay cả khi khởi tạo hoặc cập nhật trạng thái dựa trên cấu trúc được định nghĩa bởi một khuôn khổ, bộ nhớ trạng thái định dạng văn bản cũng có thể được sử dụng.

Bằng cách thiết kế không chỉ kiến thức thu nhận mà cả các khuôn khổbộ nhớ trạng thái ở định dạng văn bản, ALIS có thể tận dụng khả năng xử lý ngôn ngữ tự nhiên của LLM cho học tập thu nhận và suy luận nói chung.

Kiến thức hình thức

Kiến thức thu nhận, khuôn khổbộ nhớ trạng thái có thể được biểu diễn không chỉ bằng văn bản ngôn ngữ tự nhiên mà còn bằng các ngôn ngữ hình thức hoặc mô hình hình thức chặt chẽ hơn.

Mặc dù tôi đã viết "chọn", mục tiêu của ALIS là tích hợp nhiều cơ chế học tập thu nhận khác nhau để cho phép sử dụng kết hợp giữa học tập bẩm sinhhọc tập thu nhận.

Kiến thức được biểu diễn bằng ngôn ngữ hình thức hoặc mô hình hình thức có thể được làm cho chính xác và không mơ hồ hơn.

Hơn nữa, nếu một khuôn khổ được biểu diễn bằng một ngôn ngữ hoặc mô hình hình thức và một trạng thái ban đầu được mở rộng trong bộ nhớ trạng thái, thì một mô phỏng hoặc phát triển logic có thể được thực hiện với một mô hình chặt chẽ bởi một bộ xử lý thông minh có khả năng xử lý các mô hình hình thức, thay vì một LLM.

Một ví dụ điển hình của các ngôn ngữ hình thức hoặc mô hình hình thức như vậy là các ngôn ngữ lập trình.

Khi hệ thống học về thế giới, nếu nó có thể diễn đạt các quy luật và khái niệm được tìm thấy trong đó dưới dạng một chương trình trong một khuôn khổ, thì nó có thể mô phỏng chúng trên máy tính.

Mục 1: Các loại Kiến thức

Khi tổ chức kiến thức trong một hệ thống trí tuệ học tập, rõ ràng là nó có thể được phân loại rộng rãi thành ba hệ thống kiến thức và hai loại trạng thái.

Ba hệ thống kiến thức đó là: kiến thức tham số mạng, được xử lý bởi mạng nơ-ron; kiến thức tự nhiên, được biểu diễn bằng ngôn ngữ tự nhiên; và kiến thức hình thức, được biểu diễn bằng ngôn ngữ hình thức.

Hai loại trạng thái là vô trạng thái (stateless) và có trạng thái (stateful).

Kiến thức tham số mạng vô trạng thái là kiến thức trực giác, giống như kiến thức tìm thấy trong AI học sâu. Các đặc điểm của mèo và chó, những thứ không thể được suy nghĩ rõ ràng hoặc nhận diện bằng lời nói, có thể được học dưới dạng kiến thức tham số mạng vô trạng thái.

Kiến thức tham số mạng có trạng thái là kiến thức nổi lên thông qua các quá trình lặp đi lặp lại, mờ nhạt, như trong AI tạo sinh.

Kiến thức tự nhiên vô trạng thái là kiến thức giống như ý nghĩa gắn liền với các từ riêng lẻ.

Kiến thức tự nhiên có trạng thái là kiến thức bao gồm ngữ cảnh trong các câu.

Một số kiến thức tự nhiên được bao gồm bẩm sinh trong kiến thức tham số mạng có trạng thái, nhưng cũng có kiến thức có thể thu nhận được từ văn bản ngôn ngữ tự nhiên.

Kiến thức hình thức vô trạng thái là kiến thức có thể được biểu diễn bằng các công thức toán học mà không lặp lại. Kiến thức hình thức có trạng thái là kiến thức có thể được biểu diễn dưới dạng một chương trình.

Người ta cũng có thể sử dụng bộ nhớ ngắn hạn của mình làm bộ nhớ trạng thái cho kiến thức tự nhiên và kiến thức hình thức.

Tuy nhiên, vì nó là bộ nhớ ngắn hạn, có một vấn đề là khó duy trì trạng thái ổn định. Hơn nữa, nó không giỏi trong việc giữ các trạng thái được hình thức hóa, không mơ hồ.

Mặt khác, giấy, máy tính và điện thoại thông minh có thể được sử dụng làm bộ nhớ trạng thái để ghi lại hoặc chỉnh sửa văn bản ngôn ngữ tự nhiên, ngôn ngữ hình thức hoặc mô hình hình thức.

Nói chung, dữ liệu trên giấy hoặc máy tính thường được coi là một kho lưu trữ tri thức để ghi nhớ kiến thức, nhưng nó cũng có thể được sử dụng làm bộ nhớ trạng thái để sắp xếp các suy nghĩ.

Do đó, rõ ràng là con người thực hiện các hoạt động trí tuệ bằng cách tận dụng tối đa ba hệ thống kiến thức và hai loại trạng thái này.

ALIS cũng vậy, nắm giữ tiềm năng nâng cao đáng kể khả năng của mình bằng cách cho phép và củng cố các hoạt động trí tuệ tận dụng ba hệ thống kiến thức và hai loại trạng thái này.

Đặc biệt, ALIS có thế mạnh là có thể sử dụng các kho lưu trữ tri thứcbộ nhớ trạng thái khổng lồ. Hơn nữa, nó có thể dễ dàng thực hiện các tác vụ trí tuệ bằng cách chuẩn bị nhiều cái mỗi loại và chuyển đổi hoặc kết hợp chúng.

Mục 2: Điều phối thông minh

Mặc dù có lợi thế khi có thể tích lũy một lượng lớn kiến thức trong một kho lưu trữ tri thức, nhưng số lượng kiến thức không đơn giản chuyển thành lợi thế trong hoạt động trí tuệ do giới hạn về số lượng token mà một AI tạo sinh có thể xử lý cùng lúc và nhiễu được tạo ra bởi kiến thức không liên quan.

Ngược lại, bằng cách phân chia kho lưu trữ tri thức một cách thích hợp và biến nó thành các kho lưu trữ tri thức chuyên biệt, mật độ cao, mỗi kho chứa kiến thức cần thiết cho một nhiệm vụ trí tuệ cụ thể, các vấn đề về giới hạn token và nhiễu có thể được giảm nhẹ.

Đổi lại, mỗi kho lưu trữ tri thức chuyên biệt chỉ có thể sử dụng cho nhiệm vụ trí tuệ được chỉ định của nó.

Nhiều hoạt động trí tuệ là các tập hợp phức tạp của các nhiệm vụ trí tuệ khác nhau. Do đó, bằng cách chia kiến thức thành các kho lưu trữ tri thức chuyên biệt theo loại nhiệm vụ trí tuệ và phân chia hoạt động trí tuệ thành các nhiệm vụ riêng lẻ, ALIS có thể thực hiện toàn bộ hoạt động trí tuệ bằng cách chuyển đổi thích hợp giữa các kho lưu trữ tri thức chuyên biệt này.

Điều này tương tự như một dàn nhạc, bao gồm các nhạc công chuyên nghiệp chơi các nhạc cụ khác nhau và một nhạc trưởng dẫn dắt toàn bộ dàn nhạc.

Thông qua công nghệ hệ thống này, điều phối thông minh, ALIS sẽ có thể tổ chức các hoạt động trí tuệ của mình.

Thiết kế Cơ bản và Phương pháp Phát triển ALIS

Từ đây, chúng ta sẽ tổ chức quá trình phát triển ALIS.

Như đã thảo luận trong các nguyên lý và mục trước, ALIS vốn được thiết kế để dễ dàng mở rộng các chức năng và tài nguyên. Điều này là do bản chất của ALIS không nằm ở các chức năng cụ thể, mà ở các quy trình trích xuất, lưu trữ, lựa chọn và sử dụng kiến thức.

Ví dụ, có thể cung cấp nhiều loại cơ chế trích xuất kiến thức, và thiết kế hệ thống cho phép tự do lựa chọn từ chúng hoặc sử dụng chúng đồng thời.

Hơn nữa, bản thân ALIS có thể được thiết lập để thực hiện lựa chọn này.

Tương tự, việc lưu trữ, lựa chọn và sử dụng cũng có thể được tự do lựa chọn hoặc song song hóa.

Do đó, ALIS có thể được phát triển theo từng bước và linh hoạt, mà không cần thiết kế toàn bộ chức năng theo cách thác nước.

Khởi đầu của ALIS

Bây giờ, chúng ta hãy thiết kế một ALIS rất đơn giản.

Giao diện người dùng cơ bản sẽ là một AI trò chuyện quen thuộc. Ban đầu, đầu vào của người dùng được chuyển trực tiếp đến LLM. Phản hồi của LLM được hiển thị trên giao diện người dùng, và hệ thống chờ đợi đầu vào tiếp theo của người dùng.

Khi nhận được đầu vào tiếp theo, LLM không chỉ được cung cấp đầu vào mới mà còn cả toàn bộ lịch sử trò chuyện giữa người dùng và LLM.

Đằng sau giao diện người dùng của AI trò chuyện này, một cơ chế được chuẩn bị để trích xuất kiến thức có thể tái sử dụng từ lịch sử trò chuyện.

Cơ chế này có thể được thêm vào hệ thống AI trò chuyện dưới dạng một quy trình chạy khi cuộc hội thoại kết thúc hoặc theo các khoảng thời gian đều đặn. Tất nhiên, một LLM được sử dụng để trích xuất kiến thức.

LLM này được cung cấp khái niệm và nguyên tắc của ALIS, cùng với bí quyết trích xuất kiến thức, dưới dạng một lời nhắc hệ thống (system prompt). Nếu kiến thức không được trích xuất như mong muốn, lời nhắc hệ thống nên được cải thiện thông qua thử và sai.

Kiến thức được trích xuất từ lịch sử trò chuyện được lưu trữ trực tiếp trong một hồ tri thức. Hồ tri thức chỉ đơn giản là một cơ chế để lưu trữ kiến thức ở trạng thái thô trước khi nó được cấu trúc.

Tiếp theo, một cơ chế cấu trúc được chuẩn bị để dễ dàng lựa chọn kiến thức từ hồ tri thức.

Điều này bao gồm việc cung cấp một kho vector nhúng cho tìm kiếm ngữ nghĩa, như được sử dụng trong RAG điển hình, và các chỉ mục từ khóa.

Các khả năng khác bao gồm tạo ra các đồ thị tri thức tiên tiến hơn hoặc thực hiện phân loại danh mục.

Tập hợp thông tin có cấu trúc này cho hồ tri thức sẽ được gọi là cơ sở tri thức. Toàn bộ cơ sở tri thức và hồ tri thức này sẽ tạo thành kho lưu trữ tri thức.

Tiếp theo, kho lưu trữ tri thức được tích hợp vào quá trình xử lý giao diện người dùng trò chuyện.

Điều này về cơ bản giống như cơ chế RAG chung. Đối với đầu vào của người dùng, kiến thức liên quan được chọn từ kho lưu trữ tri thức và được chuyển đến LLM cùng với đầu vào của người dùng.

Điều này cho phép LLM tự động sử dụng kiến thức khi xử lý đầu vào của người dùng.

Bằng cách này, kiến thức tăng lên sau mỗi cuộc hội thoại với người dùng, cho phép một ALIS đơn giản sử dụng kiến thức tích lũy từ các cuộc hội thoại trước đó.

Kịch bản Đơn giản

Ví dụ, hãy tưởng tượng một kịch bản người dùng đang phát triển một ứng dụng web bằng cách sử dụng ALIS đơn giản này.

Người dùng sẽ báo cáo rằng mã do LLM đề xuất đã gây ra lỗi. Sau đó, người dùng và LLM sẽ hợp tác để khắc phục sự cố. Giả sử họ phát hiện ra rằng đặc tả API bên ngoài mà LLM biết đã lỗi thời, và việc điều chỉnh theo đặc tả API mới nhất đã giải quyết được vấn đề.

Trong trường hợp này, kiến thức về việc đặc tả API của LLM đã cũ và đặc tả API mới nhất là gì có thể được tích lũy trong kho lưu trữ tri thức từ luồng trò chuyện này.

Sau đó, khi tạo một chương trình sử dụng cùng API vào lần tới, ALIS có thể tận dụng kiến thức này để tạo ra một chương trình dựa trên đặc tả API mới nhất ngay từ đầu.

Cải thiện ALIS ban đầu

Tuy nhiên, để điều này xảy ra, kiến thức này cần được chọn để phản hồi đầu vào của người dùng. Có thể là kiến thức này không được liên kết trực tiếp với đầu vào của người dùng, vì tên của API có vấn đề khó có thể xuất hiện trong đầu vào ban đầu của người dùng.

Trong trường hợp như vậy, tên API sẽ chỉ xuất hiện lần đầu tiên trong phản hồi của LLM.

Do đó, chúng ta sẽ mở rộng ALIS đơn giản một chút bằng cách thêm cơ chế bình luận tiền kiểm trabình luận hậu kiểm tra.

Bình luận tiền kiểm tra tương tự như "chế độ suy nghĩ" gần đây trong các LLM. Chúng ta chuẩn bị một bộ nhớ có thể chứa văn bản dưới dạng bộ nhớ trạng thái, và hướng dẫn LLM thông qua một lời nhắc hệ thống để thực hiện bình luận tiền kiểm tra khi nhận được đầu vào của người dùng.

Kết quả bình luận tiền kiểm tra của LLM sau đó được đặt vào bộ nhớ trạng thái, và dựa trên kết quả này, kiến thức được chọn từ kho lưu trữ tri thức.

Sau đó, lịch sử trò chuyện, kết quả bình luận tiền kiểm tra, kiến thức tương ứng với đầu vào của người dùng và kiến thức tương ứng với kết quả bình luận tiền kiểm tra được chuyển đến LLM để nhận đầu ra của nó.

Hơn nữa, đối với kết quả được LLM trả về, kiến thức được tìm kiếm trong kho lưu trữ tri thức. Bao gồm bất kỳ kiến thức nào tìm thấy ở đó, LLM sau đó được yêu cầu thực hiện kiểm tra vi phạm quy tắc.

Nếu tìm thấy bất kỳ vấn đề nào, chúng sẽ được chuyển lại cho LLM trò chuyện cùng với các điểm vấn đề và lý do cho các nhận xét/phản hồi.

Bằng cách cung cấp cơ hội để chọn kiến thức trong cả bình luận tiền kiểm trabình luận hậu kiểm tra, chúng ta có thể tăng cơ hội tận dụng kiến thức đã tích lũy.

Triển vọng

Quá trình tạo ra ALIS ban đầu và bổ sung các cải tiến để khắc phục những điểm yếu của nó chính xác là phát triển linh hoạt (agile development), cho thấy rằng ALIS có thể được nâng cao một cách gia tăng.

Hơn nữa, như đã minh họa, ALIS ban đầu phù hợp nhất để sử dụng trong phát triển phần mềm. Điều này là do nó là một lĩnh vực có nhu cầu cao và là nơi kiến thức có thể được tích lũy rõ ràng.

Đây là một lĩnh vực mà kết quả rõ ràng, nhưng nó cần thiết và được hưởng lợi đáng kể từ việc thử và sai, tích lũy tri thức lặp đi lặp lại.

Ngoài ra, vì bản thân việc phát triển ALIS là phát triển phần mềm, nên việc các nhà phát triển ALIS cũng có thể là người dùng ALIS là một khía cạnh hấp dẫn.

Hơn nữa, cùng với hệ thống ALIS, hồ tri thức có thể được chia sẻ công khai trên các nền tảng như GitHub.

Điều này sẽ cho phép nhiều cá nhân đóng góp vào việc cải thiện hệ thống ALIS và tích lũy tri thức, với tất cả mọi người cùng hưởng lợi và đẩy nhanh quá trình phát triển ALIS một cách hiệu quả hơn nữa.

Tất nhiên, việc chia sẻ kiến thức không giới hạn ở các nhà phát triển ALIS; nó có thể được thu thập từ tất cả các nhà phát triển phần mềm sử dụng ALIS.

Tính chất ngôn ngữ tự nhiên của kiến thức mang lại hai lợi thế bổ sung.

Lợi thế đầu tiên là kiến thức vẫn có thể được sử dụng ngay cả khi các mô hình LLM thay đổi hoặc được cập nhật.

Lợi thế thứ hai là hồ tri thức khổng lồ đã tích lũy có thể được sử dụng làm tập dữ liệu tiền huấn luyện cho các LLM. Có hai cách để sử dụng điều này: như tinh chỉnh, hoặc cho chính quá trình tiền huấn luyện LLM.

Trong mọi trường hợp, nếu một LLM đã học tập bẩm sinh từ kiến thức tích lũy trong hồ tri thức có thể được sử dụng, việc phát triển phần mềm sẽ trở nên hiệu quả hơn nữa.

Hơn nữa, phát triển phần mềm liên quan đến nhiều quy trình khác nhau như phân tích yêu cầu, thiết kế, triển khai, kiểm thử, vận hành và bảo trì. Kiến thức chuyên biệt cũng tồn tại cho từng lĩnh vực phần mềm và nền tảng. Bằng cách tạo một cơ chế để phân chia lượng lớn kiến thức tích lũy từ các góc độ này, một dàn nhạc ALIS có thể được hình thành.

Do đó, các công nghệ nền tảng cho ALIS đã sẵn sàng. Bước quan trọng còn lại là thực tế thử nghiệm các phương pháp khác nhau — như bí quyết trích xuất kiến thức, lựa chọn kiến thức phù hợp, phân đoạn kiến thức chuyên biệt và tận dụng bộ nhớ trạng thái — để khám phá các cách tiếp cận hiệu quả. Khi độ phức tạp tăng lên, thời gian xử lý và chi phí sử dụng LLM cũng sẽ tăng, đòi hỏi phải tối ưu hóa.

Các quá trình thử và sai cũng như tối ưu hóa này có thể được tiến hành theo cách học tập thông qua việc phát triển và tinh chỉnh các khuôn khổ.

Ban đầu, các nhà phát triển, với tư cách là người dùng, có thể sẽ tích hợp các khuôn khổ vào ALIS thông qua thử và sai. Tuy nhiên, ngay cả khi đó, bản thân LLM cũng có thể được giao nhiệm vụ tạo ra các ý tưởng về khuôn khổ.

Sau đó, bằng cách kết hợp một khuôn khổ để cải thiện và khám phá các khuôn khổ vào ALIS, dựa trên kết quả nhận được từ thế giới và kiến thức đã trích xuất, bản thân ALIS sẽ thực hiện thử và sai và tối ưu hóa theo cách học tập.

ALIS trong Thế giới Thực

Khi ALIS đã được tinh chỉnh đến giai đoạn này, nó sẽ có khả năng thu nhận kiến thức trong nhiều lĩnh vực đa dạng, không chỉ giới hạn trong thế giới phát triển phần mềm.

Tương tự như phát triển phần mềm, ALIS được kỳ vọng sẽ mở rộng phạm vi ứng dụng sang các hoạt động trí tuệ khác nhau mà con người thực hiện bằng máy tính.

Ngay cả trong những hoạt động trí tuệ thuần túy như vậy, ALIS sẽ sở hữu một phẩm chất tương tự như một AI có thân thể (embodied AI) liên quan đến thế giới mục tiêu của nó.

Điều này là do nó nhận diện ranh giới giữa bản thân và thế giới, tác động lên thế giới thông qua ranh giới đó, và có thể nhận thức thông tin nhận được từ thế giới.

Khi ranh giới này với thế giới hữu hình và được cục bộ hóa ở một nơi, chúng ta thường gọi đó là một cơ thể.

Tuy nhiên, ngay cả khi ranh giới là vô hình và phân tán trong không gian, cấu trúc nhận thức và hành động thông qua một ranh giới vẫn giống như khi sở hữu một cơ thể vật lý.

Theo nghĩa này, một ALIS thực hiện các hoạt động trí tuệ có thể được coi là ảo sở hữu các đặc điểm của một AI có thân thể.

Và, nếu ALIS được tinh chỉnh đến giai đoạn mà nó có thể học hỏi một cách thích hợp ngay cả trong các thế giới mới, chưa biết, có khả năng ALIS có thể được tích hợp như một phần của một AI có thân thể thực sự sở hữu một cơ thể vật lý thực tế.

Bằng cách này, ALIS cuối cùng sẽ được áp dụng vào thế giới thực và bắt đầu học hỏi từ đó.