Bỏ qua đến nội dung
Bài viết này đã được dịch từ tiếng Nhật bằng AI
Đọc bằng tiếng Nhật
Bài viết này thuộc Miền Công Cộng (CC0). Hãy thoải mái sử dụng nó một cách tự do. CC0 1.0 Universal

Học cách học: Trí tuệ bẩm sinh

Trí tuệ nhân tạo có thể thể hiện hành vi thông minh thông qua công nghệ học máy.

Mặc dù quá trình học tập này tuân theo các quy trình do con người phát triển, nhưng vẫn chưa có lời giải thích đầy đủ về lý do tại sao trí thông minh lại xuất hiện từ các quy trình này và cấu trúc của trí tuệ nhân tạo.

Trong bài viết này, bằng cách suy ngẫm về bản chất của việc học, tôi đặt mục tiêu khám phá những lý do dẫn đến sự xuất hiện của trí thông minh.

Khi đi sâu hơn vào khái niệm học tập, chúng ta đi đến ý tưởng rằng cả trí tuệ nhân tạo và bộ não của chúng ta đều sở hữu bản chất bẩm sinh là học cách học.

Điều này gợi ý về sự tồn tại của một cơ chế có thể được gọi là Người tạo khung bẩm sinh.

Học tập thông qua cơ thể và Học tập thông qua ngôn ngữ

Chúng ta hiểu thế giới xung quanh và mở rộng khả năng của mình bằng cách quan sát các vật thể bằng mắt và vận động cơ thể.

Đây cũng là một hình thức học tập, có thể gọi là học tập thông qua cơ thể.

Mặt khác, khi nói chung về học tập, chúng ta có thể hình dung việc tăng cường kiến thức bằng cách đọc sách giáo khoa hoặc nghe giải thích từ giáo viên.

Ngoài việc học dựa trên chương trình giáo dục như vậy, chúng ta còn tiếp thu kiến thức đa dạng từ các cuộc trò chuyện với bạn bè, tin tức trực tuyến và các nguồn khác.

Kiểu học tập này không phải là ghi nhớ hình ảnh bằng thị giác hay học thông qua vận động cơ thể, mà là học tập thông qua ngôn ngữ.

Học tập siêu nhận thức và Học tập siêu hình

Trong việc học dựa trên ngôn ngữ, có những trường hợp kiến thức đòi hỏi lặp lại nhiều lần mới ghi nhớ được, và những trường hợp có thể học được chỉ sau một hoặc vài lần tiếp xúc.

Ngoài ra, một số kiến thức có thể được sử dụng bằng cách truy xuất chi tiết từ sách hoặc internet khi cần, ngay cả khi chưa ghi nhớ hoàn toàn.

Theo nghĩa thu nhận và sử dụng kiến thức một cách thích hợp khi cần, cả hai hình thức này đều có thể được coi là học tập.

Trong số đó, kiến thức không thể ghi nhớ nếu không lặp lại nhiều lần có thể được gọi là kiến thức siêu nhận thức. Quá trình học chính khái niệm đó là học tập siêu nhận thức.

Điều này tương tự như học tập thể chất, nơi sự lặp lại liên quan đến việc nhìn vật thể bằng mắt hoặc vận động cơ thể. Những điều này cũng có thể được phân loại là học tập siêu nhận thức.

Ngược lại, việc thu nhận kiến thức có thể ghi nhớ với ít lần thử hoặc được sử dụng bằng cách tra cứu ngay tại chỗ có thể được gọi là học tập siêu hình.

Trong trường hợp này, các khái niệm đã học trước đó thông qua học tập siêu nhận thức có thể được sử dụng để học kiến thức mới dưới dạng các loại khái niệm đó hoặc dưới dạng sự kết hợp của các khái niệm.

Vì các khái niệm đã được thành thạo thông qua học tập siêu nhận thức có thể được sử dụng, học tập siêu hình không yêu cầu lặp lại.

Học máy ngôn ngữ tự nhiên

Hãy áp dụng điều này vào học máy trong trí tuệ nhân tạo.

Thông thường, mạng nơ-ron được sử dụng trong học máy thực hiện học tập siêu nhận thức, bao gồm việc học lặp đi lặp lại các khái niệm.

Mặt khác, các mô hình ngôn ngữ lớn có khả năng xử lý ngôn ngữ tự nhiên tương tự con người có thể thực hiện học tập thông qua ngôn ngữ.

Trong quá trình tiền huấn luyệntinh chỉnh các mô hình ngôn ngữ lớn, học tập siêu nhận thức dựa trên ngôn ngữ diễn ra.

Một mô hình ngôn ngữ lớn đã được huấn luyện sau đó có thể trả lời bằng cách sử dụng kiến thức có trong câu đầu vào, điều này có nghĩa là nó đang thực hiện học tập siêu hình ngay lập tức.

Khả năng học tập siêu hình dựa trên ngôn ngữ này cho phép các mô hình ngôn ngữ lớn sử dụng kiến thức mới mà không cần học lặp đi lặp lại.

Điều này có thể đối lập với học máy số truyền thống, vốn điều chỉnh các tham số mô hình một cách lặp đi lặp lại, và có thể được gọi là học máy ngôn ngữ tự nhiên.

Ngôn ngữ tự nhiên như giao diện siêu hình

Ngôn ngữ tự nhiên nằm ở giao diện phân biệt học tập siêu nhận thức với học tập siêu hình.

Khía cạnh thú vị của ngôn ngữ tự nhiên là nó có thể được tiếp thu thông qua học tập siêu nhận thức, và trên nền tảng đó, học tập siêu hình trở nên khả thi.

Các giao diện siêu hình khác ngoài ngôn ngữ tự nhiên

Trên thực tế, học tập siêu nhận thứchọc tập siêu hình cũng tồn tại trong học tập thể chất. Ví dụ, một người giỏi thể thao có thể nhanh chóng thích nghi với một môn thể thao mới mà họ chưa từng gặp trước đây.

Tương tự, một người có kiến thức về sinh học có thể ngay lập tức hiểu được đặc điểm của một loài mới khi nhìn thấy nó.

Do đó, ngay cả trong học tập thể chất, vẫn tồn tại một giao diện siêu hình có vị trí tương tự như ngôn ngữ tự nhiên.

Khuôn khổ

Những gì nằm ở các giao diện này là một khuôn khổ khác biệt với các khái niệm hoặc kiến thức cơ bản; nó định nghĩa các mối quan hệ và cấu trúc của chúng, và cho phép cấu trúc hóa mới.

Khi kiến thức siêu nhận thức đa dạng được thu nhận thông qua học tập siêu nhận thức, đôi khi có thể học được khuôn khổ tại giao diện siêu hình từ các kết nối giữa các mảnh kiến thức siêu nhận thức này.

Một khuôn khổ bắt nguồn từ học tập thể chất cho phép tiếp thu kiến thức mới ngay lập tức thông qua học tập siêu hình sau khi đã thành thạo. Tuy nhiên, kiến thức thu được thông qua học tập siêu hình như vậy không dễ dàng truyền đạt cho người khác.

Mặt khác, khuôn khổ bắt nguồn từ học tập thông qua ngôn ngữ chính là ngôn ngữ tự nhiên.

Do đó, kiến thức thu được thông qua học tập siêu hình bằng cách học khuôn khổ ngôn ngữ tự nhiên có thể được nhập trực tiếp vào quá trình tiếp thu ngôn ngữ của người khác.

Điều này không chỉ áp dụng cho kiến thức chủ yếu dựa trên tiếp thu ngôn ngữ, chẳng hạn như sách giáo khoa hoặc tin tức trực tuyến.

Một cầu thủ bóng đá giàu kinh nghiệm lần đầu thử chơi bóng chày có thể diễn đạt kiến thức siêu hình về bóng chày mà họ đã học được, và truyền đạt nó cho các cầu thủ bóng đá giàu kinh nghiệm khác. Điều này có nghĩa là nếu mọi người chia sẻ cùng một kiến thức siêu nhận thức, họ có thể truyền đạt những gì được gọi là "mẹo" hoặc "bí quyết" bằng lời nói.

Hơn nữa, người ta có thể truyền đạt kiến thức bằng lời nói về một loài mới mà họ quan sát được cho các nhà sinh vật học khác, từ đó chia sẻ kiến thức đó.

Như vậy, ngôn ngữ tự nhiên được tiết lộ là một khuôn khổ rất mạnh mẽ nằm ở giao diện siêu hình.

Khung ảo

Trên nền tảng ngôn ngữ tự nhiên, một khuôn khổ khác có thể được tiếp thu.

Những khuôn khổ này bao gồm các khuôn khổ chuyên biệt theo lĩnh vực hoặc các khuôn khổ siêu hình.

Trong các lĩnh vực học thuật, lĩnh vực kinh doanh và cuộc sống hàng ngày khác nhau, có rất nhiều khuôn khổ chuyên biệt theo lĩnh vực.

Các học giả có thể tạo ra những khám phá mới trong các khuôn khổ chuyên biệt của họ và dễ dàng truyền đạt những khám phá này dưới dạng kiến thức cho các học giả khác cũng sở hữu cùng khuôn khổ.

Bản thân khuôn khổ đôi khi có thể được diễn đạt bằng ngôn ngữ tự nhiên, trong trường hợp đó, các cá nhân hoặc mô hình ngôn ngữ lớn sở hữu một khuôn khổ ngôn ngữ tự nhiên có thể tiếp thu và hiểu nó.

Các mô hình kinh doanh và công thức nấu ăn cũng là những ví dụ về các khuôn khổ chuyên biệt theo lĩnh vực có thể được diễn đạt bằng ngôn ngữ tự nhiên.

Hơn nữa, các công thức toán học, ngôn ngữ lập trình và các khuôn khổ phân tích kinh doanh là các khuôn khổ hình thức.

Những điều này cũng có thể được diễn đạt hoặc giải thích bằng ngôn ngữ tự nhiên.

Các khuôn khổ chuyên biệt theo lĩnh vực và các khuôn khổ hình thức được xây dựng trên ngôn ngữ tự nhiên như vậy có thể được gọi là khung ảo.

Điều này có thể dễ dàng hiểu được bằng cách tưởng tượng một máy ảo chạy một hệ điều hành khác trên một máy tính vật lý. Một khuôn khổ khác đang hoạt động trên nền tảng ngôn ngữ tự nhiên, đóng vai trò là khuôn khổ cơ sở.

Khung bản địa

Ban đầu, khung ảo này phải được hiểu thông qua ngôn ngữ tự nhiên, nhưng với sự luyện tập, nó sẽ bỏ qua việc giải thích và hiểu thông qua ngôn ngữ tự nhiên và bắt đầu hoạt động trực tiếp như một khuôn khổ giao diện siêu hình được xây dựng dựa trên kiến thức siêu nhận thức.

Điều này có thể được gọi là khung bản địa.

Ngôn ngữ tự nhiên, theo một nghĩa nào đó, là một khung bản địa, nhưng chỉ trong trường hợp tiếng mẹ đẻ của một người. Nói chung, các ngôn ngữ không phải tiếng mẹ đẻ được tiếp thu dưới dạng khung ảo. Khi trình độ thông thạo tăng lên, chúng sẽ tiếp cận trạng thái của một khung bản địa.

Điều tương tự cũng áp dụng cho các khuôn khổ chuyên biệt theo lĩnh vực và các khuôn khổ hình thức. Các nhà toán học có thể giao tiếp với nhau một cách tự nhiên bằng các công thức toán học, và các lập trình viên có thể hiểu ý định của nhau chỉ thông qua mã nguồn mà không cần bình luận.

Điều này cho thấy rằng sự chuyển đổi từ khung ảo sang khung bản địa cũng có thể được áp dụng cho các mô hình ngôn ngữ lớn.

Ý tưởng phát hiện các khung ảo được sử dụng thường xuyên, tạo ra một lượng lớn dữ liệu ví dụ sử dụng các khung ảo đó, và sau đó tinh chỉnh chúng để trở thành khung bản địa sẽ đáng để thử ngay lập tức.

Người tạo khung bẩm sinh

Khi xem xét điều này, chúng ta nhận ra rằng các mô hình ngôn ngữ lớn có thể đang học các khuôn khổ chuyên biệt và hình thức này không chỉ trong quá trình tinh chỉnh mà còn trong quá trình tiền huấn luyện.

Hơn nữa, trong quá trình đó, có khả năng là chúng không học các khuôn khổ chuyên biệt hoặc hình thức một cách bẩm sinh ngay từ đầu. Thay vào đó, chúng học khuôn khổ ngôn ngữ tự nhiên trước, sau đó, trong hoặc sau khi đạt được trình độ thông thạo về nó, chúng học các khuôn khổ chuyên biệt hoặc hình thức và đồng hóa chúng thành khuôn khổ bản địa.

Đi sâu vào ý tưởng học khuôn khổ tăng dần này, cũng có thể hình dung rằng bản thân việc học ngôn ngữ tự nhiên là một quy trình song song của việc học khuôn khổ tăng dần, có độ hạt cao.

Nghĩa là, từ một lượng lớn văn bản được cung cấp làm dữ liệu học trong quá trình tiền huấn luyện, các mô hình ngôn ngữ lớn có thể không chỉ học các khái niệm riêng lẻ, mà còn học một số quy tắc rất đơn giản của ngôn ngữ tự nhiên dưới dạng khuôn khổ. Sau đó, sử dụng các khuôn khổ đơn giản này làm nền tảng, chúng có thể lặp đi lặp lại việc học các quy tắc phức tạp hơn một chút.

Bằng cách này, bắt đầu từ giai đoạn học các khái niệm từ riêng lẻ, chúng sẽ có thể tiếp thu các từ ghép và ngữ pháp cơ bản, sau đó hiểu các câu, và cuối cùng học các yếu tố phức tạp như kỹ thuật văn học và phong cách diễn đạt.

Điều này có thể được hiểu như một mô hình học khuôn khổ phân lớp và tổng hợp, trong đó một khuôn khổ đóng vai trò là nền tảng để học cái tiếp theo.

Điều này làm nổi bật hình ảnh các mô hình ngôn ngữ lớn là Người tạo khung bẩm sinh, vốn sở hữu cơ chế học khuôn khổ ngay từ đầu.

Cơ chế chú ý

Công nghệ hiện thực hóa Người tạo khung bẩm sinhcơ chế chú ý.

Cơ chế chú ý giống như việc chọn các mã thông báo cần được tập trung trong một ngữ cảnh. Nó làm rõ mối quan hệ giữa các mã thông báo. Điều này chính xác là bản chất của một khuôn khổ: trừu tượng hóa bằng cách giữ lại các khái niệm quan trọng trong khi làm rõ mối quan hệ giữa các khái niệm đó.

Bằng cách chuyển đổi lựa chọn này cho mỗi mã thông báo, cũng có thể chuyển đổi khuôn khổ một cách linh hoạt.

Điều này cho phép chúng ta giải thích tại sao cơ chế chú ý là một công nghệ quyết định cho sự phát triển của các mô hình ngôn ngữ lớn, bằng cách sử dụng mô hình Người tạo khung bẩm sinh.

Kết luận

Nếu cơ chế này thực sự xảy ra trong quá trình tiền huấn luyện của các mô hình ngôn ngữ lớn, thì cơ chế bí ẩn trước đây của các mô hình này sẽ trở nên có thể giải thích được.

Lời giải thích này bao gồm học tập siêu nhận thức và siêu hình mà chúng ta đã thảo luận, khuôn khổ như một giao diện siêu hình, ngôn ngữ tự nhiên cho phép tiếp thu ngôn ngữcác khung ảo, và cơ chế chú ý hiện thực hóa Người tạo khung bẩm sinh.

Hơn nữa, hai hàm ý bổ sung phát sinh từ điều này.

Đầu tiên, ngôn ngữ tự nhiên sở hữu một cấu trúc rất phù hợp để phát triển dần dần các khuôn khổ phức tạp từ những khuôn khổ đơn giản thành khuôn khổ bản địa.

Nếu ngôn ngữ tự nhiên ban đầu xuất hiện dưới dạng đơn giản trong các xã hội loài người và dần dần phát triển để sở hữu một cấu trúc phức tạp và phong phú hơn, thì đây là một hệ quả tự nhiên.

Hơn nữa, một cấu trúc cho phép học nhanh sẽ là một lợi thế. Giả sử nhiều xã hội với các ngôn ngữ tự nhiên khác nhau đã cạnh tranh, thì giả thuyết rằng ngôn ngữ tự nhiên phù hợp nhất để học đã tồn tại cho đến ngày nay dễ dàng được thiết lập.

Suy ngẫm về bản chất của ngôn ngữ tự nhiên dẫn đến hàm ý thứ hai: rằng chúng ta, con người, cũng là Người tạo khung bẩm sinh.

Ngay cả khi các nền tảng và cơ chế cụ thể khác nhau, bộ não của chúng ta cũng phải được trang bị một hệ thống, tương tự như cơ chế chú ý, học tập dần dần và sửa đổi các khuôn khổ một cách linh hoạt.