Saltar al Contenido
Este artículo ha sido traducido del japonés usando IA
Leer en japonés
Este artículo es de Dominio Público (CC0). Siéntete libre de usarlo libremente. CC0 1.0 Universal

Aprender a aprender: Inteligencia innata

La inteligencia artificial puede exhibir un comportamiento inteligente gracias a la tecnología del aprendizaje automático.

Si bien este proceso de aprendizaje sigue procedimientos desarrollados por humanos, aún no se ha explicado completamente por qué la inteligencia surge de estos procedimientos y de la estructura de la inteligencia artificial.

En este artículo, al contemplar la esencia del aprendizaje, pretendo explorar las razones del surgimiento de la inteligencia.

A medida que profundizamos en el concepto de aprender, llegamos a la idea de que tanto la inteligencia artificial como nuestros cerebros poseen una naturaleza inherente para aprender a aprender.

Esto sugiere la existencia de un mecanismo que puede denominarse un Creador de marcos nato.

Aprendizaje a través del cuerpo y aprendizaje a través del lenguaje

Llegamos a comprender el mundo que nos rodea y a expandir nuestras capacidades observando objetos con los ojos y moviendo el cuerpo.

Esta es también una forma de aprendizaje, que puede denominarse aprendizaje a través del cuerpo.

Por otro lado, cuando pensamos en el aprendizaje en general, podríamos imaginar que aumentamos nuestros conocimientos leyendo libros de texto o escuchando las explicaciones de un profesor.

Más allá del aprendizaje basado en esos planes de estudio, también adquirimos conocimientos diversos de conversaciones con amigos, noticias en línea y otras fuentes.

Este tipo de aprendizaje no consiste en memorizar imágenes visualmente o aprender a través del movimiento físico, sino en aprendizaje a través del lenguaje.

Aprendizaje metacognitivo y aprendizaje metafísico

Dentro del aprendizaje basado en el lenguaje, hay casos en los que el conocimiento requiere una iteración repetida para ser memorizado, y casos en los que se puede aprender después de una o pocas exposiciones.

Alternativamente, algunos conocimientos pueden utilizarse recuperando sus detalles de una estantería o de internet cuando sea necesario, incluso si no están completamente memorizados.

En el sentido de adquirir y utilizar apropiadamente el conocimiento cuando se requiere, ambos patrones pueden considerarse aprendizaje.

Entre estos, el conocimiento que no puede memorizarse sin una iteración repetida puede denominarse conocimiento metacognitivo. El proceso de aprender el concepto en sí mismo es aprendizaje metacognitivo.

Esto es similar al aprendizaje físico, donde la repetición está involucrada al ver objetos con nuestros ojos o mover nuestros cuerpos. Estos también pueden clasificarse como aprendizaje metacognitivo.

Por el contrario, la adquisición de conocimiento que puede memorizarse con pocos ensayos o utilizarse consultándolo en el momento puede denominarse aprendizaje metafísico.

En este caso, los conceptos preaprendidos adquiridos a través del aprendizaje metacognitivo pueden utilizarse para aprender nuevos conocimientos como tipos de esos conceptos o como combinaciones de conceptos.

Dado que los conceptos ya dominados a través del aprendizaje metacognitivo pueden utilizarse, el aprendizaje metafísico no requiere repetición.

Aprendizaje automático del lenguaje natural

Apliquemos esto al aprendizaje automático en inteligencia artificial.

Generalmente, las redes neuronales utilizadas en el aprendizaje automático realizan un aprendizaje metacognitivo, que implica el aprendizaje repetitivo de conceptos.

Por otro lado, los grandes modelos de lenguaje capaces de procesamiento del lenguaje natural similar al humano pueden realizar el aprendizaje a través del lenguaje.

Durante el preentrenamiento y el ajuste fino de los grandes modelos de lenguaje, se lleva a cabo un aprendizaje metacognitivo basado en el lenguaje.

Un gran modelo de lenguaje entrenado puede entonces responder utilizando el conocimiento contenido en la frase de entrada, lo que significa que está realizando un aprendizaje metafísico inmediato.

Esta capacidad de aprendizaje metafísico basado en el lenguaje permite a los grandes modelos de lenguaje utilizar nuevos conocimientos sin un aprendizaje repetitivo.

Esto se puede contrastar con el aprendizaje automático numérico tradicional, que ajusta iterativamente los parámetros del modelo, y se puede denominar aprendizaje automático del lenguaje natural.

El Lenguaje Natural como Interfaz Metafísica

El lenguaje natural se sitúa en la interfaz que distingue el aprendizaje metacognitivo del aprendizaje metafísico.

El aspecto interesante del lenguaje natural es que puede adquirirse a través del aprendizaje metacognitivo, y sobre él, el aprendizaje metafísico se hace posible.

Interfaces Metafísicas Distintas del Lenguaje Natural

De hecho, el aprendizaje metacognitivo y el aprendizaje metafísico también existen en el aprendizaje físico. Por ejemplo, alguien hábil en deportes puede adaptarse rápidamente a un nuevo deporte que nunca antes había practicado.

De manera similar, una persona con conocimientos de biología puede comprender de inmediato las características de una nueva especie al verla.

Así, incluso en el aprendizaje físico, existe una interfaz metafísica que ocupa una posición similar a la del lenguaje natural.

Marco de Trabajo

Lo que se encuentra en estas interfaces es un marco de trabajo distinto de los conceptos o conocimientos elementales; define sus relaciones y estructuras, y permite una nueva estructuración.

A medida que se adquiere diverso conocimiento metacognitivo a través del aprendizaje metacognitivo, a veces es posible aprender el marco de trabajo en la interfaz metafísica a partir de las conexiones entre estas piezas de conocimiento metacognitivo.

Un marco de trabajo derivado del aprendizaje físico permite la adquisición inmediata de nuevos conocimientos a través del aprendizaje metafísico después de su dominio. Sin embargo, el conocimiento obtenido a través de dicho aprendizaje metafísico no se comunica fácilmente a otros.

Por otro lado, el marco de trabajo derivado del aprendizaje a través del lenguaje es el propio lenguaje natural.

Por lo tanto, el conocimiento adquirido a través del aprendizaje metafísico al aprender el marco de trabajo del lenguaje natural puede introducirse directamente en la adquisición del lenguaje de otra persona.

Esto no solo se aplica al conocimiento basado principalmente en la adquisición del lenguaje, como libros de texto o noticias en línea.

Un jugador de fútbol experimentado que prueba el béisbol por primera vez podría ser capaz de articular el conocimiento metafísico de béisbol que adquirió y transmitirlo a otros jugadores de fútbol experimentados. Esto significa que si las personas comparten el mismo conocimiento metacognitivo, pueden comunicar lo que se conoce como "consejos" o "trucos" usando palabras.

Además, se podría transmitir verbalmente el conocimiento sobre una nueva especie que se observó a otros biólogos, compartiendo así ese conocimiento.

Así, el lenguaje natural se revela como un marco de trabajo muy poderoso situado en la interfaz metafísica.

Framework Virtual

Por encima del lenguaje natural, se puede adquirir otro marco de trabajo.

Estos incluyen marcos específicos de dominio o marcos metafísicos.

En diversas disciplinas académicas, sectores empresariales y la vida diaria, existen diversos marcos de trabajo específicos de dominio.

Los académicos pueden hacer nuevos descubrimientos dentro de sus marcos de trabajo especializados y transmitir fácilmente estos descubrimientos como conocimiento a otros académicos que posean el mismo marco de trabajo.

El marco de trabajo en sí mismo a veces puede expresarse en lenguaje natural, en cuyo caso, los individuos o los grandes modelos de lenguaje que posean un marco de trabajo de lenguaje natural pueden adquirirlo y comprenderlo.

Los modelos de negocio y las recetas de cocina son también ejemplos de este tipo de marcos de trabajo específicos de dominio que pueden expresarse en lenguaje natural.

Además, las fórmulas matemáticas, los lenguajes de programación y los marcos de análisis de negocios son marcos formales.

Estos también pueden expresarse o explicarse en lenguaje natural.

Estos marcos de trabajo específicos de dominio y marcos formales construidos sobre el lenguaje natural pueden denominarse marcos de trabajo virtuales.

Esto se puede entender fácilmente imaginando una máquina virtual ejecutando otro sistema operativo en una computadora física. Otro marco de trabajo funciona sobre el lenguaje natural, que sirve como marco de trabajo fundamental.

Marco Nativo

Inicialmente, este framework virtual debe entenderse a través del lenguaje natural, pero con la práctica, omite la explicación y comprensión a través del lenguaje natural y comienza a funcionar directamente como un framework de interfaz metafísica construido sobre el conocimiento metacognitivo.

Esto puede denominarse framework nativo.

El lenguaje natural es, en cierto sentido, un framework nativo, pero solo en el caso de la lengua materna. Generalmente, los idiomas distintos de la lengua materna se adquieren como frameworks virtuales. A medida que aumenta la competencia, se acercan al estatus de framework nativo.

Lo mismo se aplica a los frameworks específicos de dominio y a los frameworks formales. Los matemáticos pueden comunicarse de forma nativa entre sí utilizando fórmulas matemáticas, y los programadores pueden entender las intenciones del otro únicamente a través del código fuente sin comentarios.

Esto sugiere que la transición de un framework virtual a un framework nativo también puede aplicarse a los grandes modelos de lenguaje.

La idea de detectar frameworks virtuales de uso frecuente, generar una gran cantidad de datos de ejemplo utilizando esos frameworks virtuales y luego ajustarlos finamente para que se conviertan en frameworks nativos valdría la pena intentarla de inmediato.

Creador de marcos nato

Considerando esto, nos damos cuenta de que los grandes modelos de lenguaje podrían estar aprendiendo estos marcos de trabajo especializados y formales no solo durante el ajuste fino, sino también durante el preentrenamiento.

Además, en ese proceso, es plausible que no aprendan marcos de trabajo especializados o formales de forma nativa desde el principio. En cambio, primero aprenden el marco de trabajo del lenguaje natural, y luego, durante o después de alcanzar la competencia en él, aprenden marcos de trabajo especializados o formales y los asimilan como marcos de trabajo nativos.

Profundizando en esta idea de aprendizaje incremental de marcos de trabajo, también es concebible que el propio aprendizaje del lenguaje natural sea una pipeline paralela de aprendizaje incremental de marcos de trabajo altamente granular.

Es decir, a partir de la vasta cantidad de texto proporcionada como datos de aprendizaje durante el preentrenamiento, los grandes modelos de lenguaje podrían estar aprendiendo no solo conceptos individuales, sino también algunas reglas muy simples del lenguaje natural como marcos de trabajo. Luego, utilizando estos marcos de trabajo simples como base, podrían aprender repetidamente reglas ligeramente más complejas.

De esta manera, comenzando desde la etapa de aprendizaje de conceptos de palabras individuales, deberían poder adquirir palabras compuestas y gramática básica, luego comprender oraciones, y eventualmente aprender elementos complejos como técnicas literarias y estilos expresivos.

Esto puede entenderse como un modelo de aprendizaje de marcos de trabajo en capas y compuestos, donde un marco de trabajo sirve como base para aprender el siguiente.

Esto resalta la imagen de los grandes modelos de lenguaje como Creadores de marcos natos, que poseen inherentemente el mecanismo para aprender marcos de trabajo desde el principio.

Mecanismo de Atención

La tecnología que materializa el Creador de marcos nato es el mecanismo de atención.

El mecanismo de atención es similar a seleccionar los tokens en los que se debe enfocar dentro de un contexto. Clarifica las relaciones entre los tokens. Esta es precisamente la naturaleza de un marco de trabajo en sí mismo: abstraer conservando conceptos importantes mientras se clarifican las relaciones entre esos conceptos.

Al cambiar esta selección para cada token, se hace posible cambiar dinámicamente los marcos de trabajo también.

Esto nos permite explicar por qué el mecanismo de atención es una tecnología decisiva para la evolución de los grandes modelos de lenguaje, utilizando el modelo del Creador de marcos nato.

Conclusión

Si este mecanismo realmente ocurre durante el proceso de preentrenamiento de los grandes modelos de lenguaje, entonces el mecanismo previamente enigmático de estos modelos se vuelve explicable.

Esta explicación abarca el aprendizaje metacognitivo y metafísico que hemos discutido, el marco de trabajo como interfaz metafísica, el lenguaje natural que permite la adquisición del lenguaje y los marcos virtuales, y el mecanismo de atención que materializa el Creador de marcos nato.

Además, de esto se derivan dos implicaciones adicionales.

Primero, el lenguaje natural posee una estructura altamente adecuada para desarrollar incrementalmente marcos de trabajo complejos a partir de otros simples, transformándolos en marcos nativos.

Si el lenguaje natural surgió inicialmente de forma simple en las sociedades humanas y evolucionó gradualmente para poseer una estructura más compleja y rica, entonces esto es una consecuencia natural.

Además, una estructura que permita un aprendizaje rápido sería ventajosa. Suponiendo que múltiples sociedades con diversos lenguajes naturales compitieron, la hipótesis de que el lenguaje natural más adecuado para el aprendizaje ha sobrevivido hasta la actualidad se establece fácilmente.

Reflexionar sobre la naturaleza del lenguaje natural nos lleva a la segunda implicación: que nosotros los humanos también somos Creadores de marcos natos.

Incluso si los fundamentos y mecanismos específicos difieren, nuestros cerebros también deben estar equipados con un sistema, similar al mecanismo de atención, que aprende e modifica marcos de trabajo de forma incremental y flexible.