La inteligencia artificial adquiere un comportamiento inteligente a través de una tecnología llamada aprendizaje automático.
Aunque este aprendizaje se lleva a cabo según procedimientos desarrollados por humanos, aún no se ha explicado por qué la inteligencia surge de estos procedimientos y de la estructura de la inteligencia artificial.
En este artículo, exploraré las razones por las que surge la inteligencia al considerar la esencia del aprendizaje en sí mismo.
Y a medida que profundicemos en el concepto de aprendizaje, llegaremos a la idea de que tanto la inteligencia artificial como nuestros cerebros poseen una tendencia innata a aprender a aprender.
Esto sugiere la existencia de un mecanismo que puede denominarse "constructor de marcos innato".
Aprendizaje a través del cuerpo vs. Aprendizaje a través del lenguaje
Aprendemos sobre el mundo que nos rodea y expandimos nuestras capacidades al ver cosas con nuestros ojos y mover nuestros cuerpos.
Esta es también una forma de aprendizaje, que puede denominarse aprendizaje a través del cuerpo.
Por otro lado, cuando la gente generalmente habla de aprender, probablemente imagina aumentar el conocimiento leyendo libros de texto o escuchando las explicaciones de un profesor.
Además de este aprendizaje basado en el currículo, también adquirimos diversos conocimientos de conversaciones con amigos, noticias en línea, etc.
Este tipo de aprendizaje no consiste en memorizar imágenes visualmente o aprender moviendo el cuerpo; es aprendizaje a través del lenguaje.
Aprendizaje Subfísico y Aprendizaje Metafísico
Dentro del aprendizaje a través del lenguaje, hay casos en los que la información solo puede memorizarse mediante la repetición reiterada, y casos en los que puede memorizarse después de escucharla una o pocas veces.
Alternativamente, existe conocimiento que, aunque no se recuerden los detalles, puede utilizarse recuperándolo de una estantería o de internet en el momento necesario.
En el sentido de adquirir conocimiento y utilizarlo apropiadamente cuando se necesita, ambos patrones pueden llamarse aprendizaje.
De estos, el conocimiento que solo puede memorizarse mediante la repetición reiterada puede denominarse conocimiento subfísico. El proceso de aprendizaje para esto es el aprendizaje subfísico, que implica memorizar los conceptos mismos.
Esto es similar al aprendizaje físico, donde uno aprende repetidamente viendo objetos con los ojos o moviendo el cuerpo. Estos también pueden clasificarse como aprendizaje subfísico.
Por otro lado, la adquisición de conocimiento que puede memorizarse con menos repeticiones, o buscarse y usarse en el momento, puede denominarse aprendizaje metafísico.
En este caso, los conceptos previamente aprendidos y adquiridos a través del aprendizaje subfísico pueden utilizarse para aprender conocimiento como tipos de esos conceptos o como combinaciones de conceptos.
Dado que los conceptos ya adquiridos a través del aprendizaje subfísico pueden utilizarse, el aprendizaje metafísico no requiere repetición.
Aprendizaje Automático de Lenguaje Natural
Apliquemos esto al aprendizaje automático en inteligencia artificial.
Generalmente, las redes neuronales utilizadas en el aprendizaje automático realizan un aprendizaje subfísico, que implica el aprendizaje repetido de conceptos.
Por otro lado, los grandes modelos de lenguaje, capaces de procesamiento de lenguaje natural similar al humano, pueden realizar el aprendizaje a través del lenguaje.
Durante el preentrenamiento y el ajuste fino de los grandes modelos de lenguaje, tiene lugar el aprendizaje subfísico a través del lenguaje.
Además, un gran modelo de lenguaje preentrenado puede responder utilizando el conocimiento contenido en la frase de entrada, realizando así un aprendizaje metafísico inmediato.
Gracias a esta capacidad de aprendizaje metafísico a través del lenguaje, los grandes modelos de lenguaje pueden utilizar nuevos conocimientos sin un aprendizaje repetitivo.
Esto puede denominarse aprendizaje automático de lenguaje natural, en contraste con el aprendizaje automático numérico tradicional que ajusta iterativamente los parámetros del modelo.
El Lenguaje Natural como Interfaz Metafísica
El lenguaje natural se sitúa en la interfaz que separa el aprendizaje subfísico y el metafísico.
El aspecto fascinante del lenguaje natural es que puede adquirirse mediante el aprendizaje subfísico y, además, permite el aprendizaje metafísico.
Interfaces Metafísicas Distintas del Lenguaje Natural
En realidad, incluso en el aprendizaje físico, existen tanto el aprendizaje subfísico como el metafísico. Por ejemplo, alguien hábil en deportes puede adaptarse rápidamente a un juego nuevo que encuentra por primera vez.
De manera similar, alguien con conocimientos en biología puede comprender de inmediato las características de una nueva especie al verla.
Así, también en el aprendizaje físico, existen interfaces metafísicas que ocupan una posición similar a la del lenguaje natural.
Marcos de trabajo (Frameworks)
En estas interfaces se encuentran los marcos de trabajo que, a diferencia de los conceptos o conocimientos elementales, definen sus relaciones y estructuras, o permiten una nueva estructuración.
A medida que se adquiere una variedad de conocimiento subfísico a través del aprendizaje subfísico, es posible aprender el marco de trabajo en la interfaz metafísica a partir de las conexiones entre las piezas de conocimiento subfísico.
Los marcos de trabajo adquiridos a través del aprendizaje físico permiten que el nuevo conocimiento se aprenda inmediatamente de forma metafísica después de su adquisición. Sin embargo, no es fácil transmitir a otros el conocimiento adquirido a través de este aprendizaje metafísico.
Por otro lado, el marco de trabajo adquirido a través del aprendizaje por medio del lenguaje es el propio lenguaje natural.
Por lo tanto, el conocimiento adquirido a través del aprendizaje metafísico, después de aprender el marco de trabajo del lenguaje natural, puede ser introducido directamente en el aprendizaje de otras personas a través del lenguaje.
Esto no solo se aplica al conocimiento donde el aprendizaje a través del lenguaje, como los libros de texto o las noticias en línea, es fundamental.
Un futbolista experimentado, al jugar béisbol por primera vez, podría ser capaz de transmitir el conocimiento metafísico adquirido sobre el béisbol a otros futbolistas a través de palabras. Esto significa que si las personas comparten el mismo conocimiento subfísico, los llamados "trucos" o el know-how pueden comunicarse verbalmente.
Además, se podría compartir el conocimiento sobre una especie recién descubierta que se presenció con otros biólogos a través de palabras.
Así, el lenguaje natural se revela como un marco de trabajo muy potente en la interfaz metafísica.
Marcos Virtuales
Por encima del lenguaje natural, se pueden adquirir otros marcos de trabajo.
Estos son marcos de trabajo específicos de dominio o marcos de trabajo formales.
Dentro de varios campos académicos, sectores empresariales y la vida diaria, existen diversos marcos de trabajo específicos de dominio.
Los académicos, operando dentro del marco de su especialidad, pueden hacer nuevos descubrimientos y transmitir fácilmente ese conocimiento a otros académicos que poseen el mismo marco de trabajo.
El marco de trabajo en sí mismo a veces puede expresarse en lenguaje natural, en cuyo caso puede ser aprendido y comprendido por personas o grandes modelos de lenguaje que poseen el marco de lenguaje natural.
Los modelos de negocio y las recetas de cocina también son ejemplos de tales marcos de trabajo específicos de dominio que pueden expresarse en lenguaje natural.
Además, las fórmulas matemáticas, los lenguajes de programación y los marcos de análisis de negocio son marcos de trabajo formales.
Estos también pueden tener sus marcos de trabajo expresados o explicados en lenguaje natural.
Estos marcos de trabajo específicos de dominio y formales construidos sobre el lenguaje natural pueden llamarse marcos virtuales.
Esto es fácil de entender si se imagina una máquina virtual ejecutando un sistema operativo diferente en una computadora física. Otro marco de trabajo funciona sobre el marco fundamental del lenguaje natural.
Marcos Nativos
Además, si bien estos marcos virtuales inicialmente deben entenderse a través del lenguaje natural, a medida que uno se acostumbra a ellos, comienzan a eludir la explicación y comprensión del lenguaje natural, funcionando directamente como un marco de interfaz metafísica construido sobre el conocimiento subfísico.
Esto puede denominarse un marco nativo.
El lenguaje natural es, en cierto sentido, también un marco nativo, pero solo en lo que respecta a la lengua materna. Generalmente, los idiomas distintos de la lengua materna se adquieren como marcos virtuales. A medida que aumenta la competencia, se acercan a convertirse en marcos nativos.
Lo mismo se aplica a los marcos específicos de dominio y formales. Los matemáticos pueden comunicarse de forma nativa utilizando fórmulas matemáticas, y los programadores pueden entender las intenciones de los demás únicamente a través del código fuente sin comentarios.
Esto sugiere que la progresión de los marcos virtuales a los nativos también puede aplicarse a los grandes modelos de lenguaje.
La idea de detectar marcos virtuales de uso frecuente, generar una gran cantidad de datos de ejemplo utilizando esos marcos y luego ajustarlos finamente para que se conviertan en marcos nativos, vale la pena probarla de inmediato.
Constructores de Marcos Innatos (Natural Born Frameworkers)
Considerando esto, uno se da cuenta de que durante el preentrenamiento de los grandes modelos de lenguaje, no solo en el ajuste fino, existe la posibilidad de que también estén aprendiendo marcos de trabajo específicos del dominio y formales.
Y en ese proceso, es concebible que, en lugar de aprender de forma nativa los marcos de trabajo específicos del dominio o formales desde el principio, primero aprendan el marco del lenguaje natural y luego, durante o después de dominarlo, aprendan los marcos de trabajo específicos del dominio y formales, haciéndolos nativos.
Profundizando en este aprendizaje de marcos de trabajo por etapas, también es concebible que el propio aprendizaje del lenguaje natural sea un proceso paralelo de aprendizaje de marcos de trabajo por etapas, muy granular.
En otras palabras, a partir de la enorme cantidad de texto proporcionado como datos de entrenamiento durante el preentrenamiento, los grandes modelos de lenguaje podrían no solo aprender conceptos individuales, sino también algunas reglas muy simples del lenguaje natural como marco de trabajo. Luego, utilizando estos marcos simples como base, aprenderían repetidamente reglas un poco más complejas.
Esto les permitiría progresar de una etapa en la que inicialmente aprendieron conceptos de palabras a memorizar palabras compuestas y gramática básica, y luego a comprender oraciones y aprender cosas complejas como técnicas de escritura y expresión.
Esto puede entenderse como un modelo en el que aprenden marcos de trabajo de manera escalonada y compleja, utilizando un marco de trabajo como base para aprender el siguiente.
Esto destaca a los grandes modelos de lenguaje como "constructores de marcos innatos", que poseen un mecanismo para aprender marcos de trabajo desde el principio.
Mecanismo de Atención
La tecnología que materializa al "constructor de marcos innato" es el mecanismo de atención.
El mecanismo de atención es similar a seleccionar tokens relevantes de un contexto. Aclara las relaciones entre los tokens. Esto es precisamente la naturaleza de un marco de trabajo: abstraer reteniendo conceptos importantes mientras se aclaran las relaciones entre ellos.
Al cambiar esta selección para cada token, permite un cambio dinámico de marcos de trabajo.
Esto nos permite explicar por qué el mecanismo de atención es una tecnología que determina la evolución de los grandes modelos de lenguaje, utilizando el modelo del "constructor de marcos innato".
Conclusión
Si este mecanismo realmente ocurre durante el proceso de preentrenamiento de los grandes modelos de lenguaje, entonces los mecanismos previamente misteriosos de estos modelos pueden explicarse.
Estos incluyen el aprendizaje subfísico y metafísico discutidos aquí, los marcos de trabajo como interfaces metafísicas, el lenguaje natural que permite el aprendizaje a través del lenguaje y los marcos virtuales, y el mecanismo de atención que hace realidad al "constructor de marcos innato".
Además, se sugieren dos puntos adicionales a partir de esto.
Primero, el lenguaje natural tiene una estructura muy adecuada para internalizar progresivamente marcos de trabajo complejos a partir de otros más simples.
Si el lenguaje natural apareció inicialmente en la sociedad humana de forma simple y creció gradualmente hasta poseer una estructura más compleja y rica, esto es una consecuencia natural.
Además, sería ventajoso que estuviera estructurado de una manera que permitiera un aprendizaje rápido. Suponiendo que múltiples sociedades con diferentes lenguajes naturales competían, la hipótesis de que los lenguajes naturales más adecuados para el aprendizaje son los que sobreviven actualmente se formula fácilmente.
Reflexionar sobre esta naturaleza del lenguaje natural nos lleva a la segunda sugerencia: que los humanos también somos "constructores de marcos innatos".
Aunque los fundamentos y mecanismos subyacentes específicos difieran, nuestros cerebros también deben estar equipados con un mecanismo, similar al mecanismo de atención, que permita el aprendizaje por etapas y la adaptación flexible de los marcos de trabajo.