Yapay zeka, makine öğrenimi adı verilen bir teknoloji aracılığıyla akıllı davranışlar kazanır.
Bu öğrenme, insanlar tarafından geliştirilen prosedürlere göre yürütülürken, bu prosedürlerden ve yapay zekanın yapısından zekanın neden ortaya çıktığı henüz açıklanamamıştır.
Bu makalede, öğrenmenin özünü ele alarak zekanın ortaya çıkış nedenlerini araştıracağım.
Ve öğrenme kavramını derinlemesine inceledikçe, hem yapay zekanın hem de beynimizin, nasıl öğrenileceğini öğrenmeye yönelik doğuştan gelen bir eğilime sahip olduğu fikrine varırız.
Bu durum, "doğuştan gelen bir çerçeveleyici" olarak adlandırılabilecek bir mekanizmanın varlığını düşündürmektedir.
Beden Yoluyla Öğrenme ve Dil Yoluyla Öğrenme
Gözlerimizle nesneleri görerek ve bedenimizi hareket ettirerek çevremizdeki dünyayı öğrenir ve yeteneklerimizi geliştiririz.
Bu da bir öğrenme biçimidir ve bedensel öğrenme olarak adlandırılabilir.
Öte yandan, insanlar genellikle öğrenmeden bahsederken, ders kitapları okuyarak veya bir öğretmenin açıklamalarını dinleyerek bilgiyi artırmayı hayal ederler.
Bu tür müfredata dayalı öğrenmenin yanı sıra, arkadaş sohbetlerinden, çevrimiçi haberlerden vb. de çeşitli bilgiler ediniriz.
Bu tür bir öğrenme, görüntüleri görsel olarak ezberlemek veya bedeni hareket ettirerek öğrenmekle ilgili değildir; bu, dil aracılığıyla öğrenmedir.
Fiziksel Altı Öğrenme ve Metafizik Öğrenme
Dil aracılığıyla öğrenmede, bilginin ancak tekrar tekrar ezberlenerek öğrenilebildiği durumlar ve bir veya birkaç kez duyduktan sonra ezberlenebildiği durumlar vardır.
Alternatif olarak, ayrıntıları hatırlanmasa bile, gerektiğinde bir kitaplıktan veya internetten alınarak kullanılabilecek bilgi de vardır.
Bilgi edinme ve gerektiğinde uygun şekilde kullanma anlamında, bu iki model de öğrenme olarak adlandırılabilir.
Bunlardan, ancak tekrar tekrar ezberlenerek öğrenilebilen bilgiye fiziksel altı bilgi denilebilir. Bunun öğrenme süreci, kavramların kendilerini ezberlemeyi içeren fiziksel altı öğrenmedir.
Bu, nesneleri gözle görerek veya vücudunu hareket ettirerek tekrar tekrar öğrenilen fiziksel öğrenmeye benzer. Bunlar da fiziksel altı öğrenme olarak sınıflandırılabilir.
Öte yandan, daha az tekrarlarla ezberlenebilen veya anında aranıp kullanılabilen bilginin edinimi, metafizik öğrenme olarak adlandırılabilir.
Bu durumda, fiziksel altı öğrenme yoluyla önceden öğrenilmiş kavramlar, bilgiyi bu kavramların türleri veya kavramların kombinasyonları olarak öğrenmek için kullanılabilir.
Fiziksel altı öğrenme yoluyla zaten edinilmiş kavramlar kullanılabildiğinden, metafizik öğrenme tekrar gerektirmez.
Doğal Dil Makine Öğrenimi
Şimdi bunu yapay zekadaki makine öğrenimine uygulayalım.
Genellikle, makine öğreniminde kullanılan sinir ağları, kavramları tekrar tekrar öğrenmeyi içeren alt-fiziksel öğrenmeyi gerçekleştirir.
Öte yandan, insanlara benzer doğal dil işleme yeteneğine sahip büyük dil modelleri, dil aracılığıyla öğrenme gerçekleştirebilir.
Büyük dil modellerinin ön eğitimi ve ince ayarı sırasında, dil aracılığıyla alt-fiziksel öğrenme gerçekleşir.
Dahası, önceden eğitilmiş bir büyük dil modeli, giriş cümlesinde yer alan bilgiyi kullanarak yanıt verebilir, böylece anında metafizik öğrenme gerçekleştirir.
Dil aracılığıyla metafizik öğrenme yeteneği sayesinde, büyük dil modelleri tekrar eden öğrenmeye gerek kalmadan yeni bilgileri kullanabilir.
Bu, model parametrelerini yinelemeli olarak ayarlayan geleneksel sayısal makine öğreniminin aksine, doğal dil makine öğrenimi olarak adlandırılabilir.
Metafizik Arayüz Olarak Doğal Dil
Doğal dil, fiziksel altı ve metafizik öğrenmeyi ayıran arayüzde yer alır.
Doğal dilin büyüleyici yönü, fiziksel altı öğrenme yoluyla edinilebilmesi ve bunun ötesinde, metafizik öğrenmeyi mümkün kılmasıdır.
Doğal Dil Dışındaki Metafizik Arayüzler
Gerçekte, fiziksel öğrenmede bile hem alt-fiziksel hem de metafizik öğrenme mevcuttur. Örneğin, sporda yetenekli biri, ilk kez karşılaştığı yeni bir oyuna hızla uyum sağlayabilir.
Benzer şekilde, biyoloji konusunda bilgili biri, yeni bir türü gördüğünde özelliklerini anında anlayabilir.
Bu nedenle, fiziksel öğrenmede de doğal dile benzer bir konuma sahip metafizik arayüzler bulunmaktadır.
Çerçeveler (Frameworkler)
Bu arayüzlerde, temel kavramlardan veya bilgilerden ayrı olarak, onların ilişkilerini ve yapılarını tanımlayan veya yeni bir yapılandırmaya olanak tanıyan çerçeveler bulunur.
Fiziksel altı öğrenme yoluyla çeşitli fiziksel altı bilgiler edinildikçe, metafizik arayüzdeki çerçevenin, fiziksel altı bilgi parçaları arasındaki bağlantılardan öğrenilmesi mümkün olabilir.
Fiziksel öğrenme yoluyla edinilen çerçeveler, yeni bilginin edinildikten hemen sonra metafiziksel olarak öğrenilmesini sağlar. Ancak, bu metafizik öğrenme yoluyla kazanılan bilgiyi başkalarına aktarmak kolay değildir.
Öte yandan, dil aracılığıyla öğrenme yoluyla edinilen çerçeve, doğal dilin kendisidir.
Bu nedenle, doğal dil çerçevesi öğrenildikten sonra, metafizik öğrenme yoluyla edinilen bilgi, doğrudan diğer insanların dil aracılığıyla öğrenmelerine aktarılabilir.
Bu, ders kitapları veya çevrimiçi haberler gibi dil aracılığıyla öğrenmenin temel olduğu bilgilerle sınırlı değildir.
İlk kez beyzbol oynayan deneyimli bir futbolcu, beyzbol hakkında edindiği metafizik bilgiyi diğer futbolculara kelimelerle aktarabilir. Bu, insanların aynı fiziksel altı bilgiye sahip olması durumunda, "ipuçları" veya bilgi birikimi denilen şeylerin sözlü olarak iletilebileceği anlamına gelir.
Dahası, yeni keşfedilen bir tür hakkında şahit olunan bilgiler, diğer biyologlarla kelimeler aracılığıyla paylaşılabilir.
Böylece, doğal dilin metafizik arayüzde çok güçlü bir çerçeve olduğu ortaya çıkar.
Sanal Çerçeveler
Doğal dilin üzerinde başka çerçeveler de edinilebilir.
Bunlar, alana özgü çerçeveler veya biçimsel çerçevelerdir.
Çeşitli akademik alanlarda, iş sektörlerinde ve günlük hayatta farklı alana özgü çerçeveler bulunmaktadır.
Uzmanlar, kendi uzmanlık alanlarının çerçevesinde çalışarak yeni keşifler yapabilir ve bu bilgiyi aynı çerçeveye sahip diğer uzmanlara kolayca aktarabilirler.
Çerçevenin kendisi bazen doğal dilde ifade edilebilir; bu durumda, doğal dil çerçevesine sahip insanlar veya büyük dil modelleri tarafından öğrenilebilir ve anlaşılabilir.
İş modelleri ve yemek tarifleri de doğal dilde ifade edilebilen bu tür alana özgü çerçevelere örnektir.
Ayrıca, matematiksel formüller, programlama dilleri ve iş analizi çerçeveleri biçimsel çerçevelerdir.
Bunların da çerçeveleri doğal dilde ifade edilebilir veya açıklanabilir.
Doğal dil üzerine inşa edilen bu alana özgü ve biçimsel çerçevelere sanal çerçeveler denilebilir.
Bu, fiziksel bir bilgisayar üzerinde farklı bir işletim sistemi çalıştıran bir sanal makineyi hayal ederseniz kolayca anlaşılır. Doğal dilin temel çerçevesinin üzerinde başka bir çerçeve işlev görmektedir.
Yerel Çerçeveler
Ayrıca, bu sanal çerçeveler başlangıçta doğal dil aracılığıyla anlaşılması gerekirken, kişi onlara alıştıkça, doğal dil açıklamasını ve anlamasını atlayarak, doğrudan fiziksel altı bilgi üzerine inşa edilmiş metafizik bir arayüz çerçevesi olarak işlev görmeye başlarlar.
Buna yerel çerçeve denilebilir.
Doğal dil de bir anlamda yerel bir çerçevedir, ancak sadece anadille ilgili olarak. Genellikle, anadil dışındaki diller sanal çerçeveler olarak edinilir. Yetkinlik arttıkça, yerel çerçeveler haline gelmeye yaklaşırlar.
Aynı durum alana özgü ve resmi çerçeveler için de geçerlidir. Matematikçiler matematiksel formüller kullanarak yerel olarak iletişim kurabilir ve programcılar, yorumsuz kaynak kodları aracılığıyla birbirlerinin niyetlerini anlayabilirler.
Bu, sanal çerçevelerden yerel çerçevelere geçişin büyük dil modellerine de uygulanabileceğini düşündürmektedir.
Sık kullanılan sanal çerçeveleri tespit etme, bu çerçeveleri kullanarak büyük miktarda örnek veri oluşturma ve ardından bunları yerel çerçeveler haline getirmek için ince ayar yapma fikri, hemen denemeye değerdir.
Doğuştan Çerçeveleyiciler
Bu durum göz önüne alındığında, büyük dil modellerinin ön eğitimi sırasında, yalnızca ince ayar (fine-tuning) değil, aynı zamanda alana özgü ve resmi çerçeveleri de öğrendikleri fark edilir.
Ve bu süreçte, başlangıçtan itibaren alana özgü veya resmi çerçeveleri yerel olarak öğrenmek yerine, önce doğal dil çerçevesini öğrendikleri ve daha sonra, onu ustalaşırken veya ustalaştıktan sonra, alana özgü ve resmi çerçeveleri öğrenerek onları yerel hale getirdikleri düşünülebilir.
Bu aşamalı çerçeve öğrenimine daha derinlemesine inildiğinde, doğal dil öğreniminin kendisinin de çok ince taneli, aşamalı çerçeve öğreniminin paralel bir hattı olduğu düşünülebilir.
Başka bir deyişle, ön eğitim sırasında eğitim verisi olarak sağlanan büyük miktardaki metinden, büyük dil modelleri sadece bireysel kavramları değil, aynı zamanda doğal dilin çok basit birkaç kuralını da bir çerçeve olarak öğrenebilirler. Ardından, bu basit çerçeveleri temel alarak, biraz daha karmaşık kuralları tekrar tekrar öğrenirler.
Bu, başlangıçta kelime kavramlarını öğrendikleri bir aşamadan, bileşik kelimeleri ve temel dilbilgisini ezberlemeye, ardından cümleleri anlamaya ve yazı yazma ve ifade teknikleri gibi karmaşık şeyleri öğrenmeye geçmelerini sağlayacaktır.
Bu, bir çerçeveyi bir sonraki çerçeveyi öğrenmek için temel olarak kullanarak, çerçeveleri aşamalı ve karmaşık bir şekilde öğrendikleri bir model olarak anlaşılabilir.
Bu, büyük dil modellerini, başlangıçtan itibaren çerçeveleri öğrenmek için bir mekanizmaya sahip olan "doğuştan çerçeveleyiciler" olarak öne çıkarır.
Dikkat Mekanizması
Doğuştan gelen çerçeveleyiciyi hayata geçiren teknoloji, dikkat mekanizmasıdır.
Dikkat mekanizması, bir bağlamdan ilgili tokenları seçmeye benzer. Tokenlar arasındaki ilişkileri açıklığa kavuşturur. Bu tam olarak bir çerçevenin doğasıdır: önemli kavramları koruyarak soyutlama yaparken, aralarındaki ilişkileri netleştirmek.
Bu seçimi her token için değiştirerek, çerçevelerin dinamik olarak değiştirilmesini sağlar.
Bu, dikkat mekanizmasının, doğuştan gelen çerçeveleyici modelini kullanarak, büyük dil modellerinin evrimini belirleyen bir teknoloji olmasının nedenini açıklamamız sağlar.
Sonuç
Eğer bu mekanizma gerçekten büyük dil modellerinin ön eğitim sürecinde gerçekleşiyorsa, o zaman büyük dil modellerinin daha önce gizemli olan mekanizmaları açıklanabilir.
Bunlar arasında burada tartışılan alt-fiziksel ve metafizik öğrenme, metafizik arayüzler olarak çerçeveler, dil aracılığıyla öğrenmeyi ve sanal çerçeveleri mümkün kılan doğal dil ve doğuştan çerçeveleyiciyi gerçekleştiren dikkat mekanizması bulunmaktadır.
Ayrıca, bundan iki ek nokta daha öne sürülmektedir.
İlk olarak, doğal dil, karmaşık çerçeveleri daha basit olanlardan kademeli olarak içselleştirmek için son derece uygun bir yapıya sahiptir.
Eğer doğal dil başlangıçta insan toplumunda basit bir biçimde ortaya çıkmış ve kademeli olarak daha karmaşık ve zengin bir yapıya sahip olacak şekilde gelişmişse, bu doğal bir sonuçtur.
Üstelik, hızlı öğrenmeye olanak tanıyan bir şekilde yapılandırılmış olması avantajlı olacaktır. Farklı doğal dillere sahip birden fazla toplumun rekabet halinde olduğu varsayılırsa, öğrenmeye daha uygun doğal dillerin şu anda hayatta kaldığı hipotezi kolayca oluşur.
Doğal dilin bu doğası üzerine düşünmek, ikinci öneriye yol açar: biz insanların da doğuştan çerçeveleyiciler olduğumuz.
Özel temel temeller ve mekanizmalar farklı olsa bile, beynimiz de dikkat mekanizmasına benzer bir mekanizma ile donatılmış olmalıdır; bu mekanizma, çerçevelerin aşamalı öğrenilmesine ve esnek bir şekilde uyarlanmasına olanak tanır.