İçeriğe Atla
Bu makale, yapay zeka kullanılarak Japoncadan çevrilmiştir
Japonca oku
Bu makale Kamu Malı (CC0)'dır. Özgürce kullanmaktan çekinmeyin. CC0 1.0 Universal

Öğrenmeyi Öğrenme: Doğuştan Gelen Zeka

Yapay zeka, makine öğrenimi teknolojisi sayesinde zeki davranışlar sergileyebilir.

Bu öğrenme süreci insanlar tarafından geliştirilen prosedürleri takip etse de, zekanın bu prosedürlerden ve yapay zekanın yapısından neden ortaya çıktığı henüz tam olarak açıklanamamıştır.

Bu makalede, öğrenmenin özünü düşünerek, zekanın ortaya çıkış nedenlerini araştırmayı hedefliyorum.

Öğrenme kavramını daha derinlemesine incelediğimizde, hem yapay zekanın hem de beynimizin nasıl öğreneceğini öğrenmeye dair doğuştan gelen bir yeteneğe sahip olduğu fikrine varırız.

Bu durum, Doğuştan Çerçeveleyici olarak adlandırılabilecek bir mekanizmanın varlığını düşündürmektedir.

Beden Yoluyla Öğrenme ve Dil Yoluyla Öğrenme

Nesneleri gözlerimizle gözlemleyerek ve vücudumuzu hareket ettirerek çevremizdeki dünyayı anlar ve yeteneklerimizi genişletiriz.

Bu da bir tür öğrenmedir ve beden yoluyla öğrenme olarak adlandırılabilir.

Öte yandan, genellikle öğrenmeyi düşündüğümüzde, ders kitapları okuyarak veya bir öğretmenin açıklamalarını dinleyerek bilgimizi artırmayı hayal edebiliriz.

Bu tür eğitim müfredatına dayalı öğrenmenin ötesinde, arkadaşlarla sohbetlerden, çevrimiçi haberlerden ve diğer kaynaklardan da çeşitli bilgiler ediniriz.

Bu tür bir öğrenme, görüntüleri görsel olarak ezberlemek veya fiziksel hareketle öğrenmekle ilgili olmayıp, daha çok dil yoluyla öğrenmedir.

Üstbilişsel Öğrenme ve Metafizik Öğrenme

Dil tabanlı öğrenmede, bilginin ezberlenmesi için tekrarlanan yinelemeler gerektiren durumlar olduğu gibi, bir veya birkaç kez maruz kaldıktan sonra öğrenilebilen durumlar da vardır.

Alternatif olarak, bazı bilgiler tamamen ezberlenmemiş olsa bile, gerektiğinde bir kitap rafından veya internetten ayrıntılarını alarak kullanılabilir.

Bilgiyi edinme ve gerektiğinde uygun şekilde kullanma anlamında, bu kalıpların her ikisi de öğrenme olarak kabul edilebilir.

Bunlar arasında, tekrarlanan yineleme olmaksızın ezberlenemeyen bilgiye üstbilişsel bilgi denebilir. Kavramın kendisini öğrenme süreci ise üstbilişsel öğrenmedir.

Bu, nesneleri gözlerimizle görme veya vücudumuzu hareket ettirme yoluyla tekrarın dahil olduğu fiziksel öğrenmeye benzerdir. Bunlar da üstbilişsel öğrenme olarak sınıflandırılabilir.

Tersine, az sayıda denemeyle ezberlenebilen veya anında aranarak kullanılabilen bilgi edinimi metafizik öğrenme olarak adlandırılabilir.

Bu durumda, üstbilişsel öğrenme yoluyla önceden öğrenilmiş kavramlar, yeni bilgileri bu kavramların türleri veya kavram kombinasyonları olarak öğrenmek için kullanılabilir.

Üstbilişsel öğrenme yoluyla zaten ustalaşılmış kavramlar kullanılabildiğinden, metafizik öğrenme tekrar gerektirmez.

Doğal Dil Makine Öğrenimi

Şimdi bunu yapay zekadaki makine öğrenimine uygulayalım.

Genel olarak, makine öğreniminde kullanılan sinir ağları, kavramların tekrarlayan öğrenimini içeren üstbilişsel öğrenme gerçekleştirir.

Öte yandan, insanlara benzer doğal dil işleme yeteneğine sahip büyük dil modelleri, dil yoluyla öğrenme gerçekleştirebilir.

Büyük dil modellerinin ön eğitimi ve ince ayarı sırasında, dil tabanlı üstbilişsel öğrenme gerçekleşir.

Eğitilmiş büyük bir dil modeli, girdi cümlesinde bulunan bilgiyi kullanarak yanıt verebilir, bu da anlık bir metafizik öğrenme gerçekleştirdiği anlamına gelir.

Dil tabanlı metafizik öğrenme yeteneği, büyük dil modellerinin tekrarlayan öğrenme olmaksızın yeni bilgileri kullanmasına olanak tanır.

Bu, model parametrelerini yinelemeli olarak ayarlayan geleneksel sayısal makine öğrenimi ile karşılaştırılabilir ve doğal dil makine öğrenimi olarak adlandırılabilir.

Metafizik Arayüz Olarak Doğal Dil

Doğal dil, üstbilişsel öğrenmeyi metafizik öğrenmeden ayıran arayüzde yer alır.

Doğal dilin ilginç yanı, üstbilişsel öğrenme yoluyla edinilebilmesi ve üzerinde metafizik öğrenmenin mümkün hale gelmesidir.

Doğal Dil Dışındaki Metafizik Arayüzler

Aslında, fiziksel öğrenmede de üstbilişsel öğrenme ve metafizik öğrenme mevcuttur. Örneğin, spor konusunda yetenekli biri, daha önce hiç karşılaşmadığı yeni bir spora hızla adapte olabilir.

Benzer şekilde, biyoloji konusunda bilgili bir kişi, yeni bir türü gördüğünde özelliklerini hemen anlayabilir.

Bu nedenle, fiziksel öğrenmede bile doğal dile benzer bir konuma sahip bir metafizik arayüz bulunur.

Çerçeve

Bu arayüzlerde yatan şey, temel kavramlardan veya bilgilerden farklı bir çerçevedir; bu çerçeve, onların ilişkilerini ve yapılarını tanımlar ve yeni bir yapılandırma sağlar.

Üstbilişsel öğrenme yoluyla çeşitli üstbilişsel bilgiler edinildikçe, bu üstbilişsel bilgiler arasındaki bağlantılardan metafizik arayüzdeki çerçeveyi öğrenmek bazen mümkün olabilir.

Fiziksel öğrenmeden türetilen bir çerçeve, üzerinde ustalık sağlandıktan sonra metafizik öğrenme yoluyla yeni bilgilerin anında edinilmesini sağlar. Ancak, bu tür metafizik öğrenme yoluyla edinilen bilginin başkalarına kolayca iletilmesi mümkün değildir.

Öte yandan, dil yoluyla öğrenmeden türetilen çerçeve bizzat doğal dildir.

Bu nedenle, doğal dil çerçevesini öğrenerek metafizik öğrenme yoluyla edinilen bilgi, başka bir kişinin dil edinimine doğrudan girdi olarak aktarılabilir.

Bu durum, sadece ders kitapları veya çevrimiçi haberler gibi öncelikli olarak dil edinimine dayalı bilgiler için geçerli değildir.

Beyzbolu ilk kez deneyen deneyimli bir futbolcu, edindiği beyzbolun metafizik bilgisini ifade edebilir ve diğer deneyimli futbolculara aktarabilir. Bu, insanların aynı üstbilişsel bilgiye sahip olmaları durumunda, "tüyolar" veya "püf noktaları" olarak bilinen şeyleri kelimelerle iletebilecekleri anlamına gelir.

Dahası, gözlemlediği yeni bir tür hakkındaki bilgiyi diğer biyologlara sözlü olarak aktararak bu bilgiyi paylaşabilir.

Böylece, doğal dilin metafizik arayüzde bulunan çok güçlü bir çerçeve olduğu ortaya çıkar.

Sanal Çerçeve

Doğal dilin üzerinde başka bir çerçeve edinilebilir.

Bunlar, alana özgü çerçeveler veya metafizik çerçeveler olabilir.

Çeşitli akademik disiplinlerde, iş sektörlerinde ve günlük yaşamda çok sayıda alana özgü çerçeve bulunmaktadır.

Bilim insanları, uzmanlık alanlarındaki çerçeveleri içinde yeni keşifler yapabilir ve bu keşifleri, aynı çerçeveye sahip diğer bilim insanlarına bilgi olarak kolayca aktarabilirler.

Çerçevenin kendisi bazen doğal dilde ifade edilebilir; bu durumda, doğal dil çerçevesine sahip bireyler veya büyük dil modelleri onu edinebilir ve anlayabilir.

İş modelleri ve yemek tarifleri de doğal dilde ifade edilebilen alana özgü çerçeve örnekleridir.

Ayrıca, matematiksel formüller, programlama dilleri ve iş analizi çerçeveleri biçimsel çerçevelerdir.

Bunlar da doğal dilde ifade edilebilir veya açıklanabilir.

Doğal dil üzerine inşa edilen bu tür alana özgü çerçeveler ve biçimsel çerçeveler sanal çerçeveler olarak adlandırılabilir.

Bu, fiziksel bir bilgisayar üzerinde başka bir işletim sistemi çalıştıran bir sanal makine hayal edilerek kolayca anlaşılabilir. Temel çerçeve olarak hizmet eden doğal dilin üzerinde başka bir çerçeve işlev görmektedir.

Yerel Çerçeve

Başlangıçta, bu sanal çerçevenin doğal dil aracılığıyla anlaşılması gerekir, ancak pratikle birlikte, doğal dil aracılığıyla açıklama ve anlamayı atlayarak, doğrudan üstbilişsel bilgi üzerine inşa edilmiş metafizik bir arayüz çerçevesi olarak işlev görmeye başlar.

Buna yerel çerçeve denebilir.

Doğal dil, bir anlamda bir yerel çerçevedir, ancak yalnızca anadil durumunda. Genellikle, anadil dışındaki diller sanal çerçeveler olarak edinilir. Yeterlilik arttıkça, yerel çerçeve statüsüne yaklaşırlar.

Aynı şey alana özgü çerçeveler ve biçimsel çerçeveler için de geçerlidir. Matematikçiler matematiksel formüller kullanarak birbirleriyle yerel olarak iletişim kurabilir ve programcılar, yorum satırı olmayan kaynak kodu aracılığıyla birbirlerinin niyetlerini tek başına anlayabilirler.

Bu, sanal çerçeveden yerel çerçeveye geçişin büyük dil modellerine de uygulanabileceğini düşündürmektedir.

Sık kullanılan sanal çerçeveleri tespit etme, bu sanal çerçeveleri kullanarak büyük miktarda örnek veri üretme ve ardından bunları yerel çerçeveler haline getirmek için ince ayar yapma fikri, hemen denemeye değer olacaktır.

Doğuştan Çerçeveleyici

Bunu düşündüğümüzde, büyük dil modellerinin bu uzmanlaşmış ve biçimsel çerçeveleri yalnızca ince ayar sırasında değil, aynı zamanda ön eğitim sırasında da öğreniyor olabileceğini fark ederiz.

Dahası, bu süreçte, uzmanlaşmış veya biçimsel çerçeveleri başlangıçtan itibaren yerel olarak öğrenmemeleri olasıdır. Bunun yerine, önce doğal dil çerçevesini öğrenirler ve ardından, onda yeterlilik kazandıktan sonra veya bu sırada, uzmanlaşmış veya biçimsel çerçeveleri öğrenir ve bunları yerel çerçevelere dönüştürürler.

Aşamalı çerçeve öğrenme fikrini derinleştirdiğimizde, doğal dil öğreniminin kendisinin de son derece ayrıntılı, aşamalı bir çerçeve öğrenme paralel hattı olabileceği düşünülebilir.

Yani, ön eğitim sırasında öğrenme verisi olarak sağlanan büyük miktardaki metinden, büyük dil modelleri sadece bireysel kavramları değil, aynı zamanda doğal dilin çok basit bazı kurallarını da çerçeveler olarak öğreniyor olabilirler. Ardından, bu basit çerçeveleri temel alarak, biraz daha karmaşık kuralları tekrar tekrar öğreniyor olabilirler.

Bu şekilde, tek tek kelime kavramlarını öğrenme aşamasından başlayarak, bileşik kelimeleri ve temel dilbilgisini edinebilir, sonra cümleleri anlayabilir ve sonunda edebi teknikler ve anlatım stilleri gibi karmaşık unsurları öğrenebilirler.

Bu, bir çerçevenin bir sonraki çerçeveyi öğrenmek için temel oluşturduğu, katmanlı ve bileşik çerçeve öğrenme modeli olarak anlaşılabilir.

Bu durum, büyük dil modellerinin Doğuştan Çerçeveleyici olarak, en başından itibaren çerçeveleri öğrenme mekanizmasına doğal olarak sahip oldukları imajını vurgular.

Dikkat Mekanizması

Doğuştan Çerçeveleyiciyi hayata geçiren teknoloji, dikkat mekanizmasıdır.

Dikkat mekanizması, bir bağlam içinde odaklanılması gereken jetonları seçmeye benzer. Jetonlar arasındaki ilişkileri netleştirir. Bu, tam da bir çerçevenin doğasıdır: önemli kavramları koruyarak soyutlama yaparken, bu kavramlar arasındaki ilişkileri netleştirmek.

Bu seçimi her bir jeton için değiştirerek, çerçeveleri de dinamik olarak değiştirmek mümkün hale gelir.

Bu durum, dikkat mekanizmasının büyük dil modellerinin evrimi için neden belirleyici bir teknoloji olduğunu, Doğuştan Çerçeveleyici modeli kullanarak açıklamaktadır.

Sonuç

Eğer bu mekanizma gerçekten de büyük dil modellerinin ön eğitim sürecinde gerçekleşiyorsa, o zaman bu modellerin daha önce esrarengiz olan mekanizması açıklanabilir hale gelir.

Bu açıklama; tartıştığımız üstbilişsel ve metafizik öğrenmeyi, metafizik bir arayüz olarak çerçeveyi, dil edinimini ve sanal çerçeveleri mümkün kılan doğal dili ve Doğuştan Çerçeveleyiciyi gerçekleştiren dikkat mekanizmasını kapsamaktadır.

Ayrıca, bundan iki ek çıkarım ortaya çıkmaktadır.

Birincisi, doğal dil, basit çerçevelerden başlayarak karmaşık çerçeveleri aşamalı olarak yerel çerçevelere dönüştürmek için son derece uygun bir yapıya sahiptir.

Eğer doğal dil başlangıçta insan toplumlarında basit bir biçimde ortaya çıkmış ve kademeli olarak daha karmaşık ve zengin bir yapıya sahip olacak şekilde evrilmişse, bu doğal bir sonuçtur.

Üstelik, hızlı öğrenmeye olanak tanıyan bir yapı avantajlı olacaktır. Çeşitli doğal dillere sahip birden fazla toplumun rekabet ettiğini varsayarsak, öğrenmeye en uygun doğal dilin günümüze kadar varlığını sürdürdüğü hipotezi kolayca doğrulanabilir.

Doğal dilin doğası üzerine düşünmek, ikinci çıkarıma yol açar: biz insanların da Doğuştan Çerçeveleyici olduğumuz.

Belirli temeller ve mekanizmalar farklılık gösterse bile, beyinlerimiz de dikkat mekanizmasına benzer şekilde, çerçeveleri aşamalı olarak öğrenen ve esnek bir şekilde değiştiren bir sistemle donatılmış olmalıdır.