Merhaba teknoloji meraklıları! Yapay zeka dünyasından ilginç bir haber var. Kar amacı gütmeyen bir araştırma enstitüsü olan Epoch AI'dan gelen bir analiz, akıl yürütme (reasoning) yeteneğine sahip yapay zeka modellerindeki baş döndürücü ilerlemenin yakında bir duraklama noktasına gelebileceğini öne sürüyor. Hatta rapordaki bulgulara göre bu yavaşlama sadece bir yıl içinde bile başlayabilir!
Peki bu 'akıl yürütme modelleri' ne anlama geliyor? OpenAI'ın o3 gibi modelleri, özellikle matematik ve programlama gibi alanlarda, son aylarda yapay zeka benchmarklarında önemli sıçramalar kaydetti. Bu modeller, sorunları çözmek için daha fazla hesaplama gücü kullanabiliyor, bu da performanslarını artırıyor. Dezavantajı mı? Geleneksel modellere göre görevleri tamamlamaları daha uzun sürebiliyor.
Bu modeller nasıl eğitiliyor? Önce devasa veri setleri üzerinde geleneksel bir model eğitiliyor. Ardından 'takviyeli öğrenme' (reinforcement learning) denilen bir teknik devreye giriyor. Bu teknik, modelin zor problemlerin çözümlerine adeta 'geri bildirim' vererek kendini geliştirmesini sağlıyor.
Epoch AI'a göre, OpenAI gibi öncü laboratuvarlar henüz takviyeli öğrenme aşamasında devasa hesaplama gücü kullanmamışlardı.
Ama bu durum değişiyor. OpenAI, o3 modelini eğitirken selefi o1'e göre yaklaşık 10 kat daha fazla hesaplama gücü kullandığını belirtti. Epoch, bu gücün büyük kısmının takviyeli öğrenmeye ayrıldığını tahmin ediyor. Dahası, OpenAI araştırmacısı Dan Roberts, şirketin gelecekteki planlarında takviyeli öğrenmeye çok daha fazla hesaplama gücü ayırmayı, hatta başlangıç model eğitiminden bile daha fazla öncelik vermeyi hedeflediklerini ortaya koydu.
Ancak Epoch AI'a göre, takviyeli öğrenmeye ne kadar hesaplama gücü uygulanabileceğinin hala bir üst sınırı var.
Epoch analisti ve raporun yazarı Josh You, standart yapay zeka model eğitiminden elde edilen performans artışlarının her yıl dört katına çıktığını, buna karşılık takviyeli öğrenmedeki artışların 3-5 ayda on katına ulaştığını açıklıyor. You, akıl yürütme eğitimi ilerlemesinin "muhtemelen 2026 yılına kadar genel sınıra yakınsayacağını" belirtiyor.
Epoch'un analizi bazı varsayımlara dayanıyor ve kısmen yapay zeka şirket yöneticilerinin kamuya açık yorumlarından besleniyor. Ancak analiz, akıl yürütme modellerini ölçeklendirmenin hesaplama gücü dışındaki nedenlerle de zorlaşabileceğini ortaya koyuyor. Araştırma için gereken yüksek genel maliyetler bu nedenlerden biri.
You, "Eğer araştırma için kalıcı bir genel maliyet gerekiyorsa, akıl yürütme modelleri beklenen kadar ölçeklenmeyebilir" diye yazıyor ve ekliyor: "Hızlı hesaplama ölçeklendirmesi, akıl yürütme model ilerlemesinde potansiyel olarak çok önemli bir bileşen, bu yüzden bunu yakından takip etmekte fayda var."
Akıl yürütme modellerinin yakın gelecekte bir sınıra ulaşabileceğine dair herhangi bir işaret, bu tür modellere devasa kaynaklar yatırmış olan yapay zeka endüstrisini endişelendirecektir. Zaten, çalıştırılması inanılmaz derecede pahalı olabilen akıl yürütme modellerinin, belirli geleneksel modellere göre daha fazla sanrı görme (hallucinate) eğilimi gibi ciddi kusurları olduğu daha önce yapılan çalışmalarla ortaya konmuştu.