ReDay AI

Sosyal Medya

Anasayfa Blog

Alibaba Qwen 3: OpenAI ve Google'a Meydan Okuyan Açık Kaynak Yapay Zeka

Alibaba Qwen 3: OpenAI ve Google'a Meydan Okuyan Açık Kaynak Yapay Zeka

Alibaba Qwen 3: OpenAI ve Google'a Meydan Okuyan Açık Kaynak Yapay Zeka

Teknoloji dünyası yine hareketli! Çinli teknoloji devi Alibaba, Pazartesi günü yaptığı duyuruyla Qwen 3 adını verdiği yeni yapay zeka (AI) model ailesini tanıttı. Alibaba'nın iddiası oldukça büyük: Qwen 3, Google ve OpenAI gibi devlerin en iyi modelleriyle başa baş mücadele ediyor, hatta bazı alanlarda onları geride bırakıyor.

Güzel haber şu ki, bu modellerin büyük bir kısmı ya şimdiden ya da çok yakında AI geliştirme platformları Hugging Face ve GitHub üzerinden "açık" bir lisansla indirilebilecek. Yani geliştiriciler bu teknolojiyi alıp kullanabilecekler. Modellerin boyutları ise 0.6 milyar parametreden başlayıp tam 235 milyar parametreye kadar uzanıyor. Bilmeyenler için parametre sayısı, bir modelin ne kadar karmaşık problemleri çözebileceğinin bir göstergesi; genellikle ne kadar çok parametre, o kadar yüksek performans demek.

Qwen gibi Çin kökenli yapay zeka modellerinin bu yükselişi, özellikle OpenAI gibi Amerikan laboratuvarları üzerindeki daha yetenekli AI teknolojileri geliştirme baskısını artırıyor. Bu durum aynı zamanda politika yapıcıları da harekete geçirdi ve Çinli AI şirketlerinin model eğitimi için kritik öneme sahip çiplere erişimini kısıtlamaya yönelik adımlar atılmasına neden oldu.

Alibaba'ya göre Qwen 3 modelleri, "hibrit" bir yapıya sahip. Yani hem karmaşık sorunlar üzerinde "düşünerek" mantık yürütebiliyorlar hem de daha basit isteklere anında cevap verebiliyorlar. Bu "düşünme" yeteneği, tıpkı OpenAI'nin o3 modelinde olduğu gibi, modelin kendi cevaplarını bir nevi kontrol etmesini (fact-checking) sağlıyor. Tabii bunun bir bedeli var: yanıt süresinde (latency) artış.

Qwen ekibi yayınladıkları blog yazısında durumu şöyle özetliyor: "Düşünme ve düşünmeme modlarını sorunsuz bir şekilde entegre ettik, böylece kullanıcılara düşünme bütçesini kontrol etme esnekliği sunuyoruz."

Alibaba, Qwen 3 modellerinin tam 119 dili desteklediğini ve yaklaşık 36 trilyon token'lık devasa bir veri setiyle eğitildiğini belirtiyor. Tokenları, modelin işlediği ham veri parçacıkları gibi düşünebilirsiniz (kabaca 1 milyon token, yaklaşık 750.000 kelimeye denk geliyor). Eğitim verileri arasında ders kitapları, soru-cevap çiftleri, kod parçacıkları ve daha fazlası bulunuyor.

Alibaba'ya göre tüm bu iyileştirmeler, Qwen 3'ün bir önceki sürüm olan Qwen 2'ye kıyasla performansını önemli ölçüde artırmış. Örneğin, programlama yarışmaları platformu Codeforces'ta, en büyük Qwen 3 modeli olan Qwen-3-235B-A22B, OpenAI'nin o3-mini modelini geride bırakıyor. Aynı model, zorlu bir matematik testi olan AIME'nin son sürümünde ve modellerin problem çözme muhakemesini ölçen BFCL testinde de o3-mini'den daha iyi sonuçlar elde etmiş. (Alibaba'nın paylaştığı benchmark sonuçları da bu iddiaları destekler nitelikte.)

Ancak küçük bir detay var: Bu en güçlü model, yani Qwen-3-235B-A22B, henüz halka açık değil. Yine de umutsuzluğa kapılmaya gerek yok.

Halka açık olan en büyük model, Qwen3-32B bile piyasadaki birçok tescilli ve açık kaynaklı AI modeliyle rekabet edebilecek düzeyde. Hatta Çinli AI laboratuvarı DeepSeek'in R1 modelini ve bazı testlerde (örneğin LiveBench adlı doğruluk testinde) OpenAI'nin o1 modelini geride bırakmayı başarıyor.

Alibaba ayrıca Qwen 3'ün araç çağırma (tool-calling) yeteneklerinde, verilen talimatları takip etmede ve belirli veri formatlarını kopyalama konusunda da oldukça başarılı olduğunu vurguluyor. Modelleri indirip kendiniz çalıştırmanın yanı sıra, Fireworks AI ve Hyperbolic gibi bulut sağlayıcıları üzerinden de Qwen 3'e erişmek mümkün.

Yapay zeka bulut platformu Baseten'in kurucu ortağı ve CEO'su Tuhin Srivastava, Qwen 3'ün, açık kaynak modellerin OpenAI gibi kapalı kaynak sistemlerle arasındaki farkı kapatma eğiliminin bir başka kanıtı olduğunu söylüyor.

Srivastava, TechCrunch'a yaptığı açıklamada şunları ekliyor: "ABD, Çin'e çip satışını ve Çin'den alımları kısıtlama konusunda adımlar atsa da, Qwen 3 gibi son teknoloji ve açık modellerin ülke içinde kullanılacağı şüphesiz. Bu durum, şirketlerin hem kendi araçlarını geliştirdiği hem de Anthropic ve OpenAI gibi kapalı model şirketlerinden hazır çözümler satın aldığı gerçeğini yansıtıyor."

© 2025 ReDay AI, Tüm Hakları Saklıdır.