Teknoloji dünyasının yakından tanıdığı, popüler geliştirme araçlarının arkasındaki şirket JetBrains, yapay zeka alanındaki ilk 'açık' modelini duyurarak önemli bir adım attı.
Geçtiğimiz Çarşamba günü, JetBrains'in çeşitli yazılım geliştirme paketleri için geçen yıl çıkardığı ve kod üreten bir model olan Mellum, yapay zeka geliştirme platformu Hugging Face üzerinde açık olarak erişilebilir hale getirildi. 4 trilyondan fazla token üzerinde eğitilen Mellum, 4 milyar parametreye sahip ve özellikle kod tamamlama (yani çevresindeki bağlama göre kod parçacıklarını tamamlama) için özel olarak tasarlandı.
Modelin performansını anlamak için kullanılan parametreler, kabaca modelin problem çözme yeteneklerine karşılık gelirken, tokenlar modelin işlediği ham veri bitleridir. Bir milyon token, yaklaşık olarak 30.000 satır koda denk geliyor.
JetBrains, teknik raporunda Mellum'un kullanım alanlarını şöyle açıklıyor: "Profesyonel geliştirici araçlarına entegrasyon (örneğin entegre geliştirme ortamlarında akıllı kod önerileri), yapay zeka destekli kodlama asistanları ve kod anlama/üretme araştırmaları için tasarlanan Mellum, eğitim uygulamaları ve fine-tuning (ince ayar) deneyleri için de oldukça uygun."
JetBrains, Apache 2.0 lisanslı Mellum'u, GitHub'daki izin verilen lisanslı kodlar ve İngilizce Wikipedia makaleleri gibi çeşitli veri setleri üzerinde eğittiğini belirtiyor. Bu eğitim süreci, 256 adet H200 Nvidia GPU kümesinde yaklaşık 20 gün sürdü.
Ancak Mellum'u hemen kullanıma almak biraz emek gerektiriyor. Temel model kutudan çıktığı gibi kullanılamıyor; önce mutlaka ince ayar yapılması gerekiyor. JetBrains Python için birkaç fine-tuned (ince ayarlı) Mellum modeli sunsa da, bunların "potansiyel yetenekler hakkında tahmin" amaçlı olduğunu ve bir üretim ortamında kullanılmaması gerektiğini özellikle vurguluyor.
Yapay zeka tarafından üretilen kodların yazılım geliştirme şeklini değiştirdiği şüphe götürmez bir gerçek, ancak bu durum beraberinde yeni güvenlik zorluklarını da getiriyor. Synk geliştirici güvenlik platformunun 2023 sonlarında yaptığı bir ankete göre, kuruluşların %50'sinden fazlası yapay zeka tarafından üretilen kodlarda bazen veya sık sık güvenlik sorunları yaşıyor.
Nitekim JetBrains de Mellum'un "açık kaynaklı kod depolarında bulunan önyargıları yansıtabileceğini" (örneğin açık kaynaklı depolara benzer tarzda kod üretmek gibi) ve kod önerilerinin "güvenli veya güvenlik açığı içermeyeceğini" not ediyor.
JetBrains, bir blog yazısında bu adımı şöyle yorumluyor: "Bu sadece bir başlangıç. Genelciliğin peşinde değiliz – odaklanmış bir şeyler inşa ediyoruz. Eğer Mellum tek bir anlamlı deneye, katkıya veya işbirliğine bile kıvılcım olursa, bunu bir zafer sayarız."