ChatGPT, suni zekâ destekli söyleşi botlarının günümüz şartlarında ulaşabileceği en yüksek seviyeyi nihayet kullanıcıya sunmuştu. ChatGPT’yi besleyen lisan modeline rakip olan lisan modelleri de öteki teknoloji şirketlerinin yoğunlaştığı bir alan olmaya başlamıştı.
Bir yanda Google, kendi lisan modeli LaMDA’yı geliştirmeye devam ederken geçtiğimiz hafta Meta’dan da büyük havadis, bilgi, salık gelmişti. Meta, ilim yaşamına katkı sağlamayı hedefleyen lisan modeli LLaMA’yı tanıtmıştı. Yalnızca bilimsel çalışmalara açık olan lisan modeli, ilk haftasında sızdırıldı.
LLaMA, şimdiden isteyen her önüne gelen tarafınca kullanılabilir oldu:
‘llamanon’ adlı 4chan kullanıcısı, LLaMA’nın 7 milyar ve 65 milyar parametreye haiz versiyonlarını torrent yöntemiyle sızdırdı. Halkın kullanımına açık olmayan lisan modeli, GitHub’da piyasaya sürülen bir kütüphane vesilesiyle erişilebilir oldu.
Kısa bir süre sonrasında ise GitHub’da ‘shawwn’ adlı bir kullanıcı tarafınca, LLaMA’nın bütün sürümlerinin edinimi ve kullanımına dair bir kütüphane açıldı. LLaMA’nın bütün sürümleri, toplam 219 GB’lık boyuta haiz.
Doğal lisan modelini verimli bir halde çalıştırmak için fazlasıyla yüksek işlem gücüne, bundan dolayı fazlasıyla tuzlu fiyat etiketine haiz monitor kartı donanımlarına haiz olmanız gerekmektedir.
Meta, sızıntıyı internetten yükü kaldırmak için hemen hemen bir hareket almadı.
LLaMA, OpenAI’ın lisan modellerine rakip olabilir mi?
LLaMA’nın sızdırılan sürümlerini indirerek testler gerçekleştiren çeşitli kullanıcılar, lisan modelinin minimum ‘davinci’ modeli kadar gelişmiş bulunduğunu beyan etti. OpenAI’ın davinci modeli, geçtiğimiz haftaya kadar her insanın erişebildiği ve kendi söyleşi botlarını oluşturabildiği bir lisan modeliydi.
Lisan modelinin tam olarak ne kadar gelişmiş bulunduğunu hemen hemen bilemiyoruz. Amma ve lakin o şekilde göründüğü gibi OpenAI, bugünün ChatGPT’sini meydana getiren ‘gpt-3.5-turbo’ lisan modeli ise zirvede yer almaya devam ediyor.
Meta, bu lisan modelini niçin her insana açmadı?
ChatGPT’nin verdiği yanıtlar, lisan modelinin bir halde kötüye kullanılabileceğinin (hatta kullanılmaya başladığının) da bir işaretiydi. Meta da devasa bir şirket olduğundan ve adını karalamak istemediğinden aslen bu kötüye kullanımı dolaylı olarak desteklemek istemedi.
firma, bu yüzden lisan modelini yalnızca suni zekâ sahasında işçi bilim adamlarının kullanımına açtı. Lisan modelinin gayesi, daha gelişmiş gelecekte daha gelişmiş lisan modellerinin geliştirilmesini tedarik etmek için bir en gerekli oluş idi.
İLGİLİ HABER