Çin'in Yapay Zeka Harikası DeepSeek: Popülerliğinin Sırrı Ne?

DeepSeek AI: Yapay Zeka Dünyasında Devrim Yaratan Yeni İsim

OpenAI, geçtiğimiz hafta ChatGPT için Operator AI aracını tanıtarak, en azından demolar açısından Google gibi rakiplerine göre oldukça önde olduğunu kanıtladı. Ancak, yapay zeka dünyasını sarsan asıl haber, ChatGPT, Operator veya geçen hafta duyurulan devasa Stargate projesi değildi. DeepSeek AI, Çin merkezli bir girişimin OpenAI’nin ChatGPT o1’ine rakip olan R1 akıl yürütme modelini piyasaya sürmesiyle büyük bir yankı uyandırdı.

DeepSeek’i Farklı Kılan Unsurlar

OpenAI o3’ü duyurmuşken, diğer AI şirketlerinin o1’e rakip sistemler geliştirmesi beklenen bir durumdu. Ancak DeepSeek’i ilginç kılan şey, bu Çinli şirketin modellerini açık kaynaklı hale getirerek, herkesin erişimine ve incelemesine sunmasıydı. Daha da çarpıcı olan ise, DeepSeek’in yayımladığı R1 araştırma makalesinde, son derece gelişmiş modelin OpenAI’nin o1’inin maliyetinin çok daha az bir kısmına eğitildiğini iddia etmesiydi. DeepSeek, R1 eğitiminin, OpenAI’ın ChatGPT ile benzer bir gelişim için ihtiyaç duyduğu kaynakların yalnızca %3 ila %5’ine ihtiyaç duyduğunu duyurdu. Bu bilgi, dünya çapında bir etki yarattı. Pazartesi günü erken işlemlerde yapay zeka ile ilgili hisse senetleri düşerken, DeepSeek App Store’da ChatGPT’yi geride bırakarak 1 numaraya yükseldi.

Yüksek Maliyetler ve Rekabet

Mevcut AI yazılımlarındaki en büyük sorunlardan biri, ürün geliştirme ve kullanım maliyetleridir. o1 gibi gelişmiş modellerin geliştirilmesi, genellikle onlarca milyon dolara mal olabilir. Bu durum, gerekli bilgi işlem gücünü ve enerji harcamalarını sağlayan üst düzey grafik kartlarının (GPU) kullanılmasını gerektirir. Bu nedenle, ChatGPT o1 gibi bitmiş ürünler sınırlamalar olmadan ücretsiz sunulamıyor. OpenAI gibi şirketlerin bu maliyetleri karşılaması ve aynı zamanda kar elde etmesi gerekiyor. Bu bağlamda, 500 milyar dolarlık devasa Stargate programı, özellikle ABD ile Çin arasındaki kaçınılmaz AI silahlanma yarışı göz önüne alındığında, AI geliştirme için çok kritik bir adım.

ABD’nin Yaptırımları ve Çin’in Stratejisi

ABD’nin Çin’e karşı uyguladığı ambargolar, Çin’in ChatGPT o1 ürünlerinin geliştirilmesini mümkün kılan üst düzey çiplere ve GPU’lara erişimini engellemeyi amaçlıyor. Bu nedenle, ChatGPT, Gemini, Meta AI ve Claude gibi ürünlerin Çin’den önemli bir rekabetle karşılaşmaması bekleniyordu. Ancak DeepSeek’in bu kadar dikkat çekici olmasının bir nedeni de bu durumdu. Çinli girişim, sadece donanım gücüne güvenerek OpenAI ile rekabet edemeyeceğini biliyordu. OpenAI gibi şirketlerin elindeki GPU sayısına erişimleri yoktu. Bu sebeple, DeepSeek araştırmacıları R1 için farklı bir yaklaşım benimseyerek, aynı donanıma erişim olmadan gelişmiş bir mantık modeli eğitmenin yollarını buldu. Ayrıca, DeepSeek, R1’e erişimi OpenAI’nin ChatGPT’sinden çok daha uygun bir maliyetle sağladı.

DeepSeek modellerinin açık kaynaklı doğası, geliştiricilerin bu Çinli firmanın AI’sını denemek için adeta akın etmesine neden oldu ve bu durum, DeepSeek’in App Store’da neden yükseldiğini anlamayı kolaylaştırıyor.

Takviyeli Öğrenme ile Üstün Performans

Bir araştırmaya göre, DeepSeek, daha hızlı ve daha ucuz sonuçlar elde etmek için OpenAI’nin ChatGPT’yi eğitmekte kullandığı Gözetimli İnce Ayar (SFT) teknolojisi yerine Takviyeli Öğrenme (RL) yöntemini tercih etti. SFT, AI’ye çeşitli komutlara ne tür yanıtlar vereceğini bilmesi için verilere erişim sağlayarak sorun çözme yolları göstermeyi içeriyor. RL ise, AI modeline güvenerek, ödül sistemiyle yanıtları bulmaya çalışıyor ve ardından AI’ya geri bildirim sağlıyor. Bu yaklaşım, DeepSeek’in R1’in muhakeme yeteneklerini geliştirmesine ve hesaplama eksikliğinin üstesinden gelmesine olanak tanıdı. Ancak, VentureBeat’in belirttiği üzere, RL’ye geçmeden önce R1’in erken aşamalarında insanların AI’yı denetledikleri bazı SFT eğitim süreçleri gerekliydi.

Başarı İçin 50.000 Nvidia GPU

DeepSeek’in bu başarıyı, ABD yaptırımlarından önce alınmış olan 50.000 Nvidia GPU ile başarmış olması, çok daha yeni 500.000’den fazla GPU ile çalışan OpenAI, Google ve Anthropic gibi Batılı firmaların benzer yöntemleri kullanarak yapabileceklerinin sorgulanmasına yol açtı. DeepSeek’in Çin merkezli olması bazı kuruluşlar ve kişiler için endişe kaynağı olsa da, pek çok kişi bu daha uygun maliyetli hizmeti tercih edecektir. Bu nedenle, Batılı AI şirketlerinin de artık maliyetlerini düşürmek zorunda kalacağı ve AI alanında yakında çok daha fazla yenilik görebileceğimiz açıktır.