Yapay zeka dünyasında her geçen gün yeni bir gelişme yaşanıyor. Son dönemin en çok konuşulan yapay zeka projelerinden biri ise Çin merkezli DeepSeek oldu. Peki, DeepSeek nedir? DeepSeek nasıl kullanılır?
DeepSeek nedir?
DeepSeek, Çin merkezli bir yapay zeka araştırma laboratuvarıdır. Açık kaynaklı büyük dil modelleri (LLM) geliştirmeye odaklanan bu şirket, 2023 yılında, daha önce High-Flyer adlı hedge fonunu kurup yöneten Liang Wenfeng tarafından kurulmuştur. High-Flyer, yapay zeka tabanlı ticaret algoritmalarıyla tanınan bir hedge fonudur.
DeepSeek nasıl kullanılır?
DeepSeek, hem kullanıcılar hem de içerik üreticileri için pratik ve verimli bir sistem olarak öne çıkıyor. Kullanıcılar, DeepSeek’i kolaylıkla kullanarak kişiselleştirilmiş arama sonuçlarına ulaşabiliyor.
Kullanıcıların DeepSeek’i etkili bir şekilde kullanabilmesi için birkaç adım bulunuyor. İlk olarak, arama çubuğuna istenilen sorgunun yazılması yeterli oluyor. DeepSeek, kullanıcıların geçmiş aramalarına ve ilgi alanlarına göre kişiselleştirilmiş sonuçlar sunarak, arama deneyimini daha verimli hale getiriyor.
Ayrıca, arama sonuçlarında derinlemesine bilgi sunan içerikler tercih edilebiliyor. Böylece, kullanıcılar daha kapsamlı ve detaylı verilere kolayca ulaşabiliyor.
DeepSeek’in Geliştirdiği Modeller
DeepSeek Coder (Kasım 2023): Araştırmacılar ve ticari kullanıcılar için ücretsiz olarak sunulan bu model, özellikle kodlama görevlerine odaklanmış ve MIT lisansı altında açık kaynaklı olarak yayımlanmıştır.
DeepSeek LLM (Kasım 2023): 67 milyar parametreye sahip bu model, GPT-4 gibi büyük dil modelleriyle rekabet edecek şekilde tasarlanmış olup, ancak hesaplama verimliliği ve ölçeklenebilirlik konularında bazı zorluklarla karşılaşmıştır. Modelin sohbet botu versiyonu olan DeepSeek Chat de piyasaya sürülmüştür.
DeepSeek-V2 (Mayıs 2024): Rakiplerine göre daha düşük bir maliyetle piyasaya sürülen bu model, University of Waterloo Tiger Lab'ın sıralamasında yedinci sırada yer almıştır.
DeepSeek-V3 (Aralık 2024): 671 milyar parametreye sahip bu model, yaklaşık 55 gün süren bir eğitim süreciyle 5,58 milyon ABD dolarına mal olmuştur. 14,8 trilyon tokenlık bir veri seti üzerinde eğitilen model, GPT-4o ve Claude 3.5 Sonnet ile eşdeğer performans sergilemiştir.
DeepSeek R1-Lite-Preview (Kasım 2024): Mantıksal çıkarım, matematiksel akıl yürütme ve gerçek zamanlı problem çözme yeteneklerine sahip bu model, OpenAI'nin o1 modeline benzer bir performans sergilemiştir.