DeepSeek nedir? İşte onu farklı kılan neden

Çinli teknoloji girişimi DeepSeek'in geliştirdiği yapay zeka sohbet robotu nedeniyle yaşanan çılgınlık pazartesi günü borsa piyasalarını altüst etti ve ABD ile Çin arasında yapay zeka teknolojisi geliştirme konusunda yaşanan ekonomik ve jeopolitik rekabete ilişkin tartışmaları körükledi .

28.01.2025 16:17

DeepSeek'in AI asistanı, Pazartesi günü Apple'ın iPhone mağazasında en çok indirilen ücretsiz uygulama oldu ve bu, ChatGPT rakibine duyulan meraktan kaynaklanıyordu. Bazı ABD teknoloji sektörü gözlemcilerini endişelendiren şeylerden biri de, Çinli girişimin, üretken AI'nın ön saflarında yer alan Amerikan şirketlerini maliyetin çok daha az bir kısmına yakaladığı fikri.

Eğer bu doğruysa, ABD'li teknoloji şirketlerinin yapay zeka alanındaki ilerlemeleri desteklemek için ihtiyaç duyulan veri merkezleri ve bilgisayar çiplerine harcamayı planladıklarını söyledikleri büyük miktardaki paraların sorgulanması söz konusu.

Ancak DeepSeek'in teknolojik gelişmeleri hakkındaki abartılar ve yanlış anlamalar da kafa karışıklığına yol açtı.

Yarı iletken endüstrisini takip eden ve Wall Street'in tepkisini abartılı olarak tanımlayan birkaç borsa analistinden biri olan Bernstein analisti Stacy Rasgon, "Oluşturdukları modeller harika ama mucize de değiller" dedi.

Rasgon, "Bilinmeyen veya gizli veya buna benzer hiçbir yeniliği kullanmıyorlar," dedi. "Bunlar herkesin denediği şeyler."

DeepSeek Nedir?

Girişim DeepSeek, 2023 yılında Çin'in Hangzhou kentinde kuruldu ve aynı yılın ilerleyen zamanlarında ilk AI büyük dil modelini yayınladı. CEO'su Liang Wenfeng daha önce, AI odaklı niceliksel ticarete odaklanan Çin'in en iyi hedge fonlarından biri olan High-Flyer'ı kurdu. Fon, 2022 yılına kadar, Çin sosyal medya platformu WeChat'te o yaz yayınlanan bir gönderiye göre, AI sistemleri oluşturmak ve çalıştırmak için kullanılan Kaliforniya merkezli Nvidia'nın yüksek performanslı A100 grafik işlemci çiplerinden 10.000'lik bir kümeyi toplamıştı. ABD kısa süre sonra bu çiplerin Çin'e satışını kısıtladı .

DeepSeek, son modellerinin Çin'de yasaklanmayan, Nvidia'nın düşük performanslı H800 yongalarıyla üretildiğini belirterek, en son teknoloji yapay zeka araştırmaları için en gösterişli donanımlara ihtiyaç olmayabileceği mesajını verdi.

DeepSeek, geçen ay ABD'li şirketler ChatGPT üreticisi OpenAI gibi benzer modellerle aynı seviyede olduğunu ve sistemi veri yığınları üzerinde eğitmek için pahalı Nvidia çiplerini kullanmada daha uygun maliyetli olduğunu övündüğü yeni bir AI modeli yayınladığında AI sektöründe daha fazla ilgi görmeye başladı. Chatbot, bu yılın başlarında Apple ve Google uygulama mağazalarında göründüğünde daha geniş bir şekilde erişilebilir hale geldi.

Ancak geçen hafta yayınlanan bir takip araştırma makalesi — Başkan Donald Trump'ın göreve başlama töreniyle aynı gün — ardından gelen paniği harekete geçirdi. Bu makale, gelişmiş "akıl yürütme" becerileri gösteren — bir matematik problemine yaklaşımını yeniden düşünme yeteneği gibi — ve OpenAI tarafından satılan o1 adlı benzer bir modelden önemli ölçüde daha ucuz olan R1 adlı başka bir DeepSeek AI modeliyle ilgiliydi.

Rasgon, "Ekonomilerinin nasıl göründüğüne dair hiçbir fikrim yok," dedi. "Ama bence fiyat noktaları insanları korkuttu."

'Sputnik' arka planı

DeepSeek'in teknik yetenekleri konusunda yaşanan dramın arkasında, ABD içinde yapay zeka konusunda Çin ile nasıl rekabet edileceğine dair bir tartışma yatıyor.

Girişim sermayedarı Marc Andreessen, Pazar günü sosyal platform X'te yaptığı bir paylaşımda, Sovyetler Birliği ile ABD arasında Soğuk Savaş döneminde uzay keşif yarışını başlatan 1957 uydu fırlatılışına atıfta bulunarak, "Deepseek R1, yapay zekanın Sputnik anıdır" dedi.

Trump'a teknoloji politikaları konusunda danışmanlık yapan Andreessen, ABD hükümetinin yapay zeka sektörüne yönelik aşırı düzenlemesinin Amerikan şirketlerini engelleyeceği ve Çin'in öne geçmesini sağlayacağı konusunda uyardı.

Ancak DeepSeek'e olan ilgi, son yıllarda Çin'e Amerikan tasarımı AI yarı iletkenlerinin satışını kısıtlamak için ABD dış politikasının temel stratejisini baltalamakla da tehdit ediyor. ABD-Çin ilişkileri konusunda uzman olan bazı kişiler bunun bir kaza olmadığını düşünüyor.

Stratejik ve Uluslararası Çalışmalar Merkezi'ndeki Wadhwani AI Merkezi direktörü Gregory Allen, "Teknoloji inovasyonu gerçek, ancak piyasaya sürülme zamanlaması doğası gereği politiktir" dedi. Allen, DeepSeek'in geçen haftaki duyurusunu, ABD yaptırımlı Çinli şirket Huawei'nin 2023'te Biden yönetiminin ihracat kontrolleri hakkındaki diplomatik görüşmeler sırasında yeni bir telefon piyasaya sürmesine benzetti.

Allen, "Çin dış politikasının şu anki en önemli hedefi, ihracat kontrollerinin boşuna veya ters etki yarattığını göstermeye çalışmaktır" dedi.

Pazartesi günü Trump, DeepSeek'in atılımının "iyi olduğunu, çünkü bu kadar çok para harcamanıza gerek olmadığını" söyledi.

Pazartesi günü Miami'de Cumhuriyetçi Temsilciler Meclisi üyelerine konuşan Trump, DeepSeek haberlerinin doğru olması durumunda "olumlu" olduğunu çünkü "daha az harcama yapacağınız ve aynı sonucu alacağınızı" söyledi. Trump, bu gelişmeyi "sektörlerimiz için rekabete lazer gibi odaklanmamız gerektiğine dair bir uyarı" olarak nitelendirdi.

Trump, göreve geldiği ilk gün geçen hafta, yönetiminin "mevcut ihracat kontrollerindeki boşlukları tespit edip ortadan kaldıracağını" belirten bir kararnameye imza atmıştı. Bu, Biden'ın yaklaşımını sürdürüp daha da sertleştireceğinin sinyalini veriyordu.

DeepSeek'in yapay zeka konusunda aynı miktarda harcama yapmadan ilerlemesi, Trump'ın Beyaz Saray'da övdüğü OpenAI, Oracle ve SoftBank'ın potansiyel olarak 500 milyar dolarlık yapay zeka yatırımını baltalayabilir.

Nvidia'nın hisseleri pazartesi günü %17 düştü, ancak şirket yaptığı açıklamada DeepSeek'in çalışmalarını "yaygın olarak mevcut modelleri ve ihracat kontrolüne tam uyumlu hesaplamayı kullanan mükemmel bir yapay zeka ilerlemesi" olarak övdü.

DeepSeek'i farklı kılan nedir?

DeepSeek'i OpenAI gibi rakiplerinden ayıran bir şey de modellerinin "açık kaynaklı" olmasıdır. Yani, şirket eğitim için kullandığı verileri açıklamasa da, temel bileşenlere herkesin erişip değiştirebilmesi serbesttir.

Ancak DeepSeek'in R1 modelinin en çok hayranlık uyandıran yanı, Nvidia'nın "Test Süresi Ölçeklemesinin mükemmel bir örneği" olarak adlandırdığı şey; yani yapay zeka modellerinin düşünce akışını etkili bir şekilde göstermesi ve ardından bunları yeni veri kaynaklarıyla beslemeye gerek kalmadan daha ileri eğitim için kullanması.

Rand Corp. araştırmacılarından Lennart Heim, "Bu aslında sadece yüksek sesle düşünmekten ibaret" dedi.

Heim, OpenAI'nin o1 ile başlayan akıl yürütme modellerinin de aynı şeyi yaptığını ve Anthropic ve Google gibi diğer ABD merkezli rakiplerinin de henüz yayınlanmamış benzer yeteneklere sahip olmasının muhtemel olduğunu söyledi.

Kaynak: apnews.com

DeepSeek nedir? İşte onu farklı kılan neden

DeepSeek Nedir?

'Sputnik' arka planı

DeepSeek'i farklı kılan nedir?

Gazete Oku Mobil Uygulama