
Yapay zekâ dünyası 2026’ya epeyce süratli bir giriş yaptı. Çinli yapay zekâ devi DeepSeek, yayımladığı yeni teknik makale ile temel yapay zekâ modellerinin eğitiminde kullanılan mimariyi kökten değiştireceğini ileri sürdü. Şirketin kurucusu Liang Wenfeng’in de ortalarında bulunduğu 19 kişilik takım, modelleri daha uygun maliyetli hâle getirmeyi amaçlıyor.
Bu yeni formül, bilhassa kısıtlı süreç gücüyle ABD’li rakiplerine karşı yarışan şirketler için can suyu niteliğinde olabilir. “Manifold-Constrained Hyper-Connections” (mHC) olarak isimlendirilen teknik, modellerin ölçeklenebilirliğini artırırken hesaplama yükünü neredeyse hiç artırmıyor.
Manifold-Constrained Hyper-Connections (mHC) nedir ve neyi değiştiriyor?

DeepSeek’in önerdiği mHC mimarisi, aslında ByteDance tarafından 2024’te önerilen Hyper-Connections (HC) tahlilinin geliştirilmiş bir versiyonu. Araştırmacılar; bu tekniği 3 milyar, 9 milyar ve 27 milyar parametreli modellerde test ederek sistemin muvaffakiyetini kanıtladı. Sonuçlar, mHC’nin klasik formüllere nazaran çok daha kararlı bir büyük ölçekli eğitim sunduğunu gösteriyor.
Mevcut sistemlerde kullanılan ResNet mimarisi, derin ağlarda bilgi akışını stabilize etse de birtakım sinyal meseleleri yaşatabiliyordu . mHC ise bu süreci makul bir “manifold” ile kısıtlayarak bellek maliyetlerini denetim altında tutuyor ve verimliliği maksimize ediyor. Bu durum, gelecek jenerasyon temel modellerin evrimi için yeni bir yol aydınlatabilir.

DeepSeek’in bu teknik makaleyi şahsen CEO Liang Wenfeng aracılığıyla arXiv’e yüklemesi, kesim analistleri tarafından kıymetli bir sinyal olarak görülüyor. Çoklukla bu usul derin teknik paylaşımlar, şirketin bir sonraki büyük modelinin ayak sesleri olarak kabul ediliyor.
Şirket, geçtiğimiz yıl çığır açan R1 modelini Çin’in ulusal tatili arifesinde yayımlamıştı. Bu yıl da benzeri bir stratejiyle, Şubat ortasındaki “Bahar Festivali” devrinde yeni bir modelin piyasaya sürülmesi bekleniyor. Yapay zekâ eğitiminde maliyetlerin bu kadar düşmesi, kesimdeki istikrarları büsbütün değiştirebilir.
Webtekno
https://www.webtekno.com/deepseek-yapay-zeka-modellerini-ucuza-egitecek-h210036.html