Çindən süni intellekt sahəsində sensasion YENİLİK
Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.
Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.
DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.
Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.
DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.
BiG.Az
Telegramda izləyin
Maraqlı Baxılıb: 961 Tarix: 28 dekabr 2024
Şikayətiniz varsa Whatsapp: 077 7125666
Facebookda Paylaş
Toyda qayınananın gəlinə baxışları GÜNDƏM OLDU - VİDEO
Sosial şəbəkələrdə yayılan bir toy videosu qısa zamanda geniş marağa səbəb olub. xəbər verir ki, toy mərasimində tortkəsmə zamanı baş verən anlar izləyicilərin diqqətindən yayınmayıb. Görüntülərdə gəlinə tort təqdim edilən anda qayınananın ona yönəltdiyi baxışlar sosial media istifadəçiləri arasınd
25.01.2026 1366 Ən hündür binalar hansı ölkələrdədir? - Heyrətləndirən FAKTLAR
Göydələnlər artıq çoxdan sadəcə binalar olmaqdan çıxıb. Onlar tərəqqinin və insan ambisiyalarının simvoluna çevriliblər. xarici mediaya istinadən xəbər verir ki, dünyada ən hündür bina hündürlüyü 828 metri keçən Dubaydakı Bürc Xəlifə hesab olunur. Göydələnin ən yuxarı mərtəbələrindən açılan mənzərələ
25.01.2026 502 "YouTube" milyonlarla abunəçisi olan kanalları sildi
"YouTube" süni intellektlə hazırlanmış aşağı keyfiyyətli məzmunla mübarizə çərçivəsində bir neçə məşhur kanalı eyni vaxtda platformadan silib. xəbə verir ki, onlayn video montaj platforması Kapwing-in yeni hesabatı göstərir ki, "Google"a məxsus "YouTube" 2026-cı ilin əvvəlind
31.01.2026 659 Fransızlar niyə uşaq sahibi olmaq istəmirlər? - Ölüm sayı doğumu keçib
Fransa misli görünməmiş demoqrafik dəyişikliklə üz-üzə qalıb. xarici mediaya istinadla xəbər verir ki, 2025-ci ilin yekunlarında ölkədə ölüm sayı ilk dəfə İkinci Dünya müharibəsindən sonra doğum sayını ötüb. Milli Statistika və İqtisadi Araşdırmalar İnstitutunun (INSEE) rəsmi illik hesabatına əsasən
01.02.2026 401 Heyvanlar yuxuda nə görürlər? Maraqlı faktlar AÇIQLANDI
Alimlər heyvanların həyatı ilə bağlı gözlənilməz faktları açıqlayıblar. Onlar müəyyən ediblər ki, yuxu təkcə insanlara yox, həm də heyvanlara - xüsusilə siçovullara, meymunlara və hətta ahtapotlara da xasdır. xarici mediaya istinadən xəbər verir ki, alimlər artıq dəqiq şəkildə müəyyən ediblər ki, heyvanla
25.01.2026 874 Arxeoloji tapıntılar sübut etdi: Çində qədim insanlar axmaq olmayıb
Çindəki arxeoloji abidədə mürəkkəb daş alətlərin aşkarlanması alimləri insanın təkamülü haqqında mövcud anlayışları yenidən nəzərdən keçirməyə məcbur edir. Qaynarinfo-nnu "The Independent"ə istinadən məlumatına görə, Danjiangkou su anbarı ərazisində arxeoloqların qazıntıları göstərir ki, insanları
30.01.2026 744 Xurmanı necə saxlamaq lazımdır ki, şirin olsun
Xurmanın həm rəngi, həm də dadı ilə ən parlaq meyvələrdən biri olduğu bu mövsümdə onu düzgün saxlamağı bilmək çox vacibdir. xarici mediaya istinadla bildirir ki, çünki müxtəlif xurma sortları arasında dad və quruluş baxımından ciddi fərqlər olur. Bazarlarda satılan xurma adətən yapon xurması olan Diospyro
25.01.2026 476 Mexaniklərdən MƏSLƏHƏT: Bu 5 məşhur avtomobili almayın - SƏBƏB
Ekspertlər bu avtomobillərin bir çox problemi olduğunu bildiriblər. Bəzi avtomobillər çox diqqət çəkir və bestseller olur. Lakin, bu cür modellərin hamısını almağa dəyməz. -ın xarici mediaya istinadla məlumatına görə, ekapertlər almağı tövsiyə etmədikləri beş çox məşhur avtomobilin adını çəkiblər. Onları
25.01.2026 811 Bu mağara itmiş bir dünyanı ortaya çıxardı
Yeni Zellandiyanın Şimal Adasında dik bir yamacın içində gizlənmiş olan Moa Yumurta Qabığı Mağarası (Moa Eggshell Cave), elm dünyasına qapılarını açıb. Mağara adətən bir zaman maşını kimi fəaliyyət göstərir. Qaynarinfo xəbər verir ki, Vaitomo bölgəsi parlayan tırtılların işıqlandırdığı möhtəşəm mağaralar
02.02.2026 680