Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


BiG.Az
Telegramda izləyin
Maraqlı   Baxılıb: 1041   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş

Oxşar xəbərlər

.

Doaqlarınızın quruluğundan bezmisiniz? - ÇARƏ BURADA

MƏHSUL HAQQINDA. Faydaları:. - Dodaqların həcmini artırır, kontur xətlərini ortaya çıxarir. - Dodaqlardakı qırışıqlari azaldır. - Zədələnmiş, çatlamış dodaq toxumasını bərpa edir. - Dodaqları nəmləndirir və onlara yumuşaqliq bəxş edir. - Günəş şualarina qarşı qoruma təmin edən dodaq baxım məhsuludur

14.09.2021 364
.

Dünyanın ən nüfuzlu insanları açıqlandı

ABŞ-ın "Time" jurnalı 2021-ci ildə dünyanın ən nüfuzlu insanlarının siyahısını açıqlayıb. -a istinadən xəbər verir ki, 100 nəfərdən ibarət siyahı "Liderlər", "İxtiraçılar", "İncəsənət xadimləri", "Yenilikçilər" kimi bir neçə bölməyə ayrılıb. Siyasətçilə

16.09.2021 877
.

Prokuror küçədə çılpaq vəziyyətdə gəzdi: Sakinlər polisə şikayət etdi - FOTO

Polşanın cənub-şərqində yerləşən Svidnitsa şəhərində prokuror küçədə çılpaq vəziyyətdə gəzib. Ətrafdakı insanların çəkdiyi fotolarda çılpaq vəziyyətdə olan kişinin əlində dörd pivə butulkası ilə ərzaq mağazalarını gəzdiyi əks olunub. Digər görüntülərdə prokurorun tamamilə çılpaq bir vəziyyətdə küçələr

12.09.2021 1423
.

Pitbul küçədə səkkiz yaşlı uşağa hücum etdi - VİDEO

Türkiyənin Çorum şəhərində səkkiz yaşlı oğlan pitbul cinsli itin hücumuna məruz qalıb. -a istinadən xəbər verir ki, insident ərazidə olan təhlükəsizlik kameraları tərəfindən qeydə alınıb. Yeniyetmə oğlan ətrafdakı insanların köməyi ilə itin hücumundan xilas edilsə də, onun müxtəlif xəsarətlər aldığ

14.09.2021 1051
.

Ofis daxilində yaranan havasızlıq işçilərin yaddaşına və diqqətinə təsir edir

Mütəxəssislərin apardığı araşdırmalar nəticəsində məlum olub ki, işçilərin ofisdə iş zamanı yorğunluğunun və halsızlığının əsas bir vacib səbəbi var. Belə ki, bu səbəb təkcə işçilərin işləmək istəməməsi ilə əlaqədar deyil. Söhbət iş yerində olan havasız şəraitdir. ABŞ-dan olan tədqiqatçılar işçiləri

12.09.2021 489
.

Zooloqlar inəklərə görün nəyi öyrətdilər

Alimlər inək fermalarından çıxan tullantıların ətraf mühitə təsirini azaltmağın yolunu tapıblar. -a istinadən xəbər verir ki, məlum olduğu kimi, inəklər hər gün çox miqdarda peyin və sidik xaric edir. Buna görə də fermerlər gündəlik olaraq böyük təsərrüfatlarda tullantıların sanitariya problemi yaratmamas

15.09.2021 960
.

Pis əhvalın koronavirusla əlaqəsi açıqlandı

Pis əhval-ruhiyyə səbəbindən COVID-19-a yoluxmaq mümkündür. -a istinadən xəbər verir ki, bu barədə rusiyalı infeksionist Svetlana Malinovskaya koronavirusun gözlənilməz səbəbləri barədə danışarkən bildirib. Həkimin sözlərinə görə, insanın psixoloji vəziyyətinin immun sistemə böyük təsiri var. "Qorxu

13.09.2021 1024
.

56 yaşında moda dünyasını silkələyən qadın kimdir? - FOTO

Markaların reklam kampaniyalarında baxanda elə təəssürat yaranır ki, yaşlı qadınlar bazardan kənarlaşdırılıb və bu dünyada onlara yer yoxdur. Uzun illər həqiqətən belə idi, dəb dünyasında yaş kriteriyaları və gənclik kultu hökm sürürdü. Sosial şəbəkələrin yaranması ilə xoşbəxtlikdən standartlar dəyişməy

15.09.2021 2086
.

Əfqan ulduz ölkədən qaçmasından danışdı: başımdan vur, amma...

Əfqanıstanda qadın hüquqlarını müdafiə etdiyi üçün və geyimləri ilə bağlı radikal şəxslərin qəzəbinə tuş gələn 36 yaşlı pop ulduz Aryana Səid "Taliban" hakimiyyəti ələ keçirdikdən sonra paytaxt Kabildən İstanbula necə qaçdığını danışıb. Müğənninin avqustun 15-də "Taliban" Kabilə daxi

12.09.2021 1875
.

TOP MP3