Çindən süni intellekt sahəsində sensasion YENİLİK
Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.
Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.
DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.
Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.
DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.
BiG.Az
Telegramda izləyin
Maraqlı Baxılıb: 1019 Tarix: 28 dekabr 2024
Şikayətiniz varsa Whatsapp: 077 7125666
Facebookda PaylaşOfis daxilində yaranan havasızlıq işçilərin yaddaşına və diqqətinə təsir edir
Mütəxəssislərin apardığı araşdırmalar nəticəsində məlum olub ki, işçilərin ofisdə iş zamanı yorğunluğunun və halsızlığının əsas bir vacib səbəbi var. Belə ki, bu səbəb təkcə işçilərin işləmək istəməməsi ilə əlaqədar deyil. Söhbət iş yerində olan havasız şəraitdir. ABŞ-dan olan tədqiqatçılar işçiləri
12.09.2021 489 Doğum evində skandal: 20 il sonra məlum oldu ki...
İspaniyada 20 il əvvəl iki qız uşağının səhv ailələrə verildiyi açıqlanıb. Rəsmi dairələrin məlumatına görə, hadisə Rioxa bölgəsində baş verib. Açıqlamaya görə, hadisə tibb işçilərinin diqqətsizliyi səbəbilə baş verib. Bildirilir ki, uşaqlar 5 saat fərqlə dünyaya gəlib. Onlar zəif olduğu üçün xüsus
12.09.2021 2121 "Atam anama deyirdi ki, mənə raxit övlad lazım deyil, at onu uşaqlar evinə" - 21 yaşlı "rezin qız"
Hal-hazırda 21 yaşım var, doğuşdan 5 yaşına kimi mən nə danışmışam, nə də yerimişəm. Allah bu rezinliyi oyuncağım olaraq vermişdi mənə. Anormal olsam da, əyilib-büzülürdüm, ayağımı başıma, başımı ayağıma qoymasaydım qala bilmirdim, çox sıxılırdım". Bunu -a anadangəlmə qeyri-adi istedada malik, "rezi
12.09.2021 5476 İtkin düşən 10 yaşlı qız pedofilin evində tapıdı - VİDEO
Rusiyanın Sankt-Peterburq şəhərində polis on yaşlı qızı pedofildən xilas edib. -a istinadən xəbər verir ki, məlumata görə, sentyabrın 9 -da axşam saatlarında məktəbli qızın atası Leninqrad vilayətinin polisə müraciət edərək, qızının dərsdən sonra evə qayıtmadığını bildirib. Polis itkin düşən məktəblini
13.09.2021 2197 Bu şəxslərə soğan yemək olmaz
Soğan sağlamlıq problemlərinin siyahısını genişləndirə bilər. Diyetoloq, Kanada Diyetoloqlar Birliyinin üzvü Nataliya Nefedova bu barədə danışıb. O bildirib ki, soğan xüsusilə mədə-bağırsaq traktının işinin pozulmasına səbəb ola bilər. N.Nefedova "Sputnik" radiosuna verdiyi müsahibədə qey
12.09.2021 2801 Yeni Zelandiyanın adı dəyişdirilir?
Yeni Zelandiya parlamentində yerli xalqı təmsil edən "Maori" partiyası ölkənin rəsmi adının dəyişdirilməsi üçün parlamentə təqdim edəcəyi petisiyanı onlayn imza üçün açıb. -a istinadən xəbər verir ki, petisiyada ölkənin adının Aotearoa olaraq dəyişdirilməsi, şəhərlərin, qəsəbələrin və yerləri
15.09.2021 1222 Aralarındakı uzun məsafəyə maraqlı həll tapan cütlük - FOTO
Uzun məsafə münasibəti yaşayan Liseok və Şindanbi, bu problemə maraqlı həll tapıblar. -a istinadən məlumat verir ki, biri Nyu -Yorkda, digəri Seulda yaşayan koreyalı cütlük, video zəng edərkən eyni vaxtda çəkdikləri şəkilləri bir araya gətirərək maraqlı fotolar əldə ediblər. Bu fotoları "Instagram"
13.09.2021 1580 Nərimanov rayon Montin qəsəbəsində tam təmirli mənzil satılır!
TƏCİLİ ŞƏXSİ ƏMLAKIMI SATIRAM !Nərimanov rayonu Montin qəsəbəsi, Murtuza Nağıyev küçəsində yeni tikili 16 mərtəbəli binanın 6-cı mərtəbəsində yerləşir. Tikili sahəsi 52 kv.m olan mənzil yataq otağı, zal+studio mətbəx, sanitar qovşaq, dəhliz və iki eyvandan ibarətdir. Qaz, su, işıq daimidir. İstilik sistem
15.09.2021 1181 Dünyanın ən nüfuzlu insanları açıqlandı
ABŞ-ın "Time" jurnalı 2021-ci ildə dünyanın ən nüfuzlu insanlarının siyahısını açıqlayıb. -a istinadən xəbər verir ki, 100 nəfərdən ibarət siyahı "Liderlər", "İxtiraçılar", "İncəsənət xadimləri", "Yenilikçilər" kimi bir neçə bölməyə ayrılıb. Siyasətçilə
16.09.2021 877