Çindən süni intellekt sahəsində sensasion YENİLİK
Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.
Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.
DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.
Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.
DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.
BiG.Az
Telegramda izləyin
Maraqlı Baxılıb: 987 Tarix: 28 dekabr 2024
Şikayətiniz varsa Whatsapp: 077 7125666
Facebookda Paylaş
Bayramda görülən hansı yuxular çin olur? - XALQ İNANCLARI
Bayram günlərində görülən yuxuların çin çıxması mövzusu Azərbaycan xalq inanclarında və ümumilikdə Şərq mədəniyyətində dərin köklərə malikdir. Bu inam təkcə sadə bir təsadüf və ya təsəvvür deyil, əsrlər boyu formalaşmış düşüncə tərzinin, dünyagörüşünün və mənəvi həyatın bir hissəsi kimi qəbul edilir
22.03.2026 632 Dəfnə yarpağı sayəsində milyonlar qazandı
Moskva sakini çantasındakı dəfnə yarpağı sayəsində 2,8 milyon rubldan çox (33 min dollardan çox) pul udub. Rusiya mediasına istinadən xəbər verir ki, qalibin sözlərinə görə, o, oyun üçün kortəbii olaraq üç 60 rublluq bilet alıb - onlardan biri şanslı olub. "Cüzdanımda bir dəfnə yarpağı və bir a
22.03.2026 451 İlin ən pis film və aktyorlarının - Siyahısı
İlin ən pis filmi, rejisoru və aktyorlarının seçildiyi "Qızıl Moruq" antimükafatı yeni sahiblərinə təqdim olunub. Axşam.az xəbər verir ki, 46-cı dəfə baş tutan gecədə 5 kateqoriyada mükafat qazanan film "Dünyaların müharibəsi" olub. "Qızıl Moruq 2026"nın ən pislərinin siyahıs
15.03.2026 312 Süni intellektə güvənməməli olduğunuz - 7 məqam
Süni intellekt artıq yalnız texnologiya deyil, həm də gündəlik həyatımızın görünməz bir hissəsinə çevrilib. Məlumatlar, işlə bağlı verdiyimiz qərarlar, hətta şəxsi tövsiyələr. Lakin bu rahat mənzərə mühüm bir sualı da ortaya çıxarır: Həqiqətən hər mövzuda süni intellektə güvənə bilərikmi? Çünki sün
20.03.2026 444 Şirniyyatçılar restoranlarda heç vaxt bu tortları yemir, çünki...
Yeməkdən sonra masanı şirin desertlə tərk etmək bir çoxumuz üçün xoş ənənəyə çevrilib. Restoran menyularında bu şirniyyatlar adətən çox cazibədar görünür. Amma mətbəxdə baş verənlər bəzən menyudakı gözəlliyə uyğun olmur. -ın məlumatına görə şirniyyat sahəsi üzrə ekspertlərin fikrincə bəzi desertlər va
15.03.2026 657 Qadınların neçə saat yatması lazımdır? - Ekspertdən DƏQİQ CAVAB
Statistikaya görə qadınlar kişilərlə müqayisədə daha az yatırlar. -ın xarici mediaya istinadən məluamtına görə, yetkin qadınlar kişilərə nisbətən gecələr daha tez-tez oyanır və daha gec yatmağa gedirlər. 20-30 yaş arası qadınlara nə qədər yuxu lazımdır?. Yuxu üzrə ekspert, həkim Debora Li bildirir ki
15.03.2026 293 Pişiklər bizim görmədiyimiz nəyi GÖRÜR?
Pişiklər hər zaman sirli canlılar kimi görünür. Onların baxışları çox vaxt elə bir yerə yönəlir ki, insan orada heç bir qeyri-adi şey görmür. Pişiklərin görmə sistemi fərqli qurulub. Onlar dünyanı başqa bir spektrdə qavrayırlar. Pişiklər ultrabənövşəyi (UV) əks olunmaları görə bilirlər, insan gözü is
15.03.2026 317 1.5 milyonluq uduş "buxarlandı" - Almaniyada inanılmaz hadisə
Bavariyada bir kişi lotereyada qazandığı 1.5 milyon avroluq uduşdan yanacaqdoldurma məntəqəsinin əməkdaşının hərəkətinə görə məhrum olub. xəbər verir ki, bu barədə "Bild" nəşri məlumat yayıb. Hadisə 2024-cü ilin aprelində Qrasbrunn qəsəbəsində baş verib. Yerli sakin "Spiel 77" lotereyasın
21.03.2026 336 Mətbəx çanağındakı xoşagəlməz qoxunu yox etməyin yolları
Mətbəx çanağından gələn pis qoxu adətən kanalizasiya borularında yığılan yağ qalıqları, qida hissəcikləri və sabun çöküntüsü səbəbindən yaranır. Bu mühit bakteriyaların çoxalmasına şərait yaradır və nəticədə xoşagəlməz qoxu əmələ gəlir. xarici mediaya istinadən xəbər verir ki, problemi həll etmək üçü
15.03.2026 306