Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


BiG.Az
Telegramda izləyin
Maraqlı   Baxılıb: 924   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş

Oxşar xəbərlər

.

Bu üçəmlər "TikTok"da səs salıb, amma oğlanlar... - FOTO-VİDEO

İngiltərənin Qreyvzend şəhərindən olan 18 yaşlı Şerena, Keyli və Eliza Terri üçəmləri aktiv "TikTok" istifadəçiləridirlər. BİG.AZ xəbər verir ki, onlar barədə "Daily Mirror" yazır. Qızlar əks cinslə münsibətlərindən danışarkən bildiriblər ki, oğlanlar çox vaxt bacıların gözəlliyin

16.09.2021 3201
.

Aygün Kazımovanı arxada qoydu, 31 yaşında Amerikada güllələndi – Azərbaycanlı müğənninin faciəvi həyatı

Sevil Maqsud qızı Hacıyeva 3 oktyabr 1968-ci ildə Bakı şəhərində anadan olub. Gənc yaşlarından etibarən musiqi fəaliyyətinə başlayan Sevilin qısa zaman ərzində istedadı kəşf edilir və müxtəlif musiqi tədbirlərində çıxış etməyə başlayır. Azərbaycan Dövlət Konservatoriyasının fortepiano şöbəsində təhsi

12.09.2021 3724
.

Dünyanın ən nüfuzlu insanları açıqlandı

ABŞ-ın "Time" jurnalı 2021-ci ildə dünyanın ən nüfuzlu insanlarının siyahısını açıqlayıb. -a istinadən xəbər verir ki, 100 nəfərdən ibarət siyahı "Liderlər", "İxtiraçılar", "İncəsənət xadimləri", "Yenilikçilər" kimi bir neçə bölməyə ayrılıb. Siyasətçilə

16.09.2021 877
.

Məşhur şirkətlərdə məvaciblər nə qədərdir?

Bir çoxları "Google", "Facebook", "Amazon", "Uber", "Microsoft", "Intel", IBM kimi tanınmış ABŞ şirkətlərdə çalışmaq arzusundadır. Cari ilin ilk yarısında texnoloji nəhənglər 80 min nəfərdən çox əcnəbi əməkdaşı işə cəlb edib. Bəs görəsən onlar

16.09.2021 817
.

Rusiyada məktəb dərsliyində porno sayta istinad tapılıb – FOTO

Rusiyada orta məktəb dərsliyində porno saytına aparan istinad tapılıb. -a istinadən xəbər verir ki, yayılan məlumatlara görə, neqativ hal altıncı sinif ingilis dili üzrə test tapşırıqları toplusunda üzə çıxarılıb. Həmçinin, eyni səhifədə porno aktrisasının vizit kartı da əks olunub. Müvafiq qurumları

14.09.2021 2022
.

Oturaq həyat tərzi keçirənlər necə qidalanmalıdır? - Dəyərli məsləhətlər

Azərbaycan Respublikası Qida Təhlükəsizliyi Agentliyinin (AQTA) "AQTA maarifləndirir" rubrikası davam edir. agentliyə istinadən xəbər verir ki, rubrika çərçivəsində AQTA və Qida Təhlükəsizliyi İnstitutunun (AQTİ) mütəxəssisləri tərəfindən hazırlanan maarifləndirici materiallar, sağlam qidalanm

11.09.2021 659
.

Cəmi 2 kilo kökəldiyi üçün işini itirdi - FOTOLAR

"Emirates Airline" şirkətində 3 ilə yaxın stüardessa işləyən Duyqu Karaman cəmi 2 kilo kökəldiyi üçün işdən çıxmalı olub. BİG.AZ xəbər verir ki, bu barədə "Mirror" yazır. Belə ki, iş yoldaşlarından biri onun çox "iri" olduğunu bildirərək rəhbərliyə şikayət edib. Şikayətdə

11.09.2021 2925
.

"Daha ağıllı və daha yaradıcı düşünməyə vadar edir" - Alimlər çayın faydasını araşdırdı...

Pekin Universitetinin alimləri bir fincan çay içməyin yaradıcı düşüncəni inkişaf etdirdiyini aşkar ediblər. Araşdırma nəticəsində mütəxəssislər çayın bioloji komponentlərinin deyil, çay içmək prosesinin özünün insanları "daha ağıllı və daha yaradıcı" olduqlarını düşünməyə sövq etdiyi qənaətin

12.09.2021 1068
.

Bayden Trampı xatırlayan kimi xaç çəkdi - VİDEO

ABŞ prezidenti Co Bayden demokrat qubernaton Qevin Nyusoma dəstək mitinqində özünün Donald Trampla rəqabətini xatırlayıb. -ın -a istinadən məlumatına görə, o bildirib ki, Kaliforniya sakinlərinin qəbul edəcəyi qərar tək ABŞ-a yox, ümumilikdə bütün dünyaya təsir qoyacaq. "Bilirsiniz ki, ötən il seçkilərd

15.09.2021 660
.

TOP MP3