DeepSeek, 1 жылдың басында өзінің R2025 пайымдау үлгісімен алғаш рет хабар таратқан қытайлық AI стартапы ашық бастапқы AI жағдайы және оның кеңірек салдары туралы қызу пікірталас тудырды. Көп көңіл оның әсерлі өнімділігіне (OpenAI және Alibaba сияқты американдық фирмалардың бәсекелес үлгілеріне) шоғырланғанымен, DeepSeek рухы мен тәжірибесінде шын мәнінде «ашық дереккөз» болып табыла ма деген сұрақтар әлі де бар. Бұл мақала DeepSeek айналасындағы соңғы оқиғаларды зерттейді, оның ашық бастапқы тіркелгі деректерін зерттейді, оны GPT-4.1 сияқты модельдермен салыстырады және жаһандық AI ландшафтының салдарын бағалайды.
DeepSeek дегеніміз не және ол қалай пайда болды?
DeepSeek-тің шығу тегі мен амбициясы
DeepSeek Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. атауымен құрылды, оның негізгі көрегені ретінде жауапты Лян Вэньфэн (Вэньфэн Лян деп те аталады) басқарады. Оның этикасы Силикон алқабының көптеген стартаптарынан алшақ болды: жылдам коммерцияландыруға басымдық берудің орнына, DeepSeek зерттеудің тиімділігі мен үнемділігіне баса назар аударды. 2025 жылдың басында DeepSeek-тің R1 моделі жоғары деңгейлі AI чиптеріндегі АҚШ-тың экспорттық бақылауының шектеулерімен әзірленгеніне қарамастан, математикалық пайымдаулар мен кодтарды генерациялаудағы жетекші көрсеткіштерге сәйкес келуі немесе асып түсуі үшін назар аударды.
Ойлау модельдеріндегі серпіліс
2025 жылдың қаңтарында DeepSeek R1-ді MIT лицензиясы — ашық бастапқы рұқсат беретін лицензия бойынша таныстырды, ол R1 «AIME 79.8-те 1% Pass@2024 деңгейіне қол жеткізіп, OpenAI-o1-1217-ден сәл асып түсті» және «MATH-97.3-де жалпыға ортақ және басқа модельдермен салыстыру бойынша «500%» ұпай жинады. Кодтау тапсырмалары бойынша R1 Codeforces бойынша 1 Elo рейтингіне қол жеткізіп, адам қатысушыларының 2,029%-ынан асып түсті, бұл модель тек теориялық жаттығу ғана емес, сонымен қатар нақты әлем қолданбаларына жарамды жоғары өнімді құрал екенін көрсетеді.
Сарапшылар қоспасы (МЭ) қабаттары және сауда шектеулері қажет ететін әлсіз AI чиптері бойынша оқыту сияқты әдістерді қолдану арқылы DeepSeek оқыту шығындарын күрт төмендетті. Бақылаушылар оның көзқарасы жоғары деңгейлі аппараттық құралдарға болжамды тәуелділікке қарсы шығып қана қоймай, сонымен қатар Nvidia-ның нарықтық құнының бір сессияда шамамен 600 миллиард долларға төмендеуіне әкеліп соқтырған «соққы толқындарын» жібергенін атап өтті, бұл «АҚШ қор нарығы тарихындағы ең үлкен бір компанияның құлдырауы».
DeepSeek шынымен ашық көзі ме?
Лицензиялау және қол жетімділік
DeepSeek R1 моделі 2025 жылдың қаңтарында MIT лицензиясы бойынша құшақталған бет бойынша шығарылды, бұл модель салмақтары мен байланысты кодты шектеусіз коммерциялық пайдалануға, өзгертуге және қайта бөлуге мүмкіндік береді. Бұл лицензиялау таңдауы техникалық тұрғыдан R1-ді ашық бастапқы жоба ретінде жіктейді, бірақ іс жүзінде нюанстар туындайды. Үлгі салмақтары мен қорытынды коды жалпыға қолжетімді болғанымен, ол толық оқу деректер жинағын немесе нақты оқыту құбырларын шығарған жоқ. Бұл олқылық оның қайталану мүмкіндігінің егжей-тегжейлерімен бөлісетін жобалармен бірдей рухта «толық» ашық дереккөз ретінде жарамдылығы туралы сұрақтарды тудырады. Мысалы, кез келген адам R1 жүктеп алып, дәл баптай алатын болса да, олар меншік деректеріне және кластер конфигурацияларына (мысалы, 5,000 A100 GPU пайдаланатын Fire-Flyer кластерлері) қол жеткізбестен DeepSeek бастапқы оқыту процедурасын қайталай алмайды.
Тренинг деректерінің ашықтығы
Ашық коды бар пуристілер көбінесе үлгі салмақтары мен кодтарының қолжетімділігін ғана емес, сонымен қатар оқу деректеріне, алдын ала өңдеу сценарийлеріне және бағалау эталондарына қатысты мөлдірлікке баса назар аударады. Бұл жағдайда компания тазартылған нұсқаларды дәл баптау үшін «R1 арқылы жасалған синтетикалық деректерді» пайдалану және R1-Zero үшін ережеге негізделген сыйақы функцияларын қосу сияқты жоғары деңгейлі мәліметтермен бөлісті, бірақ деректердің шығуы мен өңдеу процестеріне қатысты ерекшеліктерді жасырды. Бұл ақпаратсыз сыртқы зерттеушілер модельдің этикалық және қауіпсіздік салдары туралы ашық сұрақтар қалдыра отырып, ықтимал бұрмалануларды, деректердің ластануын немесе құпиялылықтың болжанбаған ағып кетуін толық тексере алмайды.
Қоғамдастықтың қатысуы және шанышқылар
Ашық бастапқы нұсқасынан бері DeepSeek-R1 Hugging Face сияқты платформаларда шанышқылар мен қауымдастық басқаратын эксперименттерді тартты. Әзірлеушілер тұтынушы графикалық процессорлары сияқты тауарлық жабдықта жұмыс істеу үшін кішірек «тазартылған» нұсқаларды (1.5 миллиардтан 70 миллиард параметрлерге дейін) бейімдеп, осылайша қолжетімділікті кеңейтетінін хабарлады. Дегенмен, ішінара талап етілетін үлкен есептеу ресурстарына және жалпыға ортақ өңделмеген деректер жиынының болмауына байланысты, R1-ді нөлден шығару үшін әлі толық тәуелсіз мәселе болған жоқ. Көптеген қауымдастық-ресми қайта өндіру күш-жігерін тудырған LLaMA-дан айырмашылығы, DeepSeek-тің «ашық көз» шағымы қауымдастық басқаратын зерттеулердің ашықтығын қамтамасыз етудің орнына, ең алдымен салмақтарды қолжетімді етуге байланысты.
DeepSeek басқа AI үлгілерімен қалай салыстырады?
OpenAI o1, o3 және GPT-4.1 қарсы салыстыру
DeepSeek-R1 өнімділік көрсеткіштері оны пайымдау үлгілерінің жоғарғы деңгейіне орналастырады. LiveCodeBench (UC Berkeley, MIT және Cornell әзірлеген) ішкі эталондарына сәйкес, DeepSeek жаңартылған R1-0528 кодты жасауда OpenAI o4-mini және o3-тен сәл төмен, бірақ xAI Grok 3-mini және Alibaba Qwen 3 mini-ден асып түседі. Сонымен қатар, 4.1 жылдың 14 сәуірінде шығарылған OpenAI GPT-2025 бір миллион токендік контекстік терезеге ие және оның алдындағы GPT-4o нұсқасымен салыстырғанда кодтау, нұсқауларды орындау және ұзақ мәтінмәндік тапсырмаларды орындауда жақсы.
R1 мен GPT-4.1 салыстыру кезінде бірнеше факторлар пайда болады:
- Код және математика көрсеткіштері бойынша өнімділік: R1 AIME 79.8 бойынша 1% Pass@2024 және MATH-97.3 бойынша 500% ұпай жинап, o1-ден сәл асып түседі. GPT-4.1, өз кезегінде, кодтауда шамамен ~54.6% (SWE-bench Verified) және 72% ұзақ мәтінмәндік тапсырмаларда қол жеткізеді — әсерлі болғанымен, R1 мамандандырылған дәлелдеу көрсеткіштерімен тікелей салыстыруға келмейтін көрсеткіштер.
- Мәтінмәндік терезе: GPT-4.1 бір өтуде бүкіл кітаптарды немесе ұзақ кодтық базаларды өңдеуге мүмкіндік беретін миллионға дейін таңбалауышты қолдайды. DeepSeek's R1 бұл мәтінмән ұзындығына сәйкес келмейді, оның орнына қысқарақ кірістердегі пайымдаулар мен қорытындылар тиімділігіне назар аударады.
- Шығын тиімділігі: Hugging Face-те R1 API қолжетімділігі OpenAI o95 нұсқасынан 1%-ға дейін арзанырақ, бұл оны бюджеті шектеулі стартаптар мен зерттеушілер үшін тартымды етеді. GPT-4.1 базалық бағасы бір миллион кіріс таңбалауышы үшін 2 доллар және миллион шығару токендері үшін 8 доллар, мини және нано нұсқалары одан да төмен бағаланады (тиісінше $0.40/$1.60 және $0.10/0.40). DeepSeek-тің тазартылған үлгілері ноутбуктерде жұмыс істей алады, бұл аппараттық қамтамасыз етуді талап ету кезеңінде шығындарды үнемдеудің басқа деңгейін ұсынады.
Архитектуралық айырмашылықтар
DeepSeek R1 моделі сарапшылар аралас архитектурасын қолданады, онда желінің үлкен бөліктері қажет болған жағдайда ғана іске қосылады, бұл қорытындыларды есептеу шығындарын айтарлықтай азайтады. Бұл ТМ деңгейлері асинхронды байланыс кітапханаларымен біріктірілген (мысалы, hfreduce) және Fire-Flyer DDP негізі, DeepSeek-ке сауда шектеулері бойынша әлсіз аппараттық кластерлер бойынша дәлелдеу тапсырмаларын масштабтауға мүмкіндік береді.
Керісінше, GPT-4.1 бір миллион токендік контекстік терезені өңдеу үшін бүкіл желіде тығыз трансформаторлық қабаттарды пайдаланады. Бұл ұзақ мәтінмәндік тапсырмаларда жоғары өнімділікке әкелсе де, оқыту және қорытынды жасау үшін айтарлықтай есептеуді қажет етеді, сондықтан GPT-4.1 мини және нано сияқты кішірек үлгілерге қатысты GPT-4.1-тің жоғары бағалары бар.
DeepSeek-тің ашық бастапқы тәсілінің салдары қандай?
Жаһандық AI бәсекелестігіне әсері
DeepSeek-тің ашық бастапқы нұсқасы меншікті модель мен деректер эмбаргосының дәстүрлі Силикон алқабының ойын кітабын қысқартады. R1-ді MIT лицензиясы бойынша жалпыға қолжетімді ете отырып, DeepSeek жоғары өнімді AI жабық немесе тек лицензияланған күйде қалуы керек деген түсінікке қарсы шықты. Шұғыл нәтиже айқын болды: АҚШ-тың технологиялық алпауыттары нарық үлесін сақтап қалу үшін бағаны түзетіп (мысалы, OpenAI GPT-4.1 мини және нано-ны төмен бағамен шығарады) және өздерінің o4-mini сияқты ойлауға негізделген үлгілерін жылдам дамытуды бастады. Сала комментаторлары DeepSeek-тің пайда болуын АҚШ-тың AI үшін ықтимал «Sputnik сәті» деп атады, бұл негізгі AI мүмкіндіктеріне гегемондық бақылаудың ауысуын білдіреді.
DeepSeek-тің ашық бастапқы стратегиясы венчурлық капиталдың көңіл-күйіне де әсер етті. Кейбір инвесторлар АҚШ-тың AI фирмаларына қолдау көрсету қытайлық ашық бастапқы баламалар көбейетін болса, кірістің азаюы мүмкін деп қорыққанымен, басқалары оны AI саласындағы жаһандық зерттеулер ынтымақтастығын әртараптандыру мүмкіндігі ретінде қарастырды. Венчурлық капиталист Марк Андреессен R1-ді «ең таңғажайып және әсерлі серпілістердің бірі» және «әлемге берілген үлкен сыйлық» деп бағалады. Сонымен қатар, OpenAI-дің 4.1 жылдың сәуіріндегі GPT-2025 шығарылымын ішінара DeepSeek-тің үнемді ашық бастапқы коды үлгісіне қарсы шара ретінде қарастыруға болады, бұл ашық қол жетімділіктің алдыңғы қатарлы өнімділікті құрбан етудің қажеті жоқ екенін көрсетеді.
Қауіпсіздік және құпиялылық мәселелері
Ашық бастапқы интеллектіні демократияландыруға деген ынта-жігеріне қарамастан, DeepSeek-тің шығу тегі құпиялылықты қорғаушылар мен мемлекеттік органдар арасында қызыл жалауларды көтерді. 2025 жылдың қаңтарында Оңтүстік Кореяның Жеке ақпаратты қорғау комиссиясы (PIPC) өзінің онлайн қызметі оңтүстік кореялық пайдаланушы деректерін Қытайдағы ByteDance серверлеріне жіберетінін растады, бұл сәйкестік мәселелері шешілгенше жаңа қолданбаларды жүктеп алуға тыйым салуды талап етті. 2025 жылдың қаңтар айының соңында орын алған келесі деректердің бұзылуы DeepSeek деректерін қорғау тәжірибесіне қатысты алаңдаушылықты күшейте отырып, қате конфигурацияланбаған бұлтты сақтау дерекқорына байланысты бір миллионнан астам құпия жазбаларды (чат хабарларын, API кілттерін және жүйелік журналдарды) ашты.
Компанияларды мемлекеттік органдармен деректерді бөлісуге мәжбүрлейтін қытайлық ережелерді ескере отырып, кейбір Батыс үкіметтері мен кәсіпорындары DeepSeek-ті маңызды жұмыс үрдістеріне біріктіруден сақ болады. DeepSeek өзінің инфрақұрылымын қорғау үшін қадамдар жасағанымен (мысалы, бір сағат ішінде ашық дерекқорды түзету), әлеуетті бэкдорларға немесе әсер ету операцияларын дұрыс пайдаланбауға қатысты күмән сақталады. Wired өз еліне деректерді жіберетін DeepSeek онлайн қызметі «көбірек тексеруге жағдай жасауы мүмкін» деп хабарлады және Еуропа мен АҚШ-тағы реттеуші органдар GDPR және CCPA шеңберлері бойынша мұқият тексеруге шақырды.
Аппараттық және инфрақұрылымдық шығындарға әсері
DeepSeek-тің оңтайлы емес жабдықта жоғары өнімді ойлау үлгілерін үйрету және орналастыру қабілеті AI инфрақұрылымының кең нарығына серпінді әсер етеді. MoE қабаттары мен оңтайландырылған параллелизмді көрсету арқылы (мысалы, HaiScale DDP) толық тығыз модельдермен салыстырылатын ойлау дәлдігін бере алады, DeepSeek негізгі бұлттық провайдерлерді — Microsoft Azure, AWS және Google Cloud — DeepSeek оңтайландыру әдістерін біріктіруді бағалауға мәжбүр етті. Microsoft пен Amazon компаниясы GPT-1 немесе o4.1 API интерфейстеріне арзанырақ баламаларды іздейтін тұтынушыларға қызмет көрсететін AI қызмет каталогтарының бөлігі ретінде DeepSeek-R1 ұсына бастады.
Сонымен қатар, NVIDIA, тарихи басым GPU жеткізушісі, бәсекеге қабілеттілігін сақтау үшін арнайы аппараттық құралдарды (мысалы, HBM3 қолдайтын GPU және NVLink топологиялары) атап өту арқылы MoE басқаратын тиімділігіне жауап берді. NVIDIA акцияларының бағасының көтерілуінен кейінгі құбылмалылығы алгоритмдік тиімділіктегі серпілістер аппараттық құралдарға сұраныс болжамдарын қалай өзгерте алатынын көрсетеді. Осылайша, меншікті жабдықты ашпастан да, DeepSeek болашақ AI үдеткіштерінің жол картасына жанама түрде әсер етті.
Соңғы R1-0528 жаңартуы DeepSeek-тің ашықтыққа деген ұмтылысы туралы нені көрсетеді?
R1-0528 техникалық жетілдірулер
28 жылдың 2025 мамырында жарияланған DeepSeek R1-0528 жаңартуы математикалық пайымдауларды, бағдарламалау тапсырмаларын және галлюцинацияларды - AI жасаған ақпараттағы қателерді азайтуды айтарлықтай жақсартуға уәде береді. DeepSeek бұл шығарылымды «кішкентай сынақ жаңартуы» деп сипаттағанымен, UC Berkeley, MIT және Cornell's LiveCodeBench салыстыру R1-0528 OpenAI компаниясының o3 және o4-mini үлгілерімен бәсекеге қабілетті екенін көрсетеді. Жаңарту сонымен қатар хабарландырудан кейін көп ұзамай Hugging Face қолданбасында жаңа салмақтар мен қорытынды кодын шығару арқылы өзінің ашық бастапқы коды ашық саясатын қайталайды, бұл оның қауымдастық негізіндегі дамуға және бірлескен оңтайландыруға деген адалдығын күшейтеді.
Қоғамдастықты қабылдау және кері байланыс
Әзірлеушілер қауымдастығы галлюцинация жылдамдығының төмендеуіне және нәтижелердің жақсартылған логикалық сәйкестігіне сілтеме жасай отырып, R1-0528-ге оң жауап берді. Hugging Face және GitHub сияқты форумдардағы талқылаулар зерттеушілердің MIT лицензиясының рұқсат ету мүмкіндігін жоғалтпастан айтарлықтай өнімділік жетістіктерін бағалайтынын көрсетеді. Дегенмен, кейбір авторлар оқыту деректерінің ашықтығына және нақты реттеуге мемлекеттік директиваның ықтимал ықпалына алаңдаушылық білдіріп, ашық бастапқы лицензиялаудың өзі толық ашықтыққа кепілдік бермейтінін атап өтті. Бұл диалогтар оның ашық бастапқы этикасы тексерілетін, сенімді AI жүйелеріне айналуын қамтамасыз ету үшін тұрақты қоғамдастықтың қатысуы қажеттігін көрсетеді.
Қорытындылар
DeepSeek-тің ашық бастапқы жасанды интеллектке енуі қолжетімділік, өнімділік және үнемділік бойынша үміттерді қайта анықтады. Оның R1 моделі MIT лицензиясы бойынша техникалық ашық бастапқы дереккөз болғанымен, толық оқу деректерінің және құбырдың ашықтығының болмауы оның «толық» ашық деп жіктелуін қиындатады. Соған қарамастан, оның жетістіктері — аппараттық шектеулер жағдайында қуатты дәлелдеу үлгілерін үйрету және оларды кеңінен қол жетімді ету — ғаламдық AI қауымдастығында толқуды да, мұқият тексеруді де тудырды.
OpenAI-дің GPT-4.1 нұсқасымен салыстыру нюансты ландшафтты көрсетеді: DeepSeek мақсатты негіздеу тапсырмалары мен шығынды қажет ететін параметрлерде жақсы жұмыс істейді, ал GPT-4.1-дің ауқымды мәтінмәндік терезесі және ауқымды эталондық артықшылығы оны жоғары деңгейлі кәсіпорын қолданбалары үшін таңдау жасайды. DeepSeek R2 моделін дамытып, бұлттық провайдерлермен ынтымақтастықты кеңейте отырып, оның тағдыры деректердің құпиялылығы мәселелерін шешуге, нормативтік талаптарға сәйкестікті қамтамасыз етуге және зерттеу процесінде бұдан да үлкен ашықтықты қамтуға байланысты болады.
Сайып келгенде, DeepSeek-тің өркендеуі ашық бастапқы интеллект бұдан былай теориялық идеал емес, бәсекені қайта қалыптастыратын практикалық күш екенін көрсетеді. Қалыптасқан қызметшілерді сынай отырып, DeepSeek инновациялар циклін жеделдетіп, құрылған фирмаларды да, жаңадан келгендерді де AI жүйелерін қалай дамытатынын, лицензиялайтынын және енгізетінін қайта қарастыруға итермеледі. GPT-4.1 бір эталонды және DeepSeek-R1 басқасын белгілейтін осы динамикалық ортада ашық бастапқы AI болашағы бұрынғыдан да перспективалы және турбулентті болып көрінеді.
Басталу
CometAPI ендірілген API кілтін басқару, пайдалану квоталары және есеп айырысу бақылау тақталары бар тұрақты соңғы нүкте астында жүздеген AI үлгілерін біріктіретін бірыңғай REST интерфейсін қамтамасыз етеді. Бірнеше жеткізушінің URL мекенжайлары мен тіркелгі деректерін біріктірудің орнына, сіз клиентті негізгі URL мекенжайына бағыттайсыз және әрбір сұрауда мақсатты үлгіні көрсетесіз.
Әзірлеушілер DeepSeek-V3 сияқты DeepSeek API интерфейсіне қол жеткізе алады (модель атауы: deepseek-v3-250324) және Deepseek R1 (модель атауы: deepseek-r1-0528) арқылы CometAPI.Бастау үшін үлгінің мүмкіндіктерін зерттеңіз Ойын алаңы және кеңесіңіз API нұсқаулығы егжей-тегжейлі нұсқаулар үшін. Қол жеткізу алдында CometAPI жүйесіне кіріп, API кілтін алғаныңызға көз жеткізіңіз.
CometAPI-ге жаңадан келдіңіз бе? 1$ тегін сынақ нұсқасын бастаңыз және Сораны ең қиын тапсырмаларды орындаңыз.
Сіз не салғаныңызды көруді күте алмаймыз. Егер бірдеңе дұрыс болмаса, кері байланыс түймесін басыңыз — бізге не бұзылғанын айту оны жақсартудың ең жылдам жолы.
