Phi‑4 ойлау дегеніміз не және ол қалай жұмыс істейді?

Microsoft Research компаниясы Phi‑4 Reasoning нұсқасын 30 жылдың 2025 сәуірінде екі апалы-сіңлілі үлгімен – Phi‑4‑Mini‑Reasoning (≈3.8 B параметрлері) және Phi‑4‑Reasoning‑Plus (қайта ақпараты бар 14 B rc параметрі) бірге таныстырды. Жалпы мақсаттағы LLM-лерден айырмашылығы, бұл модельдер дәлелдеуге мамандандырылған: олар әрбір шешім қадамын тексеру және нақтылау үшін қосымша қорытынды есептеулерін бөледі. Тренингте жоғары сапалы веб-деректер, синтетикалық есептер жинақтары және OpenAI o3‑mini ұсынған «ойлар тізбегі» демонстрациялары қолданылды, нәтижесінде математика, ғылым, кодтау және басқа салаларда үздік үлгі пайда болды.

Phi‑4 пайымдау дегеніміз не?

Phi‑4 ойлау қалай оқытылды?

Phi‑4 пайымдау «үйретуге болатын» сұраулар мен егжей-тегжейлі дәлелдеу іздерінің мұқият таңдалған деректер жиынында негізгі Phi‑4 үлгісін бақыланатын дәл реттеу нәтижесінде пайда болды. Зерттеушілер осы іздердің көбін o3‑mini-ге күрделі мәселелерді шешуге шақыру арқылы жасады, содан кейін әртүрлілік пен педагогикалық айқындық үшін сүзгіден өтті. Бұл процесс модельге тек жауаптарды ғана емес, сонымен қатар құрылымдық есептерді шешу тәсілдерін үйренуді қамтамасыз етті. Phi‑4‑Reasoning‑Plus келесі нұсқасы дәлдікті одан әрі арттыру үшін ұзағырақ, тереңірек пайымдау тізбегін ынталандыратын нәтижеге негізделген оқытуды күшейту кезеңінен өтті.

Phi‑4 ойлауды қандай мүмкіндіктер анықтайды?

Әдептілік: Оның тренингі математикалық олимпиада есептерін, PhD деңгейіндегі ғылым сұрақтарын, кодтау тапсырмаларын, алгоритмдік басқатырғыштарды (3SAT, TSP, BA‑Calendar) және кеңістіктік пайымдауды қамтиды, бұл әртүрлі домендерде сенімді жалпылауды көрсетеді.

Егжей-тегжейлі ойлау тізбегі: Әрбір аралық қорытындыны тексеру үшін қосымша қорытынды қадамдарын арнау арқылы Phi‑4 Reasoning бұлыңғыр бір реттік жауаптардан гөрі мөлдір, сатылы шешімдерді құрастырады.

Эталондық өнімділік: Қарапайым өлшеміне қарамастан, ол DeepSeek‑R1‑Distill‑Llama‑70B сияқты әлдеқайда үлкенірек салмақты үлгілерден асып түседі және алгоритмдік негіздеу және жоспарлау тапсырмаларында толық DeepSeek‑R1 (671 B параметрлері) өнімділігіне жақындайды.

Phi‑4 Reasoning бұрынғы үлгілерден қалай ерекшеленеді?

Ол жалпы мақсаттағы Phi‑4 бойынша қандай жолмен жақсарады?

Жалпы мақсаттағы Phi‑4 кең LLM тапсырмаларына (аяқтауға, қорытындылауға, аударуға) арналған, ал Phi‑4 Reading компаниясының ойлар тізбегі деректерін бақылайтын дәл реттеуі оның қадамдық қорытындысын нақтылайды. Бұл мамандандыру бастапқы үлгінің көптеген мүмкіндіктерін сақтай отырып, көпқадамды тапсырмаларда жоғары дәлдік береді. Оған қоса, RL-кеңейтілген «Плюс» нұсқасы барынша дәлдік қажет болғанда тереңірек пайымдау үшін қорытынды жылдамдығын сатады.

Ол бәсекелестердің дәлелдеу үлгілерімен қалай салыстырылады?

DeepSeek R1 үлгілері: DeepSeek 671 B-параметрі R1 үлгісінен тазартылған тапсырмаларда Phi‑4 Reasoning‑Plus балама өнімділікке жақындайды, бұл деректерді мұқият өңдеу және оқыту шағын және үлкен LLM арасындағы алшақтықты қысқартатынын көрсетеді.

OpenAI o3‑mini: Phi‑4 Reading OmniMath (құрылымдық математикалық тест) сияқты өлшемдер бойынша o3‑mini-ге сәйкес келеді немесе одан асып түседі, o3‑mini-нің пайымдауға арналған үлкенірек параметр санына қарамастан.

Соңғы нұсқалар мен кеңейтімдер қандай?

Phi‑4‑Reasoning‑Plus: Оқытуды күшейту арқылы кеңейтілген дәлелдеу

Phi‑4‑Reasoning‑Plus пайымдау тізбегінің сапасын одан әрі оңтайландыратын нәтижеге негізделген оқытуды күшейту (RL) кезеңін енгізу арқылы Phi‑4‑Reasoning архитектурасына негізделеді. Бұл нұсқада әзірлеушілер егжей-тегжейлі және дәлірек аралық қадамдарды жасауды ынталандыру үшін нақты тапсырманың сәттілігі көрсеткіштерінен (мысалы, дәлелдеу дұрыстығы немесе шешімнің толықтығы) алынған тексерілетін марапат сигналын пайдаланып, қысқа RL жаттығу кезеңін қосады.

Нәтижесінде Phi‑4‑Reading‑Plus тек бақыланатын әріптесімен салыстырғанда стандартты дәлелдеу көрсеткіштері бойынша 2–4% өнімділік өсімін көрсетеді, әсіресе мульти-хоптық қорытындыны және ұзын тізбекті шегеруді қажет ететін тапсырмаларда. Сонымен қатар, бұл RL негізіндегі нақтылау модельге басқарылатын сынақтарда галлюцинация жылдамдығын 15%-ға дейін төмендете отырып, түсініксіз ойлау жолдарын өздігінен түзетуге мүмкіндік береді. 64,000 4 таңбалауышқа дейінгі мәтінмәндік терезелер үшін әдепкі қолдауымен Phi‑XNUMX‑Reasoning‑Plus үйлесімділікті жоғалтпай кеңейтілген мәселе сипаттамаларын біркелкі біріктіре алады. Оның жетілдірілген мүмкіндіктері оны денсаулық сақтау диагностикасы және заңды дәлелдерді модельдеу сияқты жоғары тәуекелді домендерге қолайлы етеді.

Phi‑4‑Mini‑Reasoning: ендірілген қолданбалар үшін ықшам негіздеме

Толық масштабты үлгілерді толықтыра отырып, Phi‑4‑Mini‑Reasoning шамамен 3.8 миллиард параметрі бар жеңілдетілген дәлелдеу шешімін ұсынады. Білім беру және құрылғыдағы AI қолданбалары үшін әзірленген бұл жеңіл нұсқа синтетикалық математикалық есептердің мамандандырылған корпусында оқытылды (барлығы DeepSeek R1 ойлау жүйесі жасаған миллионға жуық нақты даналар) және ықшам, жоғары сапалы бақылау тізбегінде бақыланатын дәл реттеу арқылы одан әрі нақтыланды.

Параметрлер санының азайғанына қарамастан, Phi‑4‑Mini‑Reasoning математикалық көрсеткіштер бойынша бәсекеге қабілетті дәлдікке қол жеткізіп, DeepSeek‑R1‑Distill‑Qwen‑7B сияқты басқа шағын үлгілерден Math‑3 бойынша 500 ұпайға асып түседі. Оның стандартты тұтынушы аппараттық құралында секундына 10 таңбалауышпен жұмыс істеу және 128,000 XNUMX таңбалауыш мәтінмән ұзындығын қолдау мүмкіндігі оны ресурс шектеулі орталарда ендірілген репетиторлық жүйелер мен кодтау көмекшілері үшін тамаша етеді.

Phi‑4 пікірін қай жерде қолдануға болады?

Ол білім беру құралдарын қалай жақсарта алады?

Phi‑4‑Mini‑Reasoning, DeepSeek компаниясының R1 үлгісіндегі шамамен 1 миллион синтетикалық математикалық есептер бойынша үйретілген, жеңіл құрылғыларда "енгізілген репетиторлық" үшін оңтайландырылған. Ол білім беру қолданбалары мен смарт сынып құралдарын (, ) түрлендіре отырып, студенттерге қадамдық шешімдер арқылы нұсқау бере алады, кеңестер ұсына алады және нақты уақытта әрбір қадамды тексере алады.

Қандай салалық пайдалану жағдайлары ерекшеленеді?

дәрі: Edge мүмкіндігі бар медициналық құрылғыларда Phi‑4 Reading диагностикалық деректерді талдай алады, күрделі клиникалық нұсқауларды түсіндіре алады және мөлдір дәлел іздері бар емдеу жоспарларын ұсына алады.
Ғылыми зерттеулер: Зерттеушілер химия, физика және биологиядағы гипотезаны сынау жұмыс процестерін құжаттау үшін модельдің ой нәтижелерін пайдалана алады.
бағдарламалық қамтамасыз етуді әзірлеу: Кодтау көмекшілерінде Phi‑4 Reasoning алгоритмдік қиындықтарды талдай алады, түсіндірме түсініктемелері бар код үзінділерін ұсына алады және логикалық қорытынды арқылы дұрыстығын тексере алады (, ).

Әзірлеушілер оған қай жерде қол жеткізе алады және қолдана алады?

Phi‑4 Reasoning үлгілері Azure AI Foundry, Hugging Face және GitHub Marketplace жүйесінде ашық салмақты MIT лицензиясы бойынша қол жетімді. Құжаттар мен нұсқаулықтар — мысалы, UnsLoTH AI жүйесіндегі «Phi‑4 Reasoning How‑To» — жергілікті орналастыруды, кванттау жұмыс үрдістерін және доменге қатысты тапсырмаларды дәл баптау рецептерін егжей-тегжейлі көрсетеді.

Қандай қиындықтар мен ашық сұрақтар қалады?

Дәлелдеудің беріктігін бағалау

Эталондық өнімділік Phi‑4‑Reading-тің күшті жақтарын көрсеткенімен, оның қарсыластық немесе таралудан тыс жағдайлардағы беріктігін бағалау маңызды. Шифрланған үй-жайлары, қарама-қайшы аксиомалары немесе анық емес айнымалы атаулары бар стресс-тестілеу протоколдарын қолданатын алдын ала зерттеулер модель алдамшы немесе толық емес ақпаратқа тап болған кезде қате жылдамдығының 20%-дан асатынын көрсетеді. Бұл тұжырымдар айналмалы пайымдаулар немесе концепциялардың ауытқуы сияқты сәтсіздік режимдерін қамтитын егжей-тегжейлі бағалау құрылымдарының және сенімділік ұпайлары мен шығу тізбегін көрсететін диагностикалық құралдардың қажеттілігін көрсетеді. Стандартталған, домендік-агностикалық сенімділік эталондарын құру модельдің заңгерлік кеңес беру және денсаулық сақтау саласындағы шешімдерді қолдау сияқты салалардағы қауіпсіздік үшін маңызды қолданбаларға дайындығын растау үшін өте маңызды болады.

Түзету және қауіпсіздік мәселелерін шешу

Жетілдірілген пайымдау үлгілері сезімтал домендерде шешім қабылдау процестеріне енгізілгендіктен, теңестіру және қауіпсіздік маңызды болып қала береді. Қатаң қадағаланатын нақты реттеуге және RL сыйақысын қалыптастыруға қарамастан, Phi‑4‑Reasoning-тің ақылға қонымды, бірақ дұрыс емес нәтижелерді ("галлюцинациялар" деп аталатын) генерациялау мүмкіндігі жоғары ставкалар контекстінде қауіп тудырады. Этикалық нұсқауларға қайшы келетін әлеуметтік бейтарап негіздемелер немесе ұсыныстар жағдайлары көп деңгейлі қауіпсіздік шараларының қажеттілігін көрсетеді. Саланың озық тәжірибелері күтпеген әрекеттерді болдырмау үшін жылдам мазмұн сүзгілерін, қызыл команда құру жаттығуларын және адамның циклдегі бақылауын біріктіруді жақтайды. Алтын стандартты деректер жиынына сәйкес калибрленген шынайылық ұпайлары сияқты сандық теңестіру көрсеткіштерін және пайдаланушыға ыңғайлы түзету интерфейстерін әзірлеу Phi‑4‑Реза жүргізу үлгілерінің әлеуметтік нормаларға сәйкес келуін және маңызды жұмыс үрдістеріне енетіндей ашықтықты сақтауын қамтамасыз ету үшін өте маңызды болады.

қорытынды

Phi‑4 Reading AI-дағы маңызды кезеңді білдіреді: үлкен масштабтан интеллектуалды мамандандыруға ауысу. Кішігірім, салмақты пакетте соңғы үлгідегі дәлелдемелерді жеткізе отырып, ол мөлдір, тиімді және кеңінен қол жетімді AI пайымдауларына жол ашады — бұлтта немесе шетте болсын, ең қиын мәселелерді оқыту, зерттеу және шешу әдістерін түрлендіреді.

Әзірге Phi‑4 Reasoning қолданбасын пайдаланғысы келетіндер жаңартуларды күтіп отыруымыз керек. Біз жаңартуды жалғастырамыз CometAPI және CometAPI API өзгерту журналы.