OpenAI GPT-5.4 сериясын шығарды: GPT-5.4 нені өзгертеді

OpenAI компаниясының соңғы жаңалығы — GPT-5.4 — мақсатты “кәсіби жұмыс” модельдер отбасы ретінде ұсынылып, екі негізгі нұсқамен — GPT-5.4 Thinking және GPT-5.4 Pro — және ұзақ контексті құжат жұмысына, компьютерді native-пайдалану (агент) мүмкіндіктеріне, сондай-ақ кеңсе, құқық және қаржы жұмыс ағындарындағы нақтылық пен тапсырма орындалуын жақсартуға айрықша басымдық береді. Бұл шығарылым GPT-5 желісінің бұрынғы жаңартуларынан (әсіресе GPT-5.3 Instant және GPT-5.3-Codex) кейін келеді және ішкі және ашық бенчмарктерде өлшенетін жетілдірулерді, құралдармен тереңірек интеграцияны (Excel үшін ChatGPT плагині қоса) және кеңірек қолдау көрсетілетін контекстті (ChatGPT-та 1 миллион токенге дейін) ұсынады.

Енді CometAPI GPT-5.4 және GPT-5.4 Pro-ды қолдайды және оларды жеңілдіктермен пайдалануға мүмкіндік береді.

GPT-5.4 деген не?

Позициясы мен нұсқалары

GPT-5.4 OpenAI тарапынан кәсіби, құжатқа жүктемелі және агенттік жұмыс ағындары үшін бапталған GPT-5 сериясындағы ең қабілетті модель ретінде таныстырылады. Кемінде екі жарияланған нұсқасы бар:

GPT-5.4 Thinking — модельдің ойлау үдерісін көбірек “көрсететін”, көпқадамды пайымдау мен агенттік тапсырмаларға оңтайландырылған нұсқа (ChatGPT ішінде “Thinking” режимі ретінде қолжетімді).
GPT-5.4 Pro — жоғары өткізу қабілеті немесе кідірісі сезімтал кәсіпорын жүктемелері үшін жоғары есептеу/приоритетті инференс деңгейі, API бағасының жоғарылауымен (қосымша есептеуді көрсетеді).

OpenAI GPT-5.4-тің native компьютерді пайдалану мүмкіндіктерін атап көрсетеді — модельдерге бағдарламалық тышқан/пернетақта әрекеттері арқылы софтпен жұмыс істеуге және көп құралды тізбектерді ұйымдастыруға мүмкіндік береді — бұл нақты тапсырмаларды орындайтын агенттерді құруда сапалы секіріс ретінде ұсынылады.

Жаңа және баса айтылған мүмкіндіктер

Ұзақ контекст қолдауы: GPT-5.4 өте үлкен контексттерді қолдайды деп хабарланды (ChatGPT және Codex контексттерінде 1,000,000 токенге дейін), бұл модельге бір сессияда ауқымды жобаларды, кітаптарды, код базаларын немесе деректер жиындарын “есте сақтауға” мүмкіндік береді. Бұл құжаттарды сараптау, құқықтық келісімшарттар және көп файлды инженерлік жобалар үшін трансформациялық.
Native компьютерді пайдалану / агентинг: GPT-5.4 — OpenAI-дің native компьютерді пайдалану қабілеттері бар алғашқы жалпы мақсаттағы моделі — ол софтты басқару үшін UI әрекеттер тізбектерін және кодты жасай алады (мысалы, Playwright арқылы немесе скриншоттар бойынша хабардар болған тышқан/пернетақта командаларын беру арқылы). Бұл қабілет әзірлеушілерге веб пен десктоп қосымшаларында тапсырмаларды орындайтын агенттер құруға арналған.
Офис дағдыларын жақсарту: Электрондық кестелер, презентациялар және құжаттарға баса назар аударылады — ішкі бенчмарктер GPT-5.2-мен салыстырғанда кестелік модельдеу, презентация эстетикасы және құжат дайындау сапасында үлкен өсімді көрсетеді.
Фактіге сәйкестік және галлюцинацияны азайту: OpenAI алдыңғы модельдермен салыстырғанда фактілік қателіктердің азайғанын хабарлайды (төмендегі бенчмарктерді қараңыз).

GPT-5.2 Thinking және GPT-5.3 Codex сияқты алдыңғы модельдермен салыстырғанда, GPT-5.4 осы мүмкіндіктерді бір модельде тоғыстырады және пайдаланушының минималды араласуымен ұзаққа созылатын тапсырмалар мен күрделі жұмыс ағындарын орындауға арналған.

GPT-5.4 негізгі ерекшеліктері мен техникалық жайттары

1) Үлкен контекст терезелері (1,000,000 токенге дейін)

API арқылы 1,000,000 токенге дейінгі контекст терезелерін қолдау — бірден байқалатын мүмкіндік. Бұл бір модель сессиясының сыйымдылығын кеңейтеді: тұтас кітаптар, ұзын код базалары немесе көпқұжатты досьелерді көптеген шақыруларға бөлмей-ақ енгізуге болады. Білімге тәуелді кәсіпорын жұмыс ағындары үшін (құқықтық discovery, зерттеу синтезі, ауқымды код талдауы) миллион токендік контекстті сақтау инженерлік “жабыстыруды” азайтады және тұтастықты жақсартады.

Салдары: бұрын оркестрацияны (іздеу, бөлшектеу, сыртқы жад) талап еткен жұмыс ағындары енді бастапқы контексттің көбірегін модельдің жұмыс жадында ұстай алады — бұл құбырларды жеңілдетіп, кідіріс/тұрақтылық арасындағы айырбасты жақсартады.

2. Native компьютер және құралдарды пайдалану

OpenAI алдыңғы модельдерге қарағанда софт құралдары мен коннекторларын (мысалы, электрондық кестелер, құжат редакторлары, код орындау ортасы) сенімдірек басқару қабілетін атап өтеді. GPT-5.4 алдыңғы “құрал қолдану” жұмыстарын мына жақсартулармен кеңейтеді:

Құралды дұрыс таңдау және параметрлеу.
Сыртқы API-ларды шақыру немесе UI-секілді әрекеттерден өту кезінде реттілікті сенімді жоспарлау.
Агенттік жұмыс ағындары үшін құрал шақыру архитектурасын ақылды ету арқылы токен шығынын азайту.

Агенттік және әзірлеуші мүмкіндіктері:

Десктоп және веб автоматтандыру: Скриншоттар бойынша хабардар болған тышқан және пернетақта әрекеттерін нақты беру қолдауымен GPT-5.4 шынайы софт жұмыс ағындарын атқаратын агенттерге ендірілуде (мысалы, формаларды толтыру, дашбордтарға өту, көпқадамды рәсімдерді жүргізу). OpenAI OS-стиліндегі бенчмарктерде state-of-the-art нәтижелер туралы хабарлады.
Құралдық интерфейс және басқарылғыштық: GPT-5.4 әзірлеуші хабарламалары арқылы жақсырақ басқарылады және сыртқы құралдарды, коннекторларды және API-ларды қашан және қалай шақыру керегін жақсырақ шеше алады — бұл қажетсіз немесе қауіпті әрекеттерді минимумға түсіретін сенімді көпқұралды агенттер құру үшін маңызды.

Практикалық әсері: Автоматтандыру тапсырмалары (мысалы, “мына кестені аш, осы сводтарды есепте, слайдтарға жазбалар жаса”) аз сәтсіздік/қайта-қайта әрекет циклдарын және аз адамдық бақылауды талап етеді.

3) Бес деңгейлі пайымдау күші, экстремалды режимдер

OpenAI бірнеше пайымдау күшінің деңгейлері бар екенін көрсетеді — бұл пайдаланушыларға кідіріспен/құнымен терең ішкі ой қадағалауының (кейде бейресми түрде xhigh немесе экстремалды пайымдау) арасындағы айырбасты таңдауға мүмкіндік береді. Бұл ішкі пайымдау тереңдігі дұрыстыққа материалды әсер ететін міндеттерге арналған (күрделі дәлелдер, ұзақ код трансформациялары, көпқадамды қаржылық талдаулар). API баға белгілеу және биллинг логикасы осы режимдерде модель орындайтын қосымша жұмысты көрсетеді.

Практикалық әсері: Бұл бөліну клиенттерге бір модельден “бәрін” сұраудың орнына өз жұмыс жүктемелеріне сай айырбасты таңдауға мүмкіндік береді.

4) Өнімділік және контент жазу

Кестелік модельдеу: GPT-5.4 аудит, қаржы және аналитика жұмыс ағындарында қолданылатын кестелік тапсырмаларда айқын жақсартулар көрсетті. OpenAI GPT-5.2 үшін 68.4%-ке қарсы GPT-5.4 үшін ішкі “инвестициялық банкинг модельдеу” стиліндегі тапсырмаларда орташа 87.3% баллды хабарлайды. Бұл сандық модельдеу және формула құрастыруда тапсырма деңгейіндегі дәлдіктің айтарлықтай өсуі.
Презентациялар және визуал: Адам бағалаушылары GPT-5.2-ден алынғандарға қарағанда GPT-5.4 жасаған презентацияларды 68.0% жағдайда артық көрді, себебі эстетикасы, әртүрлілігі және сурет генерациясымен интеграциясы жақсырақ. Бұл слайдтар жасау үшін контент пен форма жақсартуларын көрсетеді.
Құжаттар дайындау және ұзақ мәтіндер: GPT-5.4 ұзын құжаттарда бірізділікті сақтауға, дәйексөз жасау тәртібін жақсартуға және үлкен контекстерді өңдеу кезінде ішкі қайшылықтарды азайтуға оңтайландырылған, бұл кеңейтілген контекст терезесі мен арнайы пайымдау баптауының арқасында мүмкін болды.

5) Қауіпсіздік, жеңілдетулер және кибер-қарастырулар

Галлюцинацияның азаюы: OpenAI пайдаланушылар фактілік қателерді белгілеген деидентификацияланған промпттар жиынтығында GPT-5.4-тің жеке тұжырымдары 33%-ға сирек жалған болатынын және толық жауаптардың 18%-ға сирек қателіктер қамтитынын GPT-5.2-мен салыстырғанда хабарлайды — бұл факті дәлдігі маңызды кәсіпорындар үшін кілтті метрика.
Киберқауіпсіздік жеңілдетулері (Thinking нұсқасы): GPT-5.4 Thinking киберқауіптерге қарсы кеңейтілген жеңілдетулер жиынтығын атап көрсетеді, бұл бұрынғы Codex/5.3 модельдері үшін қолданылған қорғауларға сүйенеді. GPT-5.4 Thinking жоғары қабілетті теріс қолдану сценарийлері үшін қосымша қоршаулармен жасалған.

Өнімділік бенчмарктері — сандар нені айтады

OpenAI және бірнеше басылым шығарылым аясында ерте бенчмарк нәтижелерін жариялады. Әртүрлі бенчмарктер әртүрлі қабілеттерді (веб-навигация, домендік білім, қауіпсіздік) тексеретіндіктен, негізгі сандарды және олардың нені білдіретінін жинақтау пайдалы.

OpenAI GPT-5.4 сериясын шығарды: GPT-5.4 нені өзгертеді

Хабарланған нәтижелер GPT-5.x-тің бұрынғы мүшелеріне қарағанда айтарлықтай жақсартуларды және басқа үздік деңгейлі модельдермен тығыз бәсекені көрсетеді.

Веб және десктоп әрекеттесу бенчмарктері

WebArena-Verified (браузерді пайдалану тесттері): DOM және скриншот сигналдарын бірге пайдаланғанда GPT-5.4 67.3% табыстылыққа жетеді, GPT-5.2 үшін 65.4% — бұл көзге көрінетін, бірақ аса үлкен емес өсім. Бұл модель тірі беттер және UI элементтерімен әрекеттесуі тиіс тапсырмаларды өлшейді.
Online-Mind2Web (скриншотқа негізделген браузер тапсырмалары): GPT-5.4 тек скриншот бақылауларын пайдаланып 92.8% табыстылыққа жетті — бұл алдыңғы агент-стильді базалармен салыстырғанда ерекше күшті жақсарту (OpenAI бұл көрсеткішті ChatGPT Atlas-тың Agent Mode көрсеткіштерімен салыстырды).
OSWorld-Verified (десктоп навигациясы): тәуелсіз хабарламалар GPT-5.4-тің десктоп ортасында навигация және тапсырмаларды орындауды бағалайтын бенчмаркта 75.0% нәтижесін көрсетті. Бұл нәтиже 5.4-ті соңына дейін автоматтандыру тапсырмалары үшін көптеген ашық базалардан жоғары қойды.

Қорытынды: 5.4 жақсартулары визуал контексті, UI affordance-тарын және ұзын әрекет тізбектерін түсіну маңызды болатын жерлерде — яғни, агенттік жұмыс ағындарында — ең айқын.

Денсаулық, қауіпсіздік және білім бенчмарктері

OpenAI-дің орналастыру қауіпсіздігі туралы есептері аралас сигналдарды көрсетеді:

HealthBench: GPT-5.4 HealthBench-те 62.6% балл жинады (GPT-5.2-нің 63.3%-інен сәл төмен), бұл OpenAI хабарлаған снапшот тесттерінде қабілет пен кейбір денсаулыққа қатысты метрикалар арасындағы нәзік айырбастарды көрсетеді.
Hard: GPT-5.4 “Hard” бағалау жиынтығында 40.1% балл алды (42.0%-ден сәл төмен).
Consensus: GPT-5.4 “Consensus”-та 96.6% көрсетті — бұл іріктелген консенсус жауаптарымен сәйкестікті көрсететін метрика (шамамен ~2.1 тармаққа өсім).

OpenAI денсаулық бағалауларында орташа жауап ұзындығы өзгергенін де атап өтті (GPT-5.4 орташа ~3,311 таңбаны, GPT-5.2 — 2,676), бұл модельдің сезімтал тақырыптарды қалай қалыптайтынына әсер етуі мүмкін.

Түсіндіру: Қауіпсіздік және денсаулық метрикалары 5.4-тің жалпы алғанда консенсусқа сәйкестікті арттырғанын және жауаптың сөзшеңдігін өзгерткенін көрсетеді, сонымен бірге кейбір тар денсаулық балдары сәл төмендеген. Бұл үлгі жиі модель мақсаттарын қайта теңгеруді көрсетеді — неғұрлым шешімді, ұзын форма жауаптары пайдалық пен консенсусты жақсартуы мүмкін, бірақ сезімтал домендерде мұқият мониторингті қажет етеді.

Доменге-арналған мысалдар мен тұжырымдар

Ерте тесттер нақты, доменге-бағытталған тұжырымдар берді (OpenAI және үшінші тарап көздері):

Құқықтық пайымдау бенчмаркі (BigLaw Bench) — ерте тесттерде GPT-5.4 заңи пайымдау қималарында ~91% көрсетті, бұл құжаттарды талдау тапсырмалары үшін күшті сигнал; мұның ерте, рецензияланбаған мәліметтер екенін ескеріңіз.
Галлюцинацияның азаюы: GPT-5.4 жауаптары белгілі бір алдыңғы базалармен салыстырғанда ~33%-ға сирек жалған тұжырымдар жасап, ~18%-ға сирек фактілік қателер қамтиды. Бұл пайыздар екінші деңгейлі есептер мен компания коммуникацияларында айтылды; кез келген мұндай тұжырым сияқты, олар бенчмарк жиынтығы мен іріктеу әдіснамасына тәуелді.

GPT-5.4-ті қалай алу және төлеу

ChatGPT деңгейлері және кәсіпорын қолжетімділігі

OpenAI және өнімдік хабарламаларға сәйкес:

ChatGPT Plus / Team / Pro пайдаланушылары өнімде GPT-5.4 Thinking-ті бірінші болып алды. Enterprise және Education админдері админ бақылаулары арқылы ерте қолжетімділікті қоса алады. Free/Go пайдаланушыларына бірден қолжетімділік кепіл етілмейді. Әзірлеушілер API арқылы gpt-5.4 және gpt-5.4-pro эндпоинттерін шақыра алады.

API бағаларының қысқаша көрінісі (жарияланған әзірлеуші бағалары)

OpenAI-дің әзірлеушілерге арналған бағалары GPT-5.4-ті токен бойынша төленетін алдыңғы қатарлы модель ретінде көрсетеді. Жарияланған беттегі үлгі бағалар шамамен мынадай:

Model	Input	Cached input	Output
gpt-5.4 (<272K context length)	$2.50	$0.25	$15.00
gpt-5.4 (>272K context length)	$5.00	$0.50	$22.50
gpt-5.4-pro (<272K context length)	$30.00		$180.00
gpt-5.4-pro (>272K context length)	$60.00		$270.00

CometAPI-де (ірі модель API-лары үшін “бір терезе” агрегация платформасы):

Model	Comet Price (USD / M Tokens)	Official Price (USD / M Tokens)	Discount
gpt-5.4	Input:$2/M; Output:$16/M	Input:$2.5/M; Output:$20/M	-20%
gpt-5.4-pro	Input:$24/MOutput:$192/M	Input:$30/MOutput:$240/M	-20%

Сондықтан, мен CometAPI-ді жоғары ұсынамын, өйткені ол API шығындарын айтарлықтай азайта алады.

Құнды басқару қарастырулары

Әсіресе ұзын құжаттармен немесе жоғары өткізу қабілетімен ауқымда модельді пайдалануды жоспарласаңыз, мыналарды ескеріңіз:

Кэштеу және қайталануды жою (мүмкін болса, кэштелген енгізу бағасын пайдалану үшін).
Промпт инженериясы контекстті ықшамдау және артық токендерді болдырмау үшін.
Батчинг стратегиялары және қымбат шығарылым генерациясын минимумға түсіретін пост-өңдеу.
Пайымдау режимін қолдануды мониторингтеу, өйткені терең пайымдау режимдері жоғары есептеу құнын талап етуі мүмкін.

Салыстыру: GPT-5.4 vs GPT-5.3

GPT-5.4 GPT-5.3-тен қайда жақсарды

Пайымдау тереңдігі және құрал оркестрациясы: 5.4 Thinking көпқадамды пайымдау мен агенттік пайдалану жағдайларында 5.3-тен асып түсуге тікелей бапталған. Бұл веб/десктоп әрекеттесу бенчмарктері мен агент табыстылық метрикаларында көрінеді.
Контекст сыйымдылығы: 5.4-тің 1M токендік ұсынысы негізгі API қолжетімділігіндегі 5.3-тен анық техникалық қадам алға, бұл бір сессияда жаңа класстағы тапсырмаларды мүмкін етеді.
Домендік өнімділіктің өсуі: OpenAI-дің ерте сандары мен үшінші тарап есептері құқық және құжат бенчмарктерінде жақсартуларды көрсетеді, мұнда 5.4-тің ұзын контексті және маманданған баптауы көмектеседі.

Айырбастар және 5.3 әлі де қайда артық болуы мүмкін

Жеңіл салмақты әңгімелесу қолдануы: GPT-5.3 Instant тез, үнемді диалог ағындарына оңтайландырылған болып қалады; қысқа чат өзара әрекеттесулері үшін ең төмен кідіріс/құн қажет ұйымдар оны қалауы мүмкін.
Қауіпсіздік метрикаларының тұрақтылығы: кейбір денсаулық және “hard” бағалау балдары OpenAI снапшоттарында 5.4-те 5.2-мен салыстырғанда сәл төмендеген; реттелетін сезімтал домендердегі кәсіпорындар толық енгізуден бұрын модельді өз бағалау жиынтықтарында валидациялауы тиіс.

Қолдану жағдайлары және индустриялық салдарлар

GPT-5.4-тің терең пайымдауы, ұзын контекст жады және құралдарды пайдалану комбинациясы бірнеше практикалық және стратегиялық мүмкіндіктер ашады.

1. Кәсіби қызметтер және консалтинг

Ұзын жеткізбелер шығаратын фирмалар (мысалы, заңи брифтер, көп тараулы консалтинг есептері, M&A diligence пакеттері) тұтас құжаттар мен деректер жиындарын контексте ұстай алады, бұл кросс-құжат синтезін үйлесімді қылып, автоматтандырылған QA және орында қолмен бөлшектеудісіз қысқаша түйіндемелерді жасауға мүмкіндік береді. APEX-Agents бойынша бенчмарк жеңістері осы позициялауға сәйкес келеді.

2. Бағдарламалық қамтамасыз етуді әзірлеу және код-база пайымдауы

Ұзын контекст бір модель шақыруына тұтас репозиторийлерді немесе логтардың ұзын трейстерін қосуға мүмкіндік береді. GPT-5.4-тің SWE бенчмарктеріндегі жақсартулары отладка, рефакторинг және код-ревью жұмыс ағындары үшін өнімділіктің артқанын көрсетеді — әсіресе үздіксіз жүктемелер үшін Pro-мен жұптастырғанда.

3. Автономды агенттер және кәсіпорын автоматтандыруы

Құралдармен (электрондық кестелер, тикетинг жүйелері, веб-интерфейстер) жұмыс істейтін агенттік жүйелер GPT-5.4-тің құрал таңдауды жақсартуы, агент жұмыс ағындары үшін токен шығынын азайтуы және ұзақ мерзімді күйді сақтауды жақсартуы есебінен ұтады. Бұл GPT-5.4-ті кәсіпорын автоматтандыру құбырлары және бірнеше жүйелерде “әрекет ететін ассистенттер” үшін тартымды етеді.

Қорытынды — GPT-5.4 не өзгертеді

GPT-5.4 — ұзын, көпқұжатты пайымдауды атқара алатын, агенттік жұмыс ағындарын сенімдірек орындайтын және Pro келісімшарттары арқылы кәсіби құбырларға масштабталатын модельдерге прагматикалық әрі қабілеттік тұрғыдан ілгері қадам. Жұмыс ағындары ұзақ көкжиекті және құралға тәуелді ұйымдар үшін GPT-5.4 әлеуетті өнімділікте сапалы секіріс.

Әзірлеушілер қазір GPT-5.4, GPT-5.4-pro және GPT 5.3 Chat-ты CometAPI арқылы пайдалана алады. Бастау үшін, модель мүмкіндіктерін Playground ішінде зерттеп көріңіз және егжей-тегжейлі нұсқаулар үшін API guide-пен танысыңыз. Қол жеткізер алдында, CometAPI-ге кіріп, API кілтін алғаныңызға көз жеткізіңіз. CometAPI интеграцияға көмектесу үшін ресми бағадан әлдеқайда төмен баға ұсынады.

Бастауға дайынсыз ба?→ Бүгін-ақ GPT-5.4-ке тіркеліңіз!

Егер қосымша кеңестер, нұсқаулықтар және AI жаңалықтарын білгіңіз келсе, бізді VK, X және Discord желілерінде қадағалаңыз!