OpenAI o3 және o1: Жаңа модель шынымен де жоғары ма?

2025 жылдың сәуірінде OpenAI өзінің соңғы o3 пайымдау үлгісін ұсынды, бұл оны бұрынғы o1-ге қарағанда айтарлықтай ілгерілеушілік ретінде көрсетті. o3 моделі ой қорыту, кодтау, математика және көрнекі түсінуде кеңейтілген мүмкіндіктерге ие. Бұл мақала o3 және o1 арасындағы айырмашылықтарды зерттеп, өнімділік көрсеткіштерін, қауіпсіздік мүмкіндіктерін және o3 шын мәнінде айтарлықтай жақсартуды білдіретінін бағалау үшін практикалық қолданбаларды зерттейді.

Негіздерді түсіну: o1 және o3 модельдері

o1 дегеніміз не?

2024 жылдың қыркүйегінде шығарылған o1 моделі күрделі мәселелерді шешуге AI көзқарасындағы парадигманың ауысуын көрсетті. Адамға ұқсас пайымдауға еліктеуге арналған, o1 жауап бермес бұрын көбірек «ойлауға» үйретілді, бұл ғылым, кодтау және математикадағы күрделі тапсырмаларды жоғары дәлдікпен шешуге мүмкіндік берді. Айта кетейік, o1 халықаралық математика олимпиадасының (IMO) біліктілік емтиханында әсерлі 83% дәлдікке қол жеткізді, бұл оның алдындағы GPT-13o жинаған 4% көрсеткішінен айтарлықтай секіріс.

o1 моделі сонымен қатар қауіпсіздік ережелері туралы контекстте ойлауға және оларды тиімдірек қолдануға мүмкіндік беретін жаңа қауіпсіздікті оқыту тәсілін енгізді. Бұл ілгерілеу оның күрделі джейлбрейктік сынақтардағы өнімділігінде айқын болды, мұнда GPT-1o-ның 84-мен салыстырғанда o100 4-ден 22 балл алды.

o3 дегеніміз не?

o1 негізіне сүйене отырып, OpenAI o3 моделін 2025 жылдың сәуірінде таныстырды. OpenAI-дің бүгінгі күнге дейін ең озық ой қорыту моделі ретінде танылған o3 кодтау, математика және визуалды талдауда айтарлықтай жақсартулар әкелді. Оның ерекше ерекшеліктерінің бірі суреттермен «ойлау» мүмкіндігі болды, эскиздер немесе ақ тақта сияқты визуалды кірістерді оның пайымдау процестеріне біріктіреді. цитатакезекте0жаңалық12

o3 моделі әртүрлі көрсеткіштер бойынша жоғары өнімділікті көрсетті. Ол Американдық шақыру математикалық емтиханында (AIME) 96.7% дәлдікке қол жеткізіп, o1-ден 83.3% асып түсті. Бағдарламалық жасақтама жасау тапсырмаларында o3 SWE-bench Verified эталонында 71.7% жинады, бұл o1 көрсеткішінен 48.9% айтарлықтай жақсарды.

OpenAI o3 және o1: Жаңа модель шынымен де жоғары ма?

Салыстырмалы талдау: o3 қарсы o1

Өнімділік көрсеткіштері және салыстыру

o3 және o1 мүмкіндіктерін бағалау кезінде бірнеше негізгі өнімділік көрсеткіштері o3 көмегімен жасалған жетістіктерді көрсетеді:

математика: o3 AIME бойынша 96.7% дәлдікке қол жеткізді, ал o1 бойынша 83.3%.
Бағдарламалық қамтамасыз етуді жобалау: o3 SWE-bench Verified бағдарламасында 71.7% жинады, ал o1 48.9% басқарды.
ғылым: GPQA Diamond эталонында o3 87.7% дәлдікке қол жеткізіп, Ph.D деңгейіндегі ғылым сұрақтарын шешуде өзінің шеберлігін көрсетті.
Жасанды жалпы интеллект (AGI) эталондары: o3 ARC-AGI эталонында 87.5% дәлдікке қол жеткізіп, адам деңгейіндегі өнімділіктен асып түсті және o1 көрсеткішінен 32% айтарлықтай асып түсті.

Бұл көрсеткіштер o3-тің жоғары пайымдау мүмкіндіктерін және оның o1-ге қарағанда күрделі және нюансты тапсырмаларды орындау мүмкіндігін көрсетеді.

Мультимодальдық мүмкіндіктер және визуалды пайымдау

o3 анықтаушы ерекшелігі оның жетілдірілген мультимодальды мүмкіндіктері болып табылады. Негізінен мәтіндік енгізуге бағытталған o1-ден айырмашылығы, o3 визуалды деректерді өңдей және дәлелдей алады. Бұған кескіндерді талдау, визуалды ақпаратты тиімді түсіндіру үшін қию, айналдыру және масштабтау сияқты әрекеттерді орындау кіреді.

Бұл жақсартуда GeoGuessr онлайн ойынына ұқсас фотосуреттерден орындарды анықтау сияқты практикалық қолданбалар бар. Дегенмен, бұл мүмкіндік құпиялылық мәселелерін де тудырды, өйткені ол жеке адамның жеке ақпаратын жария ету үшін пайдаланылуы мүмкін. OpenAI бұл алаңдаушылықтарды мойындады және жеке ақпаратты бөліспеу үшін модельдерді оқытуға күш салуларына баса назар аударды.

Қауіпсіздік механизмдері және этикалық ойлар

OpenAI o1 және o3 әзірлеуде қауіпсіздікке басымдық берді. o1 моделі қауіпсіздік ережелерін контекстік түрде талқылауға мүмкіндік беретін қауіпсіздікті оқытудың жаңа тәсілін енгізді, нәтижесінде қауіпсіздік нұсқауларын сақтау жақсарды.

Осыған сүйене отырып, o3 пайдаланушы сұрауларының қауіпсіздік салдарын бағалау үшін модельдің пайымдау мүмкіндіктерін пайдаланатын қауіпсіздік техникасын «әңгімелейтін теңестіруді» енгізді. Бұл тәсіл o3 жүйесіне жасырын ниеттерді немесе жүйені алдау әрекеттерін анықтауға мүмкіндік береді, оның қауіпті мазмұнды дәл қабылдамау мүмкіндігін арттырады.

o3-тегі негізгі инновациялар

Көрнекі ойлау мүмкіндіктері

o3 ерекшелігі оның кескіндерді өңдеу және пайымдау қабілеті болып табылады. Бұл мультимодальды мүмкіндік o3-ке эскиздер немесе фотосуреттер сияқты көрнекі кірістерді интерпретациялауға және оларды пайымдау процестеріне біріктіруге мүмкіндік береді. Бұл прогресс дизайн, білім беру және геолокация тапсырмалары сияқты салалардағы қолданбаларға мүмкіндік береді.

Жетілдірілген есептерді шешу әдістері

o3 «жеке ой тізбегі» механизмін қолданады, бұл оған қорытындыға келмес бұрын бірнеше дәлелдеу қадамдарын жоспарлауға және орындауға мүмкіндік береді. Бұл тәсіл адамға ұқсас ойлау процесін имитациялау арқылы оның күрделі мәселелерді шешу қабілетін арттырады.

Энергия тиімділігі және теңшеу

Жетілдірілген мүмкіндіктеріне қарамастан, o3 өнімділікті төмендетпей, есептеу шығындарын азайта отырып, энергияны үнемдейтін операциялар үшін оңтайландырылған. Оған қоса, ол ұйымдарға нақты қолданбалар үшін үлгіні дәл баптауға мүмкіндік беретін үлкен теңшеу опцияларын ұсынады.

Шектеулер мен қарастырулар

Есептеу талаптары

o3 кеңейтілген мүмкіндіктерді ұсынса да, ол o1-ге қарағанда көбірек есептеу ресурстарын қажет етеді. Бұл өскен сұраныс жауап беру уақытына және операциялық шығындарға, әсіресе ресурстары шектеулі қолданбаларға әсер етуі мүмкін.

Құпиялылық туралы алаңдаушылық

o3-тің кеңейтілген көрнекі ойлау қабілеттері құпиялылыққа қатысты мәселелерді көтерді. Мысалы, оның көрнекі мәліметтер негізінде фотосуреттің орнын анықтау мүмкіндігі ықтимал теріс пайдалану және доксингті немесе рұқсатсыз деректерді бөлісуді болдырмау үшін қауіпсіздік шараларының қажеттілігі туралы пікірталас тудырды.

Практикалық қолданбалар және қол жетімділік

1. ChatGPT бағдарламасына интеграция

o3 моделі OpenAI ChatGPT платформасының әртүрлі деңгейлеріне біріктірілген:

ChatGPT Plus және топ пайдаланушылары: o3 және оның нұсқаларына дереу қол жеткізу.
ChatGPT Pro пайдаланушылары: o3-pro қолдауына қол жеткізу алдағы апталарда күтілуде.

2. Әзірлеушіге қол жеткізу

Әзірлеушілер o3 нұсқасына OpenAI API арқылы қол жеткізе алады, бағасы бір миллион кіріс токеніне $10 және o40 моделі үшін миллион шығу токеніне $3 болып белгіленген.

3. CometAPI Access

Әзірлеушілер мен ұйымдар үшін o3 CometAPI арқылы қол жетімді o3 API.

CometAPI 500-ден астам AI үлгілеріне қол жеткізуді қамтамасыз етеді, оның ішінде ашық бастапқы және чатқа, кескіндерге, кодқа және т.б. үшін мамандандырылған мультимодальды модельдер. Оның көмегімен Claude, OpenAI, Deepseek және Gemini сияқты жетекші AI құралдарына қол жеткізу бірыңғай, біртұтас жазылым арқылы қол жетімді. Музыка мен өнер туындыларын жасау, бейнелерді жасау және өзіңіздің жұмыс үрдістеріңізді құру үшін CometAPI жүйесінде API пайдалануға болады.

o3 API (модель атауы:o3/ o3-2025-04-16) CometAPI-дегі баға, ресми бағадан 20% жеңілдік:

Енгізу токендері: $8 / M таңбалауыштары
Шығару таңбалауыштары: $32/ M токендер

Техникалық мәліметтер мен Интеграция нұсқаулығы туралы қараңыз o3 API және API құжаты.

Қорытынды: o3 o1-дің лайықты мұрагері ме?

Өнімділік көрсеткіштерін, дәлелдеу мүмкіндіктерін және қауіпсіздік тетіктеріндегі елеулі жақсартуларды ескере отырып, o3 o1-ге қарағанда айтарлықтай ілгерілеуді білдіреді. Оның көрнекі ойлау мен жақсартылған бейімделу интеграциясы оны жан-жақты және сенімді AI үлгісі ретінде орналастырады. Жетілдірілген пайымдау мүмкіндіктерін іздейтін пайдаланушылар мен әзірлеушілер үшін o3 o1 нұсқасынан тартымды жаңартуды ұсынады.