Grok 4.1 шығарылды: ол басқа үлгілерді қалай бұзады

xAI тыныш шығарылды Grok 4.1 (17-18 қараша, 2025 ж.) — бірінші кезектегі Grok 4-ке бағытталған жаңарту эмоционалды интеллект, шығармашылық өрнек және галлюцинацияның төмендеуі бұрынғы Grok шығарылымдарының өткір дәлелдерін сақтай отырып. Ол екі режимде келеді (Ойланатын / Ойланбайтын), қарашаның басында үнсіз шығарылды, LMArena-да көшбасшылар тақтасының үздік нәтижелерін көрсетеді және grok.com, Grok қолданбалары және API арқылы қол жетімді.

Grok 4.1 дегеніміз не?

Grok 4.1 - Grok 4-тің қосымша, өндіріске бағдарланған мұрагері: бірдей кең ауқымды күшейту негізінде құрылған отбасы мүшесі, бірақ стильге, тұлғаға, теңестіруге және нақты әлемде сенімділікке бағытталған жаттығулардан кейінгі ауыр оңтайландырулармен дәл бапталған және қайта жаттықтырылған. Ол алға прагматикалық, «пайдалануға болатын» қадам ретінде белгіленді: соқыр адам таңдау сынақтарында ақылдырақ, эмоционалдық тұрғыдан ақылдырақ, шығармашылық жазуда жақсырақ және бұрынғы жоғары нәтижелі LLM-ді қорлаған сенімді, бірақ қате «галлюцинацияларға» азырақ бейімділік.

Grok 4.1 келесі төрт өлшемде сапалы өзгерістерге қол жеткізеді:

Шығармашылық: Жазу, әңгімелеу және әлеуметтік контексттерде күшті тіл стилі мен қиялын көрсетеді;
Эмоционалды интеллект: тон мен эмоционалдық өзгерістерді таниды, адамға ұқсас эмоционалдық логикамен жауап береді және жұбаныш пен түсіну жауаптарын тудырады;
Тұлғаның үйлесімділігі: ұзақ сөйлесулерде тұрақты реңк пен тұлғаны сақтайды, енді бұрынғы үлгілердің сәйкес келмейтін мінез-құлқын көрсетпейді;
Ынтымақтастық: көп айналымды диалогтарда немесе тапсырмаларды бірлесіп орындауда үйлесімділік пен мақсатты түсінуді сақтайды.

xAI оның сипаттамаларын бір сөйлеммен қорытындылайды: «Ол неғұрлым байқағыш, эмпатикалық және үйлесімді адамға ұқсайды».

Grok 4.1 сорғыштың астында қалай жұмыс істейді?

Grok 4.1 Grok 4 жанұясында қолданылатын алдын ала дайындалған магистраль, сонымен қатар келесіге бағытталған жаттығудан кейінгі қабатты құбыр ретінде жақсы түсініледі. марапаттауды модельдеу, стильді теңестіру және агенттік бағалаушылар.

Жаттығу және теңестіру кезеңдері қандай?

Grok 4.1 4.1 үшін екі маңызды ауысыммен бейімделген қазіргі заманғы шекаралық LLM-ге тән көп сатылы құбырда жұмыс істейді:

Алдын ала дайындық + орта дайындық: Веб-деректер бойынша үлкен корпусты алдын ала оқыту + домен білімі мен мультимодальды мүмкіндіктерді арттыру үшін мақсатты орта оқыту.
Бақыланатын дәл реттеу (SFT): Адамның қалаған мінез-құлық көрсетулері (жауаптар, бас тарту стратегиялары).
Сыйлықты модельдеу (жаңа қолданба): xAI сыйақы үлгілерін тек адам қалаған белгілерде ғана емес, сонымен қатар қолданды шекаралық агенттік пайымдау үлгілері марапаттаушылар ретінде — мүмкіндігі жоғары, үлгіге негізделген бағалаушыларға үміткер нәтижелерін масштабта бағалауға тиімді мүмкіндік береді. Бұл тексерілмейтін атрибуттарды оңтайландыруға мүмкіндік берді стиль, тұлғаның үйлесімділігі, эмпатия және көмек көрсету мүмкін емес үлкен адам таңбалау бюджетін қажет етпестен.
Саясатты оңтайландыру (үлгі сыйақыларынан RLHF / RL): Орналастырылған саясатты (тұтынушылардың өзара әрекеттесетін үлгісі) жасау үшін үйренген сыйақы сигналдарын пайдаланып стандартты саясатты оңтайландыру.

Сыйақыны модельдеу тәсілінде қандай жаңалықтар бар?

Дәстүрлі RLHF жүйесінде сіз адамның таңдаулы белгілерін (A/B) жинайсыз, сол белгілерді болжау үшін марапат үлгісін жаттықтырасыз, содан кейін алынған сыйақыға қарсы RL (немесе бас тарту үлгісі) бар негізгі үлгіні оңтайландырасыз. Бірақ xAI екі практикалық инновациясын атап өтеді:

Агенттік сыйақы үлгілері: таза адам төрешілерінің орнына, xAI нәзік қасиеттерді (тонус, эмоционалдық нюанс, шығармашылық) бағалау үшін ұпай берушілер ретінде қабілетті «агенттік» пайымдау үлгілерін пайдаланды. Грейдерлер мыңдаған жұптық салыстыруларды жылдам орындай алады, бұл инженерлерге тезірек қайталауға мүмкіндік береді. Бұл стиль мен эмоционалды интеллектті айтарлықтай жақсарту механизмі.
Тексерілмейтін сигналдар үшін жаттығудан кейінгі теңестіру: детерминирленген метрикамен өлшей алмайтын атрибуттар үшін (мысалы, «жылу» немесе «келісілген тұлға») олар арнайы марапаттау мақсаттары мен масштабтау оқу бағдарламаларын енгізді, осылайша модель стиль негізгі фактілердің дәлдігін жоғалтпай, нәтижелер.

«Ойлау» және «ойламау» техникалық тұрғыдан қалай жұмыс істейді?

Grok 4.1 Ойлау (код атауы quasarflux) — түпкілікті жауапты шығарар алдында нақты дәлелдеу қадамдарын (ойлау белгілерін) көрсетеді; күрделі тапсырмалар үшін оңтайландырылған және LMArena ішіндегі жоғары Elo. Қосымша таңбалауыштар қорытынды шығару уақытын талап етеді, бірақ көп сатылы дәлелдеу тапсырмаларына, жөндеу және түсіндіруге көмектеседі.
Grok 4.1 Ойланбайтын (код атауы tensor) жалғыз, дереу соңғы жауап үшін айқын аралық таңбалауыштарды айналып өтеді. Бұл кідіріс пен таңбалауыш құнын азайтады, сонымен бірге бұрынғыдай нақтыланған саясат салмақтарынан пайда көреді. Ойланбайтын режим өте төмен кідіріс және әлі де жоғары қабілетті болу үшін оңтайландырылған.

Сезім мен стильді туралауды оңтайландыру

Қарапайым «шындық» сигналдарынан басқа, Grok 4.1 көңіл-күй, тон және тұлғааралық стиль үшін мақсатты теңестіруді оңтайландыруды қамтиды. Бұл жаттығу құбырында сәйкес келмейтін тонды анық жазалайтын сыйақы немесе жоғалту құрамдастары (мысалы, эмпатия қажет болғанда қажетсіз қысқарту) және қалаған стильге немесе көңіл-күй профиліне сәйкес келетін марапат жауаптарын қамтитынын білдіреді. Grok 4.1 нұсқасында AI алдымен «Тұлғаны теңестіру» оңтайландыру мақсатын енгізді.

Ол модельге сәйкестендірудің тұрақты және тұрақты сезімін сақтауға көмектесуге бағытталған. Grok 4, 4.1-пен салыстырғанда оқыту мақсаттарына келесілер қосылады:

Эмоционалды өрнек өлшемі үшін оң марапаттар (эмоционалды теңестіру сыйлығы);
Тұлғаның үйлесімділік көрсеткіші.

Grok 4.1 қалай бағаланды және ол қалай орындалды?

Соқыр адамның қалауы тесті нені көрсетті?

Тікелей көшіру кезінде Grok 4.1 уақыттың 64.78% тірі трафиктегі алдыңғы өндіріс үлгісінен артықшылыққа ие болды - бұл жабайы табиғатта сөйлесудің жақсы нәтижелерін көрсететін адамның күшті таңдау сигналы.

Grok 4.1 көшбасшылар тақтасында үздік бола ма?

xAI Grok 4.1 деп хабарлайды Ойлау режимінде отырады LMArena мәтіндік аренасында №1, деп хабарлады Elo 1483, және оның дәлелді емес (жылдам) режимі 1465 Elo арқылы №2 орында — дәлдік пен көрсетілім үшін күшті жалпыға ортақ көшбасшылар тақтасының орналасуы (стильді басқару рөл атқарады).

Grok 4.1 шығарылды: ол басқа үлгілерді қалай бұзады

Қорытынды: Grok 4.1 мәтінді түсіну, жасау және жалпы сапа бойынша GPT-4.5 және Claude серияларының негізгі үлгілерінен асып түседі, GPT-5 Advanced Preview нұсқасынан кейін екінші орында.

Эмоциялық интеллект

xAI 45 күрделі рөлдік ойын сценарийін қамтитын эмоционалдық интеллектке арналған мамандандырылған EQ-Bench3 тестін жүргізді және Grok 4.1 эмпатия, жылдамдық және адамдар арасындағы түсінікте күшті жетістіктер көрсететінін хабарлайды. Grok 4.1 қайғылы, эмпатия және жайлылық контексттерін түсінуде ең жоғары ұпайға ие болды.

Grok 4.1 шығарылды: ол басқа үлгілерді қалай бұзады

Шығармашылық жазу — бұл шын мәнінде қиялшылырақ па?

Grok 4.1 бағаланды Шығармашылық жазу v3 (32 итерация айдары + Эло ұпайлары бар 3 сұрау). xAI 4.1 нұсқасының жазу стилі, дауыс үйлесімділігі және баяндау шығармашылығы айтарлықтай көтеріліп, оны шығармашылық тапсырмаларға арналған соңғы көшбасшылар тақтасының жоғарғы жағына орналастырды (мысал нұсқаулығы шығарылымда қамтылған) дейді. Тәуелсіз есеп беру осы нәтижелерді көрсетті: шолушылар «ерекше дауысты» және жақсырақ ұзақ формадағы үйлесімділікті көрді. Жазу сапасы бойынша Grok 4.1 GPT-5 сериялы үлгілерінен кейін екінші орында және Клод, Егіздер және Кими өнімдерінің барлық желілерінен асып түседі.

Grok 4.1 шығарылды: ол басқа үлгілерді қалай бұзады

Галлюцинацияның төмендеуі/адалдық

xAI галлюцинация деңгейінің айтарлықтай төмендегенін мәлімдейді: олар хабарлағандай (хабарландыруда және әлеуметтік хабарламаларда) Grok 4.1 ~Галлюцинация ықтималдығы 3 есе аз бұрынғы Grok үлгілерімен салыстырғанда, өндірістік трафик талдауларына және FActScore стиліндегі бағалауларға сілтеме жасай отырып (мысалы, био/өмірбаян сұрақтары жинағы, төменірек болса жақсы). Әсіресе, сыртқы іздеу құралдары бар «дәлелдемейтін режимде» фактілердің бірізділігі тұрақты болады.

Grok 4.1 шығарылды: ол басқа үлгілерді қалай бұзады

Неліктен Grok 4.1 басқа модельдерді «ұнайды» - бұл гипербола ма?

«Crushes» маркетингтік сипатта, бірақ шағымның артында объективті талаптар бар:

Көшбасшылар тақтасы: Grok 4.1 мәтінді құруға арналған (Ойлау режиміне арналған 1483 Elo) және xAI шығарылымындағы күшті креативті және EQ-стендтік көрсетілімдерге арналған жалпыға қолжетімді LMArena көшбасшылар тақтасында жоғары орындарға ие. Бұл қоғамда қолданылатын алмадан алмаға бәсекелестік көрсеткіштері.
Нақты трафик артықшылығы жеңеді: xAI тікелей трафиктегі дыбыссыз шығару арқылы соқыр салыстыруларда (алдыңғы өндіріс үлгісіне қарағанда ~ 65% артықшылық) адам қалауы жеңетінін хабарлайды. Бұл қағаз бенчмаркаларды ғана емес, нақты пайдаланушы жақсартуларын көрсетеді.
Іс жүзінде жаңа мүмкіндік: Модель-грейдерлердің, тексерілмейтін сигналдардағы RL және қатаңырақ енгізу сүзгілерінің комбинациясы бәсекелестер тарихи түрде төмен орындалатын әңгімелесу, эмпатикалық және шығармашылық тапсырмалардағы пайдаланушы тәжірибесін тікелей жақсартатын прагматикалық инженерлік қадам болып табылады.

Сонымен, «жұқтыру» «көптеген қоғамдық және ішкі бағалауларда көшбасшы» деп айтудың түрлі-түсті тәсілі болғанымен, xAI негізгі қоғамдық метрикалары бұл қорытындыны жариялады.

Grok 4.1 жүйесіне қалай қол жеткізуге болады

Тұтынушыға/қолданбаға қол жеткізу

xAI мезгіл-мезгіл Grok 4.1 нұсқасын «Авто» режимінде тегін немесе жарнамалық терезе ретінде қолжетімді етті, бірақ жоғары квоталары бар премиум деңгейлер (SuperGrok, SuperGrok Heavy) және API қолжетімділігі бар және ақылы ұсыныстар ретінде сақталады.

Grok 4.1 барлық пайдаланушыларға қолжетімді on grok.com, X (бұрынғы Twitter), және iOS және Android Grok қолданбалары автоматты режимде бірден шығады, сонымен қатар үлгі таңдау құралында "Grok 4.1" ретінде анық түрде таңдалады.

API қолжетімділігі және әзірлеуші жоспарлары

Grok 4.1 соңғы нүктелері xAI API арқылы қол жетімді. Осы мақаланың жарияланған күнінен бастап ресми GPT 4.1 API шығарылған жоқ.

CometAPI соңғы үлгінің динамикасын қадағалауға уәде береді, соның ішінде Grok 4.1 API, ол ресми шығарылыммен бір уақытта шығарылады. Оны асыға күтіңіз және CometAPI-ге назар аударыңыз. Күту кезінде сіз Grok-тің басқа үлгілеріне назар аудара аласыз, мысалы Grok-code-fast-1 және Grok 4, Playground қолданбасында олардың мүмкіндіктерін зерттеңіз және қоңырау шалу туралы егжей-тегжейлі нұсқауларды алу үшін API нұсқаулығын қараңыз. Қол жеткізу алдында CometAPI жүйесіне кіріп, API кілтін алғаныңызға көз жеткізіңіз.

Grok 4.1-ді өндірісте қолдану бойынша практикалық кеңестер

Галлюцинация қаупін қалай азайтуға болады

Тікелей іздеуді қосыңыз немесе ақпарат іздеу сұраулары үшін тексерілген құралдар тізбегі.
Тексеру қадамдарын көрсетіңіз: модельден дереккөздер мен дәлелдемелерді қайтаруды сұраңыз; пайдаланыңыз response сілтемелерді тексеруге арналған метадеректер (бар болса).
Детерминирленген тексерулерді орындаңыз (факт-тексеру LLMs, құрылымдық деректер валидаторлары) жоғары үлесті нәтижелерді өңдеуден кейінгі қадам ретінде.

Тон мен стильді қалай басқаруға болады

Дауысты түзету үшін нақты жүйелік нұсқауларды пайдаланыңыз («Сіз формальды және жанашырсыз.»).
Қолданбалардағы тұрақты дауыс үшін бақыланатын шақыруларды және шағын жергілікті үлгілерді пайдаланыңыз.
Қолжетімді болса, xAI стилін басқару опциясын және сыйақыға негізделген руль тұтқаларын пайдаланыңыз.

Соңғы шешім: Grok 4.1 теңіздегі өзгеріс пе?

Грок 4.1 емес жаңа сәулет; керісінше, бұл күрделі және ойластырылған жаттығудан кейінгі / теңестіру чатта адамдар нені қызықтыратынына назар аударатын шығарылым: тұлғалық, эмоционалдық интеллект, шығармашылық және фактілік қателер азырақ. Көшбасшылар тақтасындағы өлшенетін табыстар, ауқымды нақты трафик теңшелімдері және жақсартылған қауіпсіздік құралдары. Жоғары сапалы әңгімеге, шығармашылық ынтымақтастыққа немесе дыбыстық көмекке сүйенетін қолданбалар үшін Grok 4.1 алға басты қадам болып табылады және бірнеше қауымдастық стандарттарында шығарылған кездегі ең жақсы орындаушы болып табылады.

CometAPI – әзірлеушілерге біртұтас, бірізді интерфейс арқылы бірнеше жеткізушілердің (мәтіндік LLM, кескін/бейне генераторлары, ендірулер және т.б.) жүздеген AI үлгілеріне бірыңғай, OpenAI стиліндегі REST қатынасын беретін коммерциялық API-агрегация платформасы. OpenAI, Anthropic, Google, Meta немесе кішірек мамандандырылған үлгі провайдерлері үшін бөлек SDK немесе арнайы соңғы нүктелерді жалғаудың орнына, CometAPI үлгі жолдары мен бірнеше параметрлерді өзгерту арқылы әртүрлі үлгілерді шақыруға мүмкіндік береді.

Байқауға дайынсыз ба?→ CometAPI-ге бүгін тіркеліңіз !

Егер сіз AI туралы көбірек кеңестер, нұсқаулықтар және жаңалықтар білгіңіз келсе, бізге жазылыңыз VK, X және Арасындағы айырмашылық!

Grok 4.1 дегеніміз не?