17 de abril de 2025: OpenAI apresentou dois modelos inovadores de IA na quarta-feira, o o3 e o o4-mini, marcando um avanço significativo nas capacidades de raciocínio da inteligência artificial. Esses modelos são projetados para aprimorar o desempenho em tarefas complexas, integrando compreensão visual e habilidades avançadas de resolução de problemas.

o3: Avançando em direção ao raciocínio de nível humano
O modelo o3 é o sistema de raciocínio mais sofisticado da OpenAI até o momento. Ele demonstrou desempenho excepcional em vários benchmarks:
- Matemática: Obteve uma pontuação de 96.7% no exame AIME 2024, errando apenas uma questão.
- Raciocínio Científico: Obteve pontuação de 87.7% no benchmark GPQA Diamond, abordando problemas científicos de pós-graduação.
- Engenharia de Software:Atingiu uma precisão de 71.7% nos testes de codificação verificados pelo SWE-Bench.
- Inteligência geral:Superou o limite humano no benchmark ARC-AGI com uma pontuação de 87.5% em configurações de alta computação.
Essas conquistas posicionam o o3 como um passo significativo em direção à Inteligência Artificial Geral (AGI), demonstrando sua capacidade de se adaptar a novas tarefas além de padrões memorizados.
Veja também GPT-4.1: O que é e como você pode usá-lo?
o4-mini: Eficiente e Versátil
O modelo o4-mini oferece uma alternativa mais compacta e econômica, sem comprometer o desempenho. Ele se destaca em tarefas como matemática, codificação e análise visual, tornando-o adequado para uma ampla gama de aplicações.
Inovações em raciocínio visual e autonomia aprimorada de ferramentas
Tanto o o3 quanto o o4-mini introduzem a capacidade de raciocinar com entradas visuais, incluindo imagens, esboços e conteúdo de quadro branco. Essa integração permite que os modelos manipulem imagens — como zoom ou rotação — como parte de seus processos analíticos, aprimorando suas habilidades de resolução de problemas.
A OpenAI implementou um novo paradigma de treinamento chamado "alinhamento deliberativo" nesses modelos. Essa abordagem permite que a IA se envolva em raciocínio estruturado alinhado aos padrões de segurança escritos por humanos, aprimorando a adesão aos padrões de segurança e fornecendo respostas sensíveis ao contexto.
O CEO Sam Altman reconheceu a complexidade das convenções de nomenclatura do modelo da OpenAI e indicou que um sistema de nomenclatura mais intuitivo está por vir.
Veja também O GPT-4o pode gerar imagens NSFW?
Acessibilidade e desenvolvimentos futuros
Os modelos o3 e o4-mini já estão disponíveis para usuários do ChatGPT Plus, Pro e Team. O lançamento está alinhado com a recente divulgação do modelo GPT-4.1 pela OpenAI, refletindo o rápido progresso da empresa no desenvolvimento de IA.
O CEO Sam Altman reconheceu a complexidade das convenções de nomenclatura do modelo da OpenAI e indicou que um sistema de nomenclatura mais intuitivo está por vir.
Esses avanços ressaltam o comprometimento da OpenAI em expandir os limites dos recursos de IA, mantendo o foco na segurança e acessibilidade.
A OpenAI também lançou o Codex CLI, um agente de código aberto que roda localmente no terminal do usuário. O objetivo é fornecer aos usuários uma maneira simples e clara de conectar modelos de IA (incluindo o3 e o4-mini (com suporte para GPT-4.1 em breve)) a códigos e tarefas em execução em seus próprios computadores. O Codex CLI é de código aberto e você pode acessá-lo agora no GitHub.
Para obter mais informações sobre os modelos mais recentes da OpenAI e seus recursos, visite CometAPI API o3 e O4 Mini API, descreve como acessar e integrar a API o3 e a API O4 Mini por meio do CometAPI.



