
Na terça-feira, a OpenAI lançou novas ferramentas projetadas para ajudar desenvolvedores e empresas a construir agentes de IA - sistemas automatizados que podem realizar tarefas de forma independente - usando os próprios modelos e frameworks de IA da empresa.
As ferramentas fazem parte da nova API de Respostas da OpenAI, que permite às empresas desenvolver agentes de IA personalizados que podem realizar buscas na web, examinar arquivos da empresa e navegar em sites, assim como o produto Operator da OpenAI. A API de Respostas efetivamente substitui a API de Assistentes da OpenAI, que a empresa planeja encerrar na primeira metade de 2026.
O frenesi em torno dos agentes de IA cresceu dramaticamente nos últimos anos, apesar de a indústria de tecnologia ter lutado para mostrar às pessoas, ou mesmo definir, o que são realmente os 'agentes de IA'. No exemplo mais recente de hype em relação aos agentes correndo à frente da utilidade, a startup chinesa Butterfly Effect viralizou nesta semana por uma nova plataforma de agente de IA chamada Manus que os usuários rapidamente descobriram não cumprir muitas das promessas da empresa.
Em outras palavras, as apostas são altas para a OpenAI acertar com os agentes.
“É bastante fácil demonstrar seu agente”, disse Olivier Godement, chefe de produto da API da OpenAI, em entrevista ao TechCrunch. “Escalar um agente é bastante difícil, e fazer as pessoas usá-lo frequentemente é muito difícil.”
No início deste ano, a OpenAI introduziu dois agentes de IA no ChatGPT: o Operator, que navega em sites em seu nome, e o deep research, que compila relatórios de pesquisa para você. Ambas as ferramentas ofereceram uma visão do que a tecnologia de agentes pode alcançar, mas deixaram muito a desejar no departamento de 'autonomia'.
Agora, com a API de Respostas, a OpenAI quer vender acesso aos componentes que alimentam os agentes de IA, permitindo aos desenvolvedores construir suas próprias aplicações de agentes agênticos no estilo Operator e deep research. A OpenAI espera que os desenvolvedores possam criar algumas aplicações com sua tecnologia de agentes que pareçam mais autônomas do que as disponíveis hoje.
Usando a API de Respostas, os desenvolvedores podem acessar os mesmos modelos de IA (em visualização) por trás da ferramenta de busca na web ChatGPT Search da OpenAI: a busca GPT-4o e a mini busca GPT-4o. Os modelos podem navegar na web em busca de respostas para perguntas, citando fontes enquanto geram respostas.
A OpenAI alega que a busca GPT-4o e a mini busca GPT-4o são altamente precisas em termos factuais. No benchmark SimpleQA da empresa, que mede a capacidade dos modelos de responder a perguntas curtas e factuais, a busca GPT-4o pontua 90%, enquanto a mini busca GPT-4o pontua 88% (maior é melhor). Para comparação, o GPT-4.5 - modelo muito maior, lançado recentemente pela OpenAI - pontua apenas 63%.
A API de Respostas também inclui uma utilidade de busca de arquivos que pode examinar rapidamente arquivos nos bancos de dados de uma empresa para recuperar informações. (A OpenAI alega que não treinará modelos nessas arquivos.) Além disso, os desenvolvedores que utilizam a API de Respostas podem acessar o modelo de Agente que Usa Computador (CUA) da OpenAI, que alimenta o Operator. O modelo gera ações de mouse e teclado, permitindo aos desenvolvedores automatizar tarefas de uso do computador como entrada de dados e fluxos de trabalho de aplicativos.
As empresas podem opcionalmente executar o modelo CUA, que está sendo lançado em pré-visualização de pesquisa, localmente em seus próprios sistemas, afirmou a OpenAI. A versão do consumidor do CUA disponível no Operator só pode tomar ações na web.
Para ser claro, a API de Respostas não resolverá todos os problemas técnicos que afligem os agentes de IA hoje.
Embora as ferramentas de busca alimentadas por IA sejam mais precisas do que os modelos de IA tradicionais - fato que não é surpreendente, dado que podem simplesmente procurar a resposta correta -, a busca na web não resolve o problema das alucinações de IA. A busca GPT-4o ainda erra 10% das perguntas factuais. Além de sua precisão, as ferramentas de busca de IA tendem a ter dificuldade com consultas breves e de navegação (como 'placar do Lakers hoje'), e relatórios recentes sugerem que as citações do ChatGPT nem sempre são confiáveis.
Em um post de blog fornecido ao TechCrunch, a OpenAI disse que o modelo CUA “ainda não é altamente confiável para automatizar tarefas em sistemas operacionais”, e que está sujeito a cometer erros “inadvertidos”.
No entanto, a OpenAI disse que essas são iterações iniciais de suas ferramentas de agentes, e está constantemente trabalhando para melhorá-las.
Junto com a API de Respostas, a OpenAI está lançando um conjunto de ferramentas de código aberto chamado Agents SDK, que oferece aos desenvolvedores ferramentas gratuitas para integrar modelos com seus sistemas internos, implementar salvaguardas e monitorar as atividades de agentes de IA para fins de depuração e otimização. O Agents SDK é uma espécie de acompanhamento do Swarm da OpenAI, um framework para orquestração multiagente que a empresa lançou no final do ano passado.
Godement disse que espera que a OpenAI possa preencher a lacuna entre demonstrações de agentes de IA e produtos este ano, e que, em sua opinião, “os agentes são a aplicação de IA mais impactante que acontecerá.” Isso ecoa uma proclamação feita pelo CEO da OpenAI, Sam Altman, em janeiro: que 2025 é o ano em que os agentes de IA entram na força de trabalho.
Se 2025 realmente se tornar o “ano do agente de IA”, os últimos lançamentos da OpenAI mostram que a empresa deseja mudar de demonstrações de agentes chamativos para ferramentas impactantes.