
Um grupo de desenvolvedores da plataforma de desenvolvimento de IA Hugging Face, incluindo Thomas Wolf, co-fundador e cientista-chefe da empresa, diz ter construído uma versão 'aberta' da ferramenta de pesquisa profunda da OpenAI.
A pesquisa profunda, que a OpenAI revelou durante um evento no domingo, rastreia a web para compilar relatórios de pesquisa sobre qualquer assunto. Embora impressionante, a pesquisa profunda está atualmente disponível apenas em visualização limitada para usuários inscritos no plano ChatGPT Pro da OpenAI, que custa $200 por mês.
O projeto da equipe do Hugging Face, que eles chamam de Open Deep Research, consiste em um modelo de IA - o OpenAI's o1 - e uma "estrutura agente" de código aberto que ajuda o modelo a planejar sua análise e guia-o a usar ferramentas como motores de busca. O o1 é um modelo proprietário (ou seja, protegido por uma API paga), mas a equipe diz que ele teve melhor desempenho do que os modelos "abertos", como o R1 da DeepSeek.
Em menos de 24 horas, os pesquisadores conseguiram utilizar o o1 para usar um navegador simples baseado em texto e um kit de ferramentas "inspetor de texto" para ler arquivos na web. O Open Deep Research pode navegar na web autonomamente, diz a equipe, rolando páginas, manipulando arquivos e até mesmo executando cálculos com dados.
No GAIA, um benchmark para assistentes de IA gerais, o Open Deep Research alcança uma pontuação de 54%. Isso é comparado com a pontuação de 67,36% da pesquisa profunda da OpenAI.
Tentei o Open Deep Research no demo público que a equipe criou - mas não consegui fazê-lo funcionar. A página estava sobrecarregada no momento da publicação; após 10 minutos, ela exibiu uma mensagem de erro.
Mas os pesquisadores dizem estar comprometidos em melhorar a experiência e disponibilizaram o código-fonte no GitHub para inspeção e feedback.
Vale ressaltar que existem várias "reproduções" da pesquisa profunda da OpenAI na web, algumas das quais dependem de modelos e ferramentas abertos. O componente crucial que eles - e o Open Deep Research - faltam é o o3, o modelo que sustenta a pesquisa profunda.
Poucos, se houver, modelos superam o o3 em benchmarks relacionados à resposta a perguntas complexas e à coleta de informações. Sem um modelo aberto que rivalize com o o3, as alternativas de pesquisa profunda podem não corresponder totalmente ao real.
O TechCrunch tem uma newsletter focada em IA! Inscreva-se aqui para recebê-la na sua caixa de entrada todas as quartas-feiras.