Pesquisadores do Hugging Face buscam construir uma versão 'aberta' da ferramenta de pesquisa profunda da OpenAI

Um grupo de desenvolvedores da plataforma de desenvolvimento de IA Hugging Face, incluindo Thomas Wolf, co-fundador e cientista-chefe da empresa, diz ter construído uma versão 'aberta' da ferramenta de pesquisa profunda da OpenAI.

A pesquisa profunda, que a OpenAI revelou durante um evento no domingo, rastreia a web para compilar relatórios de pesquisa sobre qualquer assunto. Embora impressionante, a pesquisa profunda está atualmente disponível apenas em visualização limitada para usuários inscritos no plano ChatGPT Pro da OpenAI, que custa $200 por mês.

O projeto da equipe do Hugging Face, que eles chamam de Open Deep Research, consiste em um modelo de IA - o OpenAI's o1 - e uma "estrutura agente" de código aberto que ajuda o modelo a planejar sua análise e guia-o a usar ferramentas como motores de busca. O o1 é um modelo proprietário (ou seja, protegido por uma API paga), mas a equipe diz que ele teve melhor desempenho do que os modelos "abertos", como o R1 da DeepSeek.

Em menos de 24 horas, os pesquisadores conseguiram utilizar o o1 para usar um navegador simples baseado em texto e um kit de ferramentas "inspetor de texto" para ler arquivos na web. O Open Deep Research pode navegar na web autonomamente, diz a equipe, rolando páginas, manipulando arquivos e até mesmo executando cálculos com dados.

No GAIA, um benchmark para assistentes de IA gerais, o Open Deep Research alcança uma pontuação de 54%. Isso é comparado com a pontuação de 67,36% da pesquisa profunda da OpenAI.

Tentei o Open Deep Research no demo público que a equipe criou - mas não consegui fazê-lo funcionar. A página estava sobrecarregada no momento da publicação; após 10 minutos, ela exibiu uma mensagem de erro.

Mas os pesquisadores dizem estar comprometidos em melhorar a experiência e disponibilizaram o código-fonte no GitHub para inspeção e feedback.

Vale ressaltar que existem várias "reproduções" da pesquisa profunda da OpenAI na web, algumas das quais dependem de modelos e ferramentas abertos. O componente crucial que eles - e o Open Deep Research - faltam é o o3, o modelo que sustenta a pesquisa profunda.

Poucos, se houver, modelos superam o o3 em benchmarks relacionados à resposta a perguntas complexas e à coleta de informações. Sem um modelo aberto que rivalize com o o3, as alternativas de pesquisa profunda podem não corresponder totalmente ao real.

O TechCrunch tem uma newsletter focada em IA! Inscreva-se aqui para recebê-la na sua caixa de entrada todas as quartas-feiras.