Elon Musk's xAI lança seu mais recente modelo principal, Grok 3

\n

A empresa de IA de Elon Musk, xAI, lançou tarde da noite de segunda-feira seu mais recente modelo principal de IA, o Grok 3, e revelou novas capacidades para os aplicativos Grok iOS e web.

\n\n

O Grok, resposta da xAI a modelos como o GPT-4o da OpenAI e o Gemini do Google, pode analisar imagens e responder a perguntas, e alimenta uma série de recursos na rede social de Musk, a X. O Grok 3, que estava em desenvolvimento há vários meses, estava previsto para lançamento em 2024, mas não cumpriu esse prazo.

\n\n
\n\t
\n\t
\n
\n\n\n
\n\t
\n\t
\n
\n\n\n

O lançamento de segunda-feira é ambicioso.

\n\n

A xAI está utilizando um enorme centro de dados em Memphis contendo cerca de 200.000 GPUs para treinar o Grok 3. Em um post na X, Musk afirmou que o Grok 3 foi desenvolvido com "10x" mais poder de computação do que seu antecessor, o Grok 2, usando um conjunto de dados de treinamento expandido que inclui, aparentemente, registros de processos judiciais.

\n\n
Membros da equipe xAI, incluindo Musk (à direita), durante uma apresentação ao vivo do Grok 3.Créditos da imagem: xAI

O Grok 3 é uma família de modelos, para ser preciso. Uma versão menor do Grok 3, o Grok 3 mini, responde a perguntas mais rapidamente, ao custo de alguma precisão. Nem todos os modelos e recursos relacionados do Grok 3 estão disponíveis ainda (alguns estão em beta), mas começaram a ser lançados na segunda-feira.

\n\n

A xAI afirma que o Grok 3 supera o GPT-4o em benchmarks, incluindo AIME (que avalia o desempenho de um modelo em uma amostra de questões matemáticas) e GPQA (que avalia os modelos usando problemas de física, biologia e química de nível de PhD). Uma versão inicial do Grok 3 também teve pontuações competitivas na Chatbot Arena, um teste colaborativo que coloca diferentes modelos de IA uns contra os outros e tem usuários votando em suas respostas preferidas, de acordo com a xAI.

\n
Créditos da imagem: xAI

Dois modelos na nova família Grok 3, Grok 3 Reasoning e Grok 3 mini Reasoning, podem "pensar cuidadosamente" sobre problemas, semelhantes aos modelos de "raciocínio" como o o3-mini da OpenAI e o R1 da empresa de IA chinesa DeepSeek. Modelos de raciocínio tentam fazer fact-checking antes de fornecer resultados, o que os ajuda a evitar algumas das armadilhas que normalmente atrapalham os modelos.

\n\n

A xAI afirma que o Grok 3 Reasoning supera a melhor versão do o3-mini - o3-mini-high - em vários benchmarks populares, incluindo um benchmark de matemática mais recente chamado AIME 2025.

\n
Créditos da imagem: xAI

Esses modelos de raciocínio podem ser acessados através do aplicativo Grok. Os usuários podem pedir ao Grok 3 para “Pensar” ou, para consultas mais difíceis, usar o modo “Big Brain” para raciocínio que emprega computação adicional. A xAI descreve os modelos de raciocínio como mais adequados para perguntas de matemática, ciência e programação.

\n\n
\n\t
\n\t
\n
\n\n\n
\n\t
\n\t
\n
\n\n

Musk disse que alguns dos "pensamentos" dos modelos de raciocínio são obscurecidos no aplicativo Grok para evitar a destilação, um método usado pelos desenvolvedores de modelos de IA para extrair conhecimento de outros modelos. Recentemente, a DeepSeek foi acusada de destilar os modelos da OpenAI para criar os seus próprios.

\n\n

Os modelos de raciocínio do Grok sustentam um novo recurso no aplicativo Grok chamado DeepSearch, resposta da xAI a ferramentas de pesquisa alimentadas por IA como a pesquisa profunda da OpenAI. O DeepSearch escaneia a internet e a X para analisar informações e fornecer um resumo em resposta a uma pergunta.

\n\n

Os assinantes do plano Premium+ da X ($50 por mês) terão acesso ao Grok 3 primeiro, e outros recursos serão condicionados a um novo plano que a xAI está chamando de SuperGrok. Com preço de $30 por mês ou $300 por ano (se os vazamentos forem verdadeiros), o SuperGrok destrava consultas adicionais de raciocínio e DeepSearch, e inclui geração ilimitada de imagens.

\n
Créditos da imagem: xAI

No futuro - talvez em cerca de uma semana - o aplicativo Grok ganhará um "modo de voz", disse Musk, que dará aos modelos do Grok uma voz sintetizada. Algumas semanas depois, os modelos do Grok 3 estarão disponíveis através da API empresarial da xAI, juntamente com a capacidade DeepSearch.

\n\n

A xAI planeja abrir o código do Grok 2 nos próximos meses, disse Musk.

\n\n

“Nossa abordagem geral é que iremos abrir o código da última versão [do Grok] quando a próxima versão estiver totalmente disponível”, continuou. “Quando o Grok 3 estiver maduro e estável, o que provavelmente acontecerá dentro de alguns meses, então iremos abrir o código do Grok 2.”

\n\n

Quando Musk anunciou o Grok há cerca de dois anos, ele apresentou o modelo de IA como edgy, sem filtro e anti-“pensamento correto” - em geral, disposto a responder a questões controversas que outros sistemas de IA não responderiam. Ele cumpriu parte dessa promessa. Se mandado ser vulgar, por exemplo, o Grok e o Grok 2 estariam felizes em ajudar, proferindo linguagem colorida que provavelmente não se ouviria do ChatGPT.

\n\n

Mas os modelos do Grok antes do Grok 3 se esquivaram de assuntos políticos e não ultrapassariam certos limites. Na verdade, um estudo descobriu que o Grok pendia para a esquerda política em tópicos como direitos transgêneros, programas de diversidade e desigualdade.

\n\n
\n\t
\n\t
\n
\n\n\n
\n\t
\n\t
\n
\n\n\n

Musk culpou o comportamento nos dados de treinamento do Grok - páginas web públicas - e se comprometeu a “aproximar o Grok politicamente neutro”. Ainda não está claro se a xAI alcançou esse objetivo e quais seriam as consequências.

\n\n