Anthropic Fable 5: desempenho e a corrida dos IPOs de IA

A Anthropic lançou essa semana o Claude Fable 5, um evento que, antes de mergulhar nos números de desempenho, exige que se entenda toda a intrincada “novela” por trás. É uma história digna de roteiro, recheada de modelos “perigosos demais”, consórcios fechados de gigantes da tecnologia, a perspectiva de IPOs iminentes e estratégias de marketing bastante agressivas.

No centro dessa trama está um cenário de pressão crescente para as empresas que desenvolvem modelos de fronteira. Elas se veem espremidas por duas frentes: a incessante competição para criar o próximo modelo que supere o anterior, e uma demanda explosiva por inferência.

A panela de pressão da inferência

A curva de uso de computação por IA inverteu de forma notável. Segundo a Deloitte, em 2023, a inferência representava cerca de um terço de todo o processamento de IA. Esse número saltou para metade em 2025 e já deve atingir dois terços em 2026, com projeções que indicam perto de 70% até 2030. Há apenas dois anos, a maior parte dos data centers era dedicada ao treinamento de novos modelos, mas hoje a prioridade é atender à interação diária de usuários com chatbots e agentes de codificação.

Para complicar, o retorno do investimento em treinamento está diminuindo. Dobrar parâmetros e o poder computacional de treinamento agora resulta em uma melhora percebida de apenas 10% a 20%. O custo para alcançar um salto de magnitude tornou-se proibitivo, especialmente em um momento de escassez de capacidade de processamento.

A infraestrutura é um ponto crítico. Empresas como Alphabet, Amazon, Meta e Microsoft devem investir mais de US$ 650 bilhões em 2026 para expandir suas capacidades de IA. Embora o capital exista, a materialização desses projetos é lenta. Quase metade dos data centers planejados nos EUA para 2026 foi adiada ou cancelada — cerca de 7 GW dos 12 GW anunciados. O gargalo não está mais nos chips, mas em componentes elétricos como transformadores, painéis de distribuição e baterias, muitos deles dependentes da China. O prazo de entrega para um transformador de subestação, por exemplo, já ultrapassa 160 semanas. Isso significa uma fila de três anos por uma única peça, indicando que a construção de novos data centers não deve acelerar tão cedo.

A conclusão lógica desse cenário é clara: se não é viável treinar um modelo “monstro” a cada ciclo, a alternativa é otimizar o que já existe. É exatamente isso que OpenAI e Anthropic vêm fazendo. O GPT 5, por exemplo, recebeu atualizações contínuas (5.1, 5.2, 5.3, 5.4, 5.5), e o Opus evoluiu do 4.5 para 4.6, 4.7, 4.8. Cada nova versão apresenta resultados mistos, por vezes melhores, por vezes piores, pois o foco principal é servir mais usuários com o mesmo hardware. A “inteligência” em si acaba ficando em segundo plano. As empresas ajustam a profundidade do raciocínio, o armazenamento em cache e os prompts de sistema. São caixas-pretas, e só podemos especular sobre as mudanças. Como documentado na Parte 3 do benchmark, o Opus 4.7, apesar de objetivamente melhor em código que o 4.6, gerou reclamações da comunidade por seu comportamento mais “econômico” em tokens, um efeito direto da otimização de recursos.

A febre dos IPOs

A tudo isso se soma o fator financeiro. A Anthropic protocolou o S-1 confidencial na SEC em 1º de junho, após uma rodada Series H de US$ 65 bilhões que avaliou a empresa em aproximadamente US$ 965 bilhões. Uma semana depois, em 8 de junho, a OpenAI também protocolou seu próprio pedido confidencial. As datas oficiais para esses IPOs ainda não foram definidas; o processo confidencial significa que o cronograma dependerá da revisão da SEC e do humor do mercado financeiro.