A crescente adoção de ferramentas de inteligência artificial tem pressionado um recurso essencial para o setor: a capacidade computacional. Nos últimos meses, empresas do segmento passaram a enfrentar limitações na oferta de processamento, afetando produtos, usuários e a confiabilidade de serviços.
O cenário ocorre em meio à expansão acelerada de soluções baseadas em IA, especialmente as chamadas ferramentas “agentic”, capazes de executar tarefas de forma autônoma. Com mais usuários recorrendo a esses sistemas para aumentar a produtividade, a demanda por infraestrutura cresceu em ritmo superior à capacidade de oferta das empresas.
Conforme informações do olhar digital, os impactos já são sentidos por quem usa os serviços no dia a dia. A escassez de recursos computacionais já provoca efeitos diretos: empresas têm limitado o uso de seus serviços, enfrentado instabilidades e até cancelado projetos. Em alguns casos, usuários relatam dificuldade para acessar ferramentas ou atingir limites de uso mais rapidamente do que o esperado.
No centro do problema estão os chamados tokens. Segundo o engenheiro e investidor Ben Pouladian, a escassez desse recurso — que mede o consumo de processamento em tarefas de IA — se tornou central no setor, à medida que a tecnologia deixou de ser usada apenas para tarefas simples e passou a coordenar processos mais complexos.
O aperto também se traduz em custos mais altos para as empresas. O aluguel de GPUs, chips usados para treinar e operar modelos de IA, registrou alta significativa desde o segundo semestre do ano passado. Um exemplo é o custo por hora de chips da linha Blackwell, da Nvidia, que subiu de US$ 2,75 para US$ 4,08 em cerca de dois meses — uma alta de 48%. Além disso, empresas como a CoreWeave reajustaram preços em mais de 20% e passaram a exigir contratos mais longos de clientes menores.
A construção de nova infraestrutura não resolve o problema no curto prazo. O tempo necessário para construir novos data centers e garantir fornecimento de energia tem limitado a capacidade de resposta das empresas. Segundo executivos do setor, a disponibilidade de energia já está comprometida até 2026.
Entre os diretamente afetados está a Anthropic, responsável pelo Claude. A empresa registrou falhas frequentes e passou a limitar o uso de tokens em horários de pico. A medida gerou reclamações de usuários, que afirmam atingir os limites mais rapidamente. Dados indicam que a disponibilidade da API da empresa ficou em 98,95% nos últimos 90 dias — abaixo dos níveis considerados padrão em serviços críticos de internet, que costumam operar próximos de 99,99%.
A OpenAI também precisou fazer escolhas difíceis. A empresa teria interrompido o desenvolvimento do aplicativo de geração de vídeo Sora para priorizar recursos computacionais voltados a produtos corporativos e de programação. O crescimento da demanda pode ser observado no uso da sua API, que saltou de 6 bilhões para 15 bilhões de tokens por minuto entre outubro e março. A diretora financeira da OpenAI, Sarah Friar, afirmou que a empresa tem tomado decisões difíceis sobre quais projetos seguir, diante da limitação de capacidade disponível.
Paradoxalmente, o crescimento acelerado das próprias empresas agrava ainda mais o gargalo. A Anthropic, por exemplo, viu sua receita anual projetada saltar de US$ 9 bilhões no fim de 2025 para US$ 30 bilhões poucos meses depois. Esse crescimento intensifica a pressão sobre a infraestrutura, criando um cenário em que a demanda por poder computacional segue em alta, enquanto a oferta avança de forma mais lenta.