Recentemente, grandes empresas estão passando por um momento de reflexão sobre seus investimentos em Inteligência Artificial, especialmente no que diz respeito à IA agêntica. Um relatório do Goldman Sachs indica que o uso desses agentes pode aumentar o consumo de tokens em até 24 vezes nos próximos anos, levando empresas como Uber e Microsoft a repensarem suas estratégias antes mesmo desse cenário se concretizar.

O dilema da Uber

A Uber se tornou um exemplo emblemático do desafio enfrentado pelas empresas. O CTO da companhia, Praveen Neppalli Naga, revelou que o orçamento destinado ao Claude Code, uma ferramenta de programação assistida por IA, foi esgotado em abril, muito antes do previsto para 2026. O COO Andrew Macdonald destacou que, embora o volume de código gerado tenha aumentado, a ligação entre esse aumento e as melhorias no software para os usuários é nebulosa.

Movimentos da Microsoft

A Microsoft também não está imune a essa situação. A empresa anunciou que começará a restringir o acesso de seus desenvolvedores ao Claude Code, prevendo a transição para sua própria ferramenta, o Copilot CLI, até o final de junho. Embora a justificativa seja a consolidação das equipes, essa mudança ocorre no encerramento do ano fiscal da Microsoft, levantando suspeitas sobre motivações financeiras.

Custos da IA agêntica

O problema central reside na estrutura dos agentes de IA. Ao contrário de chatbots tradicionais, que realizam interações simples, os agentes agênticos executam tarefas de forma autônoma, consumindo até mil vezes mais tokens do que interações simples. Um exemplo extremo foi compartilhado por Peter Steinberger, que mencionou que sua equipe gastou US$ 1,3 milhão em tokens em apenas um mês ao utilizar ferramentas agênticas.

Discurso corporativo vs. realidade

Apesar dos altos custos, a narrativa corporativa ainda enaltece o consumo elevado de tokens como um sinal de eficiência. O CEO da Nvidia, Jensen Huang, afirmou que ficaria preocupado se um engenheiro, com um salário de US$ 500 mil, não utilizasse pelo menos US$ 250 mil em tokens anualmente. No entanto, mesmo com porcentagens consideráveis de código gerado por IA, como 60% na Airbnb e 84% na Chime, os resultados financeiros não justificam os gastos.

Desafios futuros e reestruturações

O Goldman Sachs aponta que novos chips de inferência prometem maior eficiência, mas a adoção em larga escala pode levar tempo. Enquanto empresas como Google e Oracle mantêm o hardware atual por mais seis anos, a disparidade entre o crescimento do uso de IA e a capacidade do hardware atual de compensar esses custos permanece. Isso força as organizações a repensar suas operações e estruturas, resultando em demissões e reestruturações, como evidenciado pela Meta, que anunciou a demissão de 8 mil funcionários mesmo com lucros recordes.