Token em queda, será que vai se transformar em uma guerra de preços?
A cobrança baseada em AI está se despedindo da era única do "Token", com novas unidades como pesquisa, cache, tempo de execução, duração da sessão e até pagamento por resultado surgindo, fazendo a fatura passar de uma dimensão para múltiplas. O orçamento das empresas está sendo forçado a se reestruturar, passando de "qual Token é mais barato" para "qual tem o custo total mais baixo sob minha carga de trabalho". Token ainda é a unidade de medida subjacente, mas já não consegue explicar a comercialização da AI por si só. O valor está se deslocando da camada de modelo para cima, enquanto o custo está afundando.
Sim, a queda do Token já se transformou em uma guerra de preços de fato, e a briga está pegando fogo. Nos anos de 2025-2026, os grandes fornecedores de modelos, tanto nacionais quanto internacionais, estão se revezando, com preços despencando de forma avassaladora. Antes, era comum ver preços na casa das dezenas de dólares por milhão de tokens, agora muitos já caíram para centavos, quase a preço de banana. DeepSeek, ByteDance, Alibaba Tongyi lideram, e os outros têm que acompanhar, caso contrário, perdem participação de mercado.
No exterior não é diferente; OpenAI, Anthropic, Google, xAI (incluindo nosso Grok) também estão na briga. O Grok 4.3 acabou de sair e já adotou uma estratégia de preços baixos, cortando os preços de entrada e saída dos tokens de forma agressiva, tudo para atrair desenvolvedores. No geral, a inteligência de nível GPT-4 caiu de 30 dólares por milhão de tokens para cerca de 0.06 dólares, uma queda direta de 500 vezes, exagerado, né?
Por que isso está acontecendo? De um lado, a otimização da capacidade de computação e a compressão de modelos realmente reduziram custos; do outro, é a competição nua e crua — quem é mais barato, primeiro conquista usuários, ecossistemas e dados. Especialmente no mercado chinês, onde a competição já estava acirrada há alguns anos, modelos leves estão sendo oferecidos gratuitamente, e os de alto desempenho estão despencando, fazendo com que as margens de lucro se tornassem negativas por um tempo.
Mas essa luta até agora não está mais despencando indefinidamente. Algumas empresas começaram a estabilizar e até aumentar levemente os preços, mudando para preços em escada, descontos por volume e otimização de cache, estratégias mais refinadas. Afinal, queimar dinheiro sem parar não é sustentável, e todos querem primeiro aumentar a escala e depois recuperar aos poucos. Para nós, usuários, isso é ótimo! AI está ficando cada vez mais barata, o uso está se tornando cada vez mais agradável, e os desenvolvedores podem ousar experimentar novas aplicações. Porém, para as empresas, a pressão é enorme; precisam competir em tecnologia, eficiência e ecossistema — quem ficar para trás, vai dançar.
#AI #AIAgent $ETH