Este artigo foi organizado a partir do pequeno programa WeChat: Nuvem de Criptografia
No verão de 1858, um cabo de cobre atravessou o fundo do Oceano Atlântico, conectando Londres e Nova York.
O significado desta questão nunca esteve na velocidade de transmissão, mas na estrutura de poder; quem colocou os cabos submarinos pode extrair riqueza do fluxo de informações. O Império Britânico, com esta rede global de telégrafos, controlava as informações das colônias, os preços do algodão e as notícias de guerras.
O poder do império não está apenas na frota, mas também naquele cabo.
Mais de cento e sessenta anos depois, essa lógica está se reproduzindo de uma maneira inesperada.
Em 2026, os grandes modelos da China estão silenciosamente dominando o mercado global de desenvolvedores. Os dados mais recentes da OpenRouter mostram que, entre os dez principais modelos da plataforma, os modelos chineses consomem 61% dos Tokens, com os três primeiros sendo todos da China. As solicitações de API dos desenvolvedores de São Francisco, Berlim e Cingapura estão atravessando o cabo submarino do Pacífico para chegar aos centros de dados da China, onde a capacidade computacional é consumida, a eletricidade flui e os resultados são enviados de volta.
A eletricidade nunca deixou a rede elétrica da China, mas seu valor foi entregue transfronteiriço através de Tokens.
A grande migração dos modelos de IA
Em 24 de fevereiro de 2026, a OpenRouter lançou um relatório semanal: o consumo total de Tokens dos dez principais modelos da plataforma é de cerca de 8,7 trilhões, e os modelos chineses consomem 5,3 trilhões, correspondendo a 61%. O MiniMax M2.5 aterrissou em primeiro lugar com 2,45 trilhões de Tokens, seguido de perto pelo Kimi K2.5 e o Zhiyu GLM-5, todos os três primeiros modelos são da China.

Dados mais recentes de 26 de fevereiro
Isso não é por acaso, um estopim acendeu tudo.
No início deste ano, o OpenClaw surgiu, uma ferramenta de código aberto que realmente começou a fazer a IA 'trabalhar', podendo controlar computadores, executar comandos e concluir fluxos de trabalho complexos em paralelo, e em poucas semanas, o número de estrelas no GitHub ultrapassou 210 mil.
O profissional financeiro John instalou o OpenClaw imediatamente e conectou-se à API da Anthropic, começando a monitorar automaticamente as informações do mercado de ações e a relatar sinais de negociação em tempo hábil. Algumas horas depois, ele olhou para o saldo da conta e ficou atordoado por alguns segundos: dezenas de dólares, desapareceram.
Essa é a nova realidade trazida pelo OpenClaw. No passado, conversar com a IA consumia apenas alguns milhares de Tokens, com custos insignificantes. Após a integração do OpenClaw, a IA roda simultaneamente várias tarefas secundárias nos bastidores, chamando contextos repetidamente e iterando em ciclos, o consumo de Tokens não é linear, mas exponencial. A conta se acelera como um carro com o capô aberto, e o indicador de combustível desce, sem parar.
Uma 'dica' começou a circular na comunidade de desenvolvedores: usar um token OAuth para conectar contas de assinatura da Anthropic ou Google diretamente ao OpenClaw, transformando a cota 'ilimitada' de pagamento mensal em combustível gratuito para o Agente de IA, esta é a abordagem adotada por muitos desenvolvedores.
A resposta oficial chegou imediatamente.
A Anthropic atualizou seu protocolo em 19 de fevereiro, proibindo explicitamente o uso do certificado de assinatura do Claude em ferramentas de terceiros como o OpenClaw. Para acessar as funcionalidades do Claude, é necessário utilizar o canal de cobrança da API. O Google também bloqueou em larga escala as contas de assinatura que acessavam Antigravity e Gemini AI Ultra através do OpenClaw.
‘O mundo sofre com Qin há muito tempo’, Jhon imediatamente se dedicou aos grandes modelos domésticos.
No OpenRouter, o grande modelo nacional MiniMax M2.5 teve uma pontuação de 80,2% em tarefas de engenharia de software, enquanto o Claude Opus 4.6 teve 80,8%, a diferença é praticamente insignificante. Mas os preços são drasticamente diferentes, o primeiro cobra 0,3 dólares por milhão de Tokens na entrada, enquanto o segundo cobra 5 dólares, uma diferença de cerca de 17 vezes.
John fez a transição, o fluxo de trabalho ainda estava em andamento, a conta foi reduzida em uma ordem de magnitude, essa migração está ocorrendo em escala global.
Chris Clark, COO da OpenRouter, disse diretamente que os modelos de código aberto da China conseguiram conquistar uma grande parte do mercado porque eles têm uma participação excepcionalmente alta nos fluxos de trabalho de agentes executados por desenvolvedores americanos.
A eletricidade em alta mar
Para entender a essência da saída de Tokens, é necessário primeiro esclarecer a estrutura de custos de um Token.
Parece leve, um Token equivale a cerca de 0,75 palavras em inglês. Uma conversa normal com a IA consome apenas alguns milhares de Tokens. Mas quando esses Tokens são empilhados em trilhões, a realidade física por trás disso se torna pesada.
Desmontando o custo de um Token, o núcleo tem apenas duas partes: capacidade computacional e eletricidade.
A capacidade computacional é a depreciação do GPU. Se você comprar uma Nvidia H100, gastando cerca de trinta mil dólares, sua vida útil convertida em cada inferência é o custo de depreciação. A eletricidade é o combustível que mantém o data center em operação contínua, cada GPU consome cerca de 700 watts quando totalmente carregada, e somando os custos do sistema de resfriamento, a conta de eletricidade de um grande data center de IA pode facilmente superar centenas de milhões de dólares por ano.
Agora, desenhe esse processo físico no mapa.
Um desenvolvedor americano em São Francisco faz uma solicitação de API. Os dados partem da Califórnia, atravessando o cabo submarino do Pacífico até um centro de dados em algum lugar da China, onde um cluster de GPUs começa a trabalhar, a eletricidade flui da rede elétrica da China para os chips, a inferência é concluída e os resultados são enviados de volta. Todo o processo pode levar apenas um ou dois segundos.
A eletricidade nunca deixou a rede elétrica da China, mas o valor da eletricidade, através de Tokens, completou a entrega transfronteiriça.
Aqui há uma maravilha que o comércio comum não pode alcançar: os Tokens não têm forma, não precisam passar pela alfândega, não são atingidos por tarifas, e nem estão em qualquer estatística comercial vigente. A China exportou uma grande quantidade de capacidade computacional e serviços elétricos, mas nos dados de comércio de bens oficiais, eles são quase invisíveis.
Os Tokens se tornaram um derivado da eletricidade, a saída de Tokens é, em essência, a saída de eletricidade.
Isso se deve também ao preço relativamente baixo da eletricidade na China, que é cerca de 40% menor do que nos Estados Unidos. Esta é uma diferença de custo em nível físico que os concorrentes podem facilmente replicar.
Além disso, os grandes modelos de IA da China também têm vantagens em algoritmos e 'involução'.
A arquitetura MoE do DeepSeek V3 ativa apenas alguns parâmetros durante a inferência, testes independentes mostram que seu custo de inferência é cerca de 36 vezes menor que o do GPT-4o, o MiniMax M2.5 também tem 229B de parâmetros totais, ativando apenas 10B.
O nível mais alto é a involução, Alibaba, ByteDance, Baidu, Tencent, Dark Side of the Moon, Zhiyu, MiniMax... mais de dez empresas competindo na mesma pista, os preços já caíram abaixo da faixa de lucro razoável, operar com prejuízo e ganhar gritos já se tornou a norma da indústria.
Ao olhar de perto, isso é semelhante à saída da manufatura chinesa, utilizando vantagens da cadeia de suprimentos e involução da indústria para derrubar brutalmente os preços dos Tokens.
De Bitcoin a Tokens
Antes dos Tokens, houve uma saída de eletricidade.
Por volta de 2015, os gerentes das usinas em Sichuan, Yunnan e Xinjiang começaram a receber um grupo de visitantes estranhos.
Essas pessoas alugaram fábricas abandonadas e instalaram máquinas em profusão, funcionando 24 horas por dia. As máquinas não produzem nada, apenas resolvem continuamente um problema matemático, e ocasionalmente, podem calcular um Bitcoin a partir desse interminável problema matemático.
Esta é a primeira forma da saída de eletricidade: converter eletricidade hidrelétrica e eólica barata em ativos digitais de circulação global através do hash de máquinas de mineração, e depois realizar a conversão em dólares nas exchanges.
A eletricidade não atravessou nenhuma fronteira, mas o valor da eletricidade, transportado pelo Bitcoin, flui para o mercado global.
Naqueles anos, a capacidade computacional da China chegou a representar mais de 70% da capacidade de mineração de Bitcoin global. A eletricidade hidrelétrica e a eletricidade a carvão da China, de maneira indireta, participaram de uma redistribuição global de capital.
Em 2021, tudo isso parou abruptamente. A regulamentação severa entrou em vigor, os mineradores se dispersaram, e a capacidade computacional migrou para o Cazaquistão, Texas nos EUA e Canadá.
Mas essa lógica nunca desapareceu, apenas estava esperando uma nova casca, até que o ChatGPT apareceu, com os grandes modelos competindo entre si, as antigas minas de Bitcoin se transformaram em centros de dados de IA, as máquinas de mineração se tornaram GPUs, e os Bitcoins antes produzidos se tornaram Tokens, com a única constante sendo a eletricidade.
A saída de Bitcoin e a saída de Tokens são logicamente isomórficas, mas os Tokens têm mais valor comercial atualmente.
A mineração de máquinas é um cálculo puramente matemático, e o Bitcoin produzido é um ativo financeiro, cujo valor provém da escassez e do consenso do mercado, sem relação com o que foi ‘calculado’. A capacidade computacional em si não é produtiva, mais parece um subproduto de um mecanismo de confiança.
A inferência de grandes modelos é diferente. As GPUs consomem eletricidade e produzem serviços cognitivos reais, código, análises, traduções, criatividade. O valor dos Tokens vem diretamente da utilidade que eles oferecem aos usuários. É uma incorporação mais profunda; uma vez que o fluxo de trabalho de um desenvolvedor depende de um certo modelo, o custo de mudar se acumulará com o tempo.
Claro, há uma diferença crucial: a mineração de Bitcoin foi expulsa pela China, enquanto a saída de Tokens é uma escolha ativa dos desenvolvedores globais.
Guerra dos Tokens
O cabo submarino instalado em 1858 representa a soberania do Império Britânico sobre a rodovia da informação. Quem possui a infraestrutura, define as regras do jogo.
A saída de Tokens também é uma guerra sem declaração de guerra, cheia de obstáculos.
A soberania de dados é a primeira barreira, uma solicitação API de um desenvolvedor americano é processada por um data center na China, e os dados fisicamente percorrem a China. Para desenvolvedores individuais e pequenas aplicações, isso não é um problema, mas em cenários que envolvem dados sensíveis de empresas, informações financeiras ou conformidade governamental, isso é uma falha crítica. Esta é também a razão pela qual a taxa de penetração dos modelos chineses é mais alta em ferramentas de desenvolvimento e aplicações pessoais, mas quase não tem presença nos sistemas centrais das empresas.
A proibição de chips é a segunda barreira, o desenvolvimento da IA na China enfrenta restrições de exportação de GPUs de alto desempenho da Nvidia, a arquitetura MoE e a otimização de algoritmos só podem compensar parcialmente essa desvantagem, o teto ainda existe.
Mas a resistência à frente é apenas o prólogo, um campo de batalha maior está se formando.
Os Tokens e os modelos de IA tornaram-se uma nova dimensão da batalha estratégica entre a China e os EUA, comparável aos semicondutores e à internet do século 20, e ainda mais próximo de uma metáfora mais antiga: a corrida espacial.
Em 1957, a União Soviética lançou o Sputnik 1, chocando os Estados Unidos, que imediatamente iniciaram o programa Apollo, investindo o equivalente a milhares de bilhões de dólares hoje, para não falhar na corrida espacial.
A lógica da competição pela IA é surpreendentemente semelhante, mas a intensidade será muito maior do que a corrida espacial. O espaço é, afinal, um espaço físico, que as pessoas comuns não percebem, a IA infiltra-se nas capilares da economia, cada linha de código, cada contrato, cada sistema de decisão governamental pode estar rodando um grande modelo de um país. Quem quer que o modelo se torne a opção padrão de infraestrutura para desenvolvedores globais, terá, de maneira invisível, uma influência estrutural sobre a economia digital global.
Este é exatamente o ponto que faz com que a saída de Tokens da China deixe Washington verdadeiramente inquieto.
Quando o repositório de código de um desenvolvedor, o fluxo de trabalho do agente e a lógica do produto são construídos em torno da API de um modelo chinês, o custo de migração aumentará exponencialmente com o tempo. Nesse momento, mesmo que a legislação americana imponha restrições, os desenvolvedores resistirão, assim como hoje nenhum programador consegue abrir mão do GitHub.
A saída de Tokens de hoje pode ser apenas o início de um longo jogo. Os grandes modelos da China não afirmam que vão derrubar nada, eles apenas oferecem serviços a um preço muito mais baixo a cada desenvolvedor que possui uma chave API.
Desta vez, quem instalou os cabos foram as equipes de engenheiros que escrevem código em Hangzhou, Pequim e Xangai, e os clusters de GPUs que operam dia e noite em alguma província do sul.
Essa disputa não tem contagem regressiva, está acontecendo 24 horas por dia, todos os dias, em unidades de Tokens, e o campo de batalha é o terminal de cada desenvolvedor.#加密市场反弹 $BTC