Irônico, mas óbvio: se não fossem as tarifas dos EUA, a China não estaria vencendo a batalha econômica dos tokens de IA

No mês passado, os modelos de IA chineses superaram os estadunidenses em uso no OpenRouter, uma plataforma de IA que permite detectar tendências. O que estamos vendo é que, apesar dos obstáculos que os EUA tentaram impor para evitar que a China pudesse competir nesse mercado, o gigante asiático encontrou uma tática-chave para isso: o chamado “token export”.

O governo dos EUA acabou com a era da globalização ao iniciar a guerra comercial com a China e, mais recentemente, com sua agressiva política de tarifas. Apesar do efeito claro nas exportações, o país asiático encontrou uma forma de contornar as tarifas: com IA. Seus modelos de inteligência artificial podem ser usados em todo o mundo sem serem afetados pelos embargos. Embora sejam inferiores em desempenho e qualidade, são muito mais baratos de usar, então a China está conseguindo convencer o mundo com sua velha receita: se o produto ou serviço é suficientemente bom e, além disso, é barato, vence.

Exportação de tokens

Quando usamos energia, consumimos quilowatts. Quando usamos IA, consumimos tokens de modelos de IA. E é aí que a China está ganhando com o fenômeno chamado “exportação de tokens”, porque os tokens de seus modelos de IA são extremamente competitivos e, para muitas tarefas, esses modelos são suficientemente bons.

Na plataforma OpenRouter, vemos como os modelos chineses estão sendo mais utilizados do que os dos EUA por uma razão simples: são muito mais baratos e se comportam razoavelmente bem.

MiniMax M2.5, Step 3.5 Flash e DeepSeek V3.2 superaram claramente Gemini 3 Flash Preview, Claude Sonnet 4.6 e Claude Opus 4.6 em uso nos últimos dois meses na plataforma OpenRouter, por exemplo. Desenvolvedores de todo o mundo aproveitam esses modelos e fazem isso sem que as tarifas os afetem: os tokens não pagam essas taxas que, por exemplo, se aplicam a celulares, carros e muitos outros produtos.

Enquanto um modelo premium estadunidense como Claude Opus 4.6 custa 5 dólares por milhão de tokens de entrada (Sonnet 4.6 custa 3), modelos chineses como MiniMax M2.5 custam apenas 0,25 dólar, 20 vezes menos, e Step 3.5 Flash, também muito popular, custa apenas 0,10 dólar, o que é 50 vezes menos.

Essa diferença de preço é especialmente relevante agora que os agentes de IA — e, em especial, o OpenClaw — começam a demonstrar sua capacidade. Esse tipo de sistema é capaz de completar tarefas por nós e até controlar as máquinas às quais damos acesso, mas, para isso, utiliza uma quantidade enorme de tokens. Usar os melhores modelos garante melhores resultados, mas também é muito caro — em muitas tarefas “simples”, modelos baratos como os chineses conseguem resolver perfeitamente o problema.

Nas últimas semanas, a ascensão do OpenClaw e de plataformas semelhantes provocou uma resposta curiosa por parte de empresas como Anthropic e Google. Essas companhias não gostam que os planos de assinatura de seus modelos de IA sejam usados para esse tipo de agente, pois argumentam que há abuso desses planos, e existem certas restrições para esse tipo de uso. Isso fez com que muitos usuários passassem justamente a optar por modelos de IA de empresas chinesas, que estão se posicionando como a alternativa barata e sem complicações para aproveitar esses agentes.

Por que os tokens chineses são tão baratos

Há vários fatores que favorecem esse baixo custo dos modelos de IA na China. O primeiro é a energia barata: os custos da energia industrial são cerca de 40% menores do que nos EUA. O segundo é sua arquitetura eficiente: como demonstrou a DeepSeek, é possível alcançar grandes resultados com técnicas como Mixture of Experts (MoE). Com ela, o modelo é dividido em múltiplos “especialistas” e ativa apenas os necessários de acordo com a solicitação.

Em Xataka Brasil

Já temos mais de 20 modelos avançados de IA, mas se você fizer uma pergunta, é cada vez mais provável que obtenha a mesma resposta

Curiosamente, as restrições dos EUA à exportação de chips avançados podem ter acabado sendo as grandes catalisadoras dessa situação. Ao não terem acesso aos chips mais avançados da NVIDIA, as empresas chinesas foram obrigadas a aperfeiçoar ao máximo a eficiência de seus modelos, o que fez com que agora sejam mais competitivas no mercado de inferência de IA (ou seja, o uso prático dos modelos), que é onde essa nova batalha econômica está sendo travada.

Embora, por enquanto, a “exportação de tokens” esteja sendo vantajosa para a China, o país enfrenta desafios importantes. A soberania de dados é um deles: para uma empresa ou um governo, enviar dados sensíveis para centros de dados na China é uma verdadeira linha vermelha. Além disso, há o problema da latência: a resposta dos modelos de IA chineses é afetada pelas enormes distâncias que esses pacotes de dados precisam percorrer. Resta saber se Washington acabará aplicando algum tipo de medida para também restringir o uso de modelos de IA de empresas chinesas, embora isso pareça mais complicado.

Este texto foi traduzido/adaptado do site Xataka Espanha.

Exportação de tokens

Por que os tokens chineses são tão baratos

RECEBA "", NOSSA NEWSLETTER SEMANAL