No mês passado, os modelos de IA chineses superaram os estadunidenses em uso no OpenRouter, uma plataforma de IA que permite detectar tendências. O que estamos vendo é que, apesar dos obstáculos que os EUA tentaram impor para evitar que a China pudesse competir nesse mercado, o gigante asiático encontrou uma tática-chave para isso: o chamado “token export”.
O governo dos EUA acabou com a era da globalização ao iniciar a guerra comercial com a China e, mais recentemente, com sua agressiva política de tarifas. Apesar do efeito claro nas exportações, o país asiático encontrou uma forma de contornar as tarifas: com IA. Seus modelos de inteligência artificial podem ser usados em todo o mundo sem serem afetados pelos embargos. Embora sejam inferiores em desempenho e qualidade, são muito mais baratos de usar, então a China está conseguindo convencer o mundo com sua velha receita: se o produto ou serviço é suficientemente bom e, além disso, é barato, vence.
Exportação de tokens
Quando usamos energia, consumimos quilowatts. Quando usamos IA, consumimos tokens de modelos de IA. E é aí que a China está ganhando com o fenômeno chamado “exportação de tokens”, porque os tokens de seus modelos de IA são extremamente competitivos e, para muitas tarefas, esses modelos são suficientemente bons.
MiniMax M2.5, Step 3.5 Flash e DeepSeek V3.2 superaram claramente Gemini 3 Flash Preview, Claude Sonnet 4.6 e Claude Opus 4.6 em uso nos últimos dois meses na plataforma OpenRouter, por exemplo. Desenvolvedores de todo o mundo aproveitam esses modelos e fazem isso sem que as tarifas os afetem: os tokens não pagam essas taxas que, por exemplo, se aplicam a celulares, carros e muitos outros produtos.
Enquanto um modelo premium estadunidense como Claude Opus 4.6 custa 5 dólares por milhão de tokens de entrada (Sonnet 4.6 custa 3), modelos chineses como MiniMax M2.5 custam apenas 0,25 dólar, 20 vezes menos, e Step 3.5 Flash, também muito popular, custa apenas 0,10 dólar, o que é 50 vezes menos.
Essa diferença de preço é especialmente relevante agora que os agentes de IA — e, em especial, o OpenClaw — começam a demonstrar sua capacidade. Esse tipo de sistema é capaz de completar tarefas por nós e até controlar as máquinas às quais damos acesso, mas, para isso, utiliza uma quantidade enorme de tokens. Usar os melhores modelos garante melhores resultados, mas também é muito caro — em muitas tarefas “simples”, modelos baratos como os chineses conseguem resolver perfeitamente o problema.
Nas últimas semanas, a ascensão do OpenClaw e de plataformas semelhantes provocou uma resposta curiosa por parte de empresas como Anthropic e Google. Essas companhias não gostam que os planos de assinatura de seus modelos de IA sejam usados para esse tipo de agente, pois argumentam que há abuso desses planos, e existem certas restrições para esse tipo de uso. Isso fez com que muitos usuários passassem justamente a optar por modelos de IA de empresas chinesas, que estão se posicionando como a alternativa barata e sem complicações para aproveitar esses agentes.
Por que os tokens chineses são tão baratos
Há vários fatores que favorecem esse baixo custo dos modelos de IA na China. O primeiro é a energia barata: os custos da energia industrial são cerca de 40% menores do que nos EUA. O segundo é sua arquitetura eficiente: como demonstrou a DeepSeek, é possível alcançar grandes resultados com técnicas como Mixture of Experts (MoE). Com ela, o modelo é dividido em múltiplos “especialistas” e ativa apenas os necessários de acordo com a solicitação.
Curiosamente, as restrições dos EUA à exportação de chips avançados podem ter acabado sendo as grandes catalisadoras dessa situação. Ao não terem acesso aos chips mais avançados da NVIDIA, as empresas chinesas foram obrigadas a aperfeiçoar ao máximo a eficiência de seus modelos, o que fez com que agora sejam mais competitivas no mercado de inferência de IA (ou seja, o uso prático dos modelos), que é onde essa nova batalha econômica está sendo travada.
Embora, por enquanto, a “exportação de tokens” esteja sendo vantajosa para a China, o país enfrenta desafios importantes. A soberania de dados é um deles: para uma empresa ou um governo, enviar dados sensíveis para centros de dados na China é uma verdadeira linha vermelha. Além disso, há o problema da latência: a resposta dos modelos de IA chineses é afetada pelas enormes distâncias que esses pacotes de dados precisam percorrer. Resta saber se Washington acabará aplicando algum tipo de medida para também restringir o uso de modelos de IA de empresas chinesas, embora isso pareça mais complicado.
Este texto foi traduzido/adaptado do site Xataka Espanha.
Ver 0 Comentários