DeepSeek e o Futuro dos Modelos de Raciocínio de IA

A inteligência artificial (IA) está passando por uma transformação fundamental. Se antes o foco era o desenvolvimento de grandes modelos de linguagem (LLMs) baseados no reconhecimento de padrões, agora um novo paradigma começa a emergir: os modelos de raciocínio. No centro dessa mudança está a DeepSeek, uma startup chinesa que recentemente ganhou destaque global com o lançamento do RU, um modelo de IA que promete ir além da repetição de padrões e realmente pensar passo a passo para resolver problemas. Esse avanço não apenas redefine as capacidades da IA, mas também altera significativamente a economia da computação, gerando impactos no setor de semicondutores, na geopolítica da tecnologia e no equilíbrio entre modelos abertos e fechados. Diante desse cenário, a grande questão não é apenas se a DeepSeek representa uma ameaça para gigantes como OpenAI, Google e Anthropic, mas como essa inovação muda a maneira como usamos e acessamos IA no dia a dia.

Por Itaú BBA

05 minutos de leitura

A DeepSeek é uma startup chinesa especializada no desenvolvimento de modelos de linguagem abertos. Criada em 2023 como um spin-off do fundo quantitativo High-Flyer Quant, a empresa vem desenvolvendo seus modelos de IA de forma acelerada. De acordo com o VentureBeat, o fundo conseguiu adquirir mais de 10.000 GPUs Nvidia antes das restrições de exportação dos EUA e, por meio de rotas alternativas, expandiu esse número para 50.000 GPUs. Ainda assim, isso é pouco comparado às infraestruturas de OpenAI, Google e Anthropic, que operam com mais de 500.000 GPUs cada.

Apesar desse desafio de escala, a DeepSeek surpreendeu o mercado ao lançar um modelo que, segundo a empresa, supera o GPT-01 da OpenAI com um custo de treinamento 95-97% menor. Mas o impacto real da DeepSeek vai além do custo — ele está na mudança estrutural da computação em IA.

Modelos de Raciocínio: A nova fronteira da inteligência artificial

Os modelos de IA tradicionais, como o ChatGPT, funcionam essencialmente reconhecendo padrões nos dados em que foram treinados. Eles não “pensam”, mas geram respostas baseadas nas correlações identificadas durante o treinamento. Já os modelos de raciocínio, como o RU da DeepSeek, adotam uma abordagem diferente. Eles buscam resolver problemas de forma lógica e estruturada, realizando cálculos e passos intermediários para chegar a uma resposta, como um humano faria.

Por exemplo, ao perguntar para uma IA quantas maçãs um fazendeiro tem depois de vender X maçãs, um modelo tradicional tentaria prever a resposta com base em padrões aprendidos. O RU, por outro lado, realizaria os cálculos passo a passo antes de responder.

Essa capacidade de raciocinar altera fundamentalmente a necessidade de poder computacional. Nos modelos convencionais, a maior parte da computação ocorre durante o treinamento. Já nos modelos de raciocínio, a maior carga computacional acontece durante o uso, pois eles precisam processar cada problema em tempo real. Esse conceito é conhecido como computação no tempo de inferência.

O Impacto Econômico: IA mais acessível, mas com maior demanda computacional

A DeepSeek afirmou que treinou o RU por menos de 10 milhões de dólares — um valor muito menor do que os custos da OpenAI para desenvolver seus modelos. No entanto, é importante destacar que a própria empresa admite que esse valor não inclui custos de pesquisa, testes fracassados e infraestrutura.

Outro fator relevante é que o RU é open source, ou seja, qualquer desenvolvedor pode acessá-lo, modificá-lo e utilizá-lo. Isso marca um avanço significativo para tornar a IA mais acessível e democratizar o desenvolvimento de novos produtos baseados nessa tecnologia.

Mas essa acessibilidade traz uma consequência inesperada: um aumento exponencial da demanda computacional. Como os modelos de raciocínio precisam de mais poder de processamento durante a inferência, a necessidade de GPUs e chips avançados pode crescer significativamente. Isso significa que, em vez de reduzir a demanda por semicondutores, a IA pode apenas deslocá-la para um novo ponto da cadeia de valor. Essa mudança impacta diretamente empresas como Nvidia, AMD e Intel, que continuarão desempenhando um papel essencial no fornecimento de hardware para sustentar o crescimento da IA. A reação inicial do mercado, que viu quedas nas ações dessas companhias após o anúncio da DeepSeek, pode ter sido precipitada.

A geopolítica da inteligência artificial

A DeepSeek não é apenas uma inovação tecnológica — ela também é um reflexo do cenário geopolítico atual. A empresa foi fundada por pesquisadores chineses que estudaram e trabalharam na China, o que levanta questões sobre a independência tecnológica do país e seu avanço em IA sem depender de empresas ocidentais.

As tensões entre EUA e China na área de tecnologia são evidentes. Recentemente, o governo americano implementou restrições rígidas à exportação de chips avançados para a China, na tentativa de limitar o progresso das empresas chinesas nesse setor. Mesmo assim, a DeepSeek conseguiu desenvolver um modelo competitivo, desafiando as lideranças ocidentais. Essa rivalidade se reflete no mercado financeiro. A forte reação da bolsa após o anúncio da DeepSeek pode estar mais relacionada à geopolítica do que à tecnologia em si. Caso a empresa fosse australiana, por exemplo, será que teria gerado o mesmo impacto no Nasdaq?

Além disso, surgiram questões sobre segurança e privacidade. Uma reportagem da Wired revelou que o aplicativo da DeepSeek pode estar enviando os dados computados diretamente para a China. Ao mesmo tempo, a OpenAI acusou a DeepSeek de ter roubado informações de seus modelos. Se essas alegações forem confirmadas, novos embargos e regulações podem surgir, dificultando ainda mais a atuação da empresa chinesa no cenário global.

O futuro: modelos maiores ou menores? O equilíbrio da nova era da IA

O avanço da DeepSeek levanta uma questão crucial para o futuro da IA: modelos menores, mais eficientes e baratos irão dominar, ou continuaremos dependentes de grandes modelos poderosos?

A resposta mais provável é que os dois coexistirão. Modelos menores são ideais para aplicações descentralizadas e acessíveis, permitindo maior experimentação e inovação. Já os modelos maiores continuarão sendo essenciais para tarefas extremamente complexas, que exigem mais profundidade e capacidade de processamento.

A comparação com o mercado automobilístico é válida: tanto carros populares quanto veículos de luxo têm seu espaço, atendendo diferentes perfis de consumidores. O mesmo deve acontecer com a IA. O que fica claro é que estamos entrando em uma nova fase do desenvolvimento da IA, onde o acesso à tecnologia está crescendo, ao mesmo tempo que a demanda computacional se torna um desafio crítico. O jogo não será apenas sobre quem tem o modelo mais poderoso, mas sobre como equilibrar eficiência, acessibilidade e capacidade computacional.

Conclusão

A DeepSeek pode não ser uma ameaça imediata à OpenAI, mas representa um novo capítulo na evolução da inteligência artificial. A chegada dos modelos de raciocínio redefine não apenas como a IA opera, mas também como consumimos e aplicamos essa tecnologia.

O impacto no mercado de semicondutores, o aumento da demanda por computação, os desafios geopolíticos e a ascensão de modelos de IA mais acessíveis são apenas o começo dessa nova era. O futuro da IA não será definido apenas por quem tem o melhor modelo, mas por quem souber equilibrar inovação, eficiência e escalabilidade. E nesse novo cenário, as regras do jogo ainda estão sendo escritas.

Thiago Kapulskis

Equities Research Vice-President – Itaú BBA

Julia De Luca

IBD Tech Vice-President – Itaú BBA | LatAm Tech Weekly