DeepSeek: entenda seu sucesso estrondoso e seus desafios
Startup chinesa de IA revoluciona o setor com métodos de treinamento de baixo custo, mas enfrenta obstáculos geopolíticos e concorrência global
247 – A DeepSeek, uma startup chinesa de inteligência artificial (IA) sediada em Hangzhou, tem chamado a atenção mundial com seu crescimento acelerado e métodos inovadores. Seu sucesso, no entanto, não está livre de desafios, especialmente diante de restrições de recursos e tensões geopolíticas. Com base em um relatório técnico publicado pela empresa em dezembro e análises de especialistas, o site Caixin traz um panorama detalhado sobre os fatores que impulsionaram a DeepSeek e os obstáculos que ela enfrenta.
Um dos principais trunfos da DeepSeek é sua capacidade de treinar modelos de IA com custos significativamente menores que os de concorrentes globais. O modelo DeepSeek-V3, com 671 bilhões de parâmetros, foi treinado em um cluster de 2.048 GPUs Nvidia H800, demandando apenas 2,788 milhões de horas de GPU e um custo total de US$ 5,576 milhões. Em comparação, o Llama 3, da Meta Platforms Inc., exigiu 39,3 milhões de horas de GPU H100 para ser desenvolvido.
"Essa eficiência coloca a DeepSeek em uma posição única no mercado", afirma Huang Leping, analista-chefe de tecnologia e eletrônicos da Huatai Securities. "No curto prazo, seus métodos permitem operar com menos recursos, mas, à medida que seus modelos ganham popularidade e suas aplicações se expandem, a demanda por poder computacional certamente aumentará."
Inovações que Redefinem o Setor
A DeepSeek não se destaca apenas pela redução de custos. A empresa implementou inovações tecnológicas em áreas como arquitetura de modelos, métodos de treinamento, otimização de inferência e eficiência computacional. Entre as tecnologias utilizadas estão o Mixture of Experts (MoE), que divide modelos grandes em redes menores e especializadas, e o Multi-Head Latent Attention (MLA), que comprime a memória e facilita o processamento de textos longos.
Além disso, a DeepSeek adotou o aprendizado por reforço puro (RL) para treinar seu modelo R1-Zero, dispensando a necessidade de ajuste supervisionado. "Essa abordagem valida a eficácia do RL no treinamento de IA e abre novas possibilidades para o desenvolvimento de modelos mais rápidos e precisos", explica Chen Xudong, analista da Huatai Securities.
Impactos no Mercado de Chips e Geopolítica
O sucesso da DeepSeek também tem implicações para o mercado de chips. Enquanto a Nvidia domina 90% do mercado global de GPUs, a DeepSeek demonstrou que é possível treinar modelos competitivos usando chips de geração anterior, como os Nvidia A100 e H800. Isso pode reduzir a demanda por GPUs de última geração, como o B200, em áreas como computação em nuvem e IA soberana.
No entanto, o avanço da DeepSeek pode levar a uma reação dos Estados Unidos. "Há riscos de que os EUA intensifiquem as restrições à exportação de chips de alta performance, limitem o compartilhamento de modelos de código aberto e restrinjam o acesso a conjuntos de dados essenciais para o treinamento de IA", alerta Huang Leping.
O Futuro da IA em Dispositivos Locais
A DeepSeek também está impulsionando o desenvolvimento de IA em dispositivos locais, como smartphones e computadores pessoais. Sua abordagem de baixo custo pode incentivar mais empresas a adotar aplicações de IA diretamente nos dispositivos dos usuários, melhorando a experiência de interação e a privacidade. Um exemplo recente é a parceria com a Microsoft, que disponibilizou modelos da DeepSeek em seus dispositivos Copilot+ PCs.
No entanto, o caminho para a adoção em larga escala de IA em dispositivos locais ainda é gradual. "Melhorar as capacidades dos modelos é apenas uma parte do processo. A coordenação do ecossistema e a evolução do hardware são desafios significativos", ressalta Chen Xudong.
Conclusão: Um Novo Capítulo para a IA
A DeepSeek representa um marco importante no desenvolvimento da IA, especialmente no contexto chinês. Suas inovações e métodos eficientes estão desafiando as práticas estabelecidas por gigantes globais, mas seu sucesso futuro dependerá de como a empresa navegará pelos desafios geopolíticos e pela concorrência acirrada.
Enquanto isso, o mundo observa atentamente como essa startup pode redefinir o futuro da inteligência artificial.
❗ Se você tem algum posicionamento a acrescentar nesta matéria ou alguma correção a fazer, entre em contato com redacao@brasil247.com.br.
✅ Receba as notícias do Brasil 247 e da TV 247 no Telegram do 247 e no canal do 247 no WhatsApp.
iBest: 247 é o melhor canal de política do Brasil no voto popular
Assine o 247, apoie por Pix, inscreva-se na TV 247, no canal Cortes 247 e assista: