ICL Notícias
País

DeepSeek: O que se sabe sobre a nova Inteligência Artificial chinesa

Com apenas uma fração do investimento, a nova IA chinesa já se mostra tão eficiente quanto seus concorrentes ocidentais
28/01/2025 | 13h48

A novidade no mundo da tecnologia, que chegou marcando um novo capítulo na disputa entre Estados Unidos e China pela liderança tecnológica, é o novo modelo de Inteligência Artificial, DeepSeek. A startup chinesa ganhou projeção após revelar seu baixo custo, conseguindo operar com apenas uma fração do investimento das big techs, obter resultados tão eficientes quanto o ChatGPT, da OpenAI.

Apesar das poucas informações disponíveis sobre a empresa, um artigo publicado em janeiro revelou que foram investidos cerca de U$ 6 milhões (R$ 35,6 milhões) na nova tecnologia. Para efeito de comparação, o megaprojeto de data centers de desenvolvimento de IA de Sam Altman — CEO da OpenAI — gastou cerca de U$ 100 bilhões (R$ 589 bilhões) em investimentos iniciais.

Além disso, a startup precisou trabalhar tendo o empecilho das restrições no acesso a chips de ponta da Nvidia, impostas pelo governo americano. Por isso a startup precisou usar placas H800 da Nvidia, que já estão no mercado desde 2023, no desenvolvimento do modelo DeepSeek-R1.

Aqui estão alguns pontos importantes para entender o desenvolvimento e funcionamento do DeepSeek:

  • O que é o DeepSeek?

Sediada em Hangzhou, na China, a startup DeepSeek tem como acionista controlador Liang Wenfeng, cofundador do fundo de hedge quantitativo High-Flyer. Liang tem investido em inteligência artificial desde 2023, mesmo ano em que a startup foi fundada.

Em 2024, a empresa lançou o seu primeiro modelo de IA generativa, o DeepSeek-V2, que mais tarde seria atualizada para V2.5 e V3. Porém, foi o anúncio mais recente da empresa, o DeepSeek-R1, que abalou o mercado.

Esse modelo demonstra capacidades semelhantes ao de gigantes da tecnologia, como os sitemas da OpenAI — o ChatGPT –, e o da Google — o Gemini –, se destacando especialmente em tarefas de raciocínio lógico e programação.

  • O DeepSeek é bom?

O nova plataforma está na primeira prateleira das IA generativas, disputando de igual para igual com modelos americanos de ponta, como os sitemas do Google, Meta e OpenAI.

As habilidades em matemática e programação são o destaque do programa, que também se sobressai na escrita em chinês, apesar de conseguir se comunicar em português e inglês fluentemente.

  • Por que o DeepSeek teve um custo tão baixo?

Limitada pela baixa verba — em comparação com o investimento das big techs –, e pela restrição de acesso a chips de ponta da Nvidia, a DeepSeek precisou usar placas H800 da Nvidia, de 2023, no desenvolvimento do R1. Tendo isso em mente, seu fundador, Liang, disse que a empresa focou em “desenvolver os melhores talentos nós mesmo”.

Com isso, a equipe do DeepSeek-R1 desenvolveu a plataforma com uma estratégia inédita, melhorando o DeepSeek-V3 através da técnica de aprendizado de reforço — quando a inteligência artificial recebe um “recompensa” quando responde as questões de maneira satisfatória. O padrão de treinamento da indústria é fazer um novo treinamento de modelo, com base em dados mais específicos.

O modelo R1 aprendeu a priorizar tarefas com base em sua dificuldade, e a reavaliar suas decisões em tempo real.

  • Impacto na bolsa e nas big techs

Tendo custos reduzidos, métodos inovadores, e um modelo de código aberto para a comunidade global — quando a empresa permite qualquer pessoa ter acesso, modificar e distribuir o código-fonte — a DeepSeek conseguiu desafiar a narrativa da dominação ocidental no campo das IAs.

Com custos muito inferiores à concorrência, a DeepSeek mostrou que os investidores superestimaram a demanda por equipamentos da Nvidia, ao treinar seus chatbots usando cerca de 2.000 placas da Nvidia, enquanto a das concorrentes americanas usam mais de 10.000 placas em seus supercomputadores.

Isso fez com que as ações da Nvidia caíssem em quase US$ 600 bilhões.

Deixe um comentário

Mais Lidas

Assine nossa newsletter
Receba nossos informativos diretamente em seu e-mail