ouça este conteúdo
|
readme
|
A novidade no mundo da tecnologia, que chegou marcando um novo capítulo na disputa entre Estados Unidos e China pela liderança tecnológica, é o novo modelo de Inteligência Artificial, DeepSeek. A startup chinesa ganhou projeção após revelar seu baixo custo, conseguindo operar com apenas uma fração do investimento das big techs, obter resultados tão eficientes quanto o ChatGPT, da OpenAI.
Apesar das poucas informações disponíveis sobre a empresa, um artigo publicado em janeiro revelou que foram investidos cerca de U$ 6 milhões (R$ 35,6 milhões) na nova tecnologia. Para efeito de comparação, o megaprojeto de data centers de desenvolvimento de IA de Sam Altman — CEO da OpenAI — gastou cerca de U$ 100 bilhões (R$ 589 bilhões) em investimentos iniciais.
Além disso, a startup precisou trabalhar tendo o empecilho das restrições no acesso a chips de ponta da Nvidia, impostas pelo governo americano. Por isso a startup precisou usar placas H800 da Nvidia, que já estão no mercado desde 2023, no desenvolvimento do modelo DeepSeek-R1.
Aqui estão alguns pontos importantes para entender o desenvolvimento e funcionamento do DeepSeek:
- O que é o DeepSeek?
Sediada em Hangzhou, na China, a startup DeepSeek tem como acionista controlador Liang Wenfeng, cofundador do fundo de hedge quantitativo High-Flyer. Liang tem investido em inteligência artificial desde 2023, mesmo ano em que a startup foi fundada.
Em 2024, a empresa lançou o seu primeiro modelo de IA generativa, o DeepSeek-V2, que mais tarde seria atualizada para V2.5 e V3. Porém, foi o anúncio mais recente da empresa, o DeepSeek-R1, que abalou o mercado.
Esse modelo demonstra capacidades semelhantes ao de gigantes da tecnologia, como os sitemas da OpenAI — o ChatGPT –, e o da Google — o Gemini –, se destacando especialmente em tarefas de raciocínio lógico e programação.
- O DeepSeek é bom?
O nova plataforma está na primeira prateleira das IA generativas, disputando de igual para igual com modelos americanos de ponta, como os sitemas do Google, Meta e OpenAI.
As habilidades em matemática e programação são o destaque do programa, que também se sobressai na escrita em chinês, apesar de conseguir se comunicar em português e inglês fluentemente.
- Por que o DeepSeek teve um custo tão baixo?
Limitada pela baixa verba — em comparação com o investimento das big techs –, e pela restrição de acesso a chips de ponta da Nvidia, a DeepSeek precisou usar placas H800 da Nvidia, de 2023, no desenvolvimento do R1. Tendo isso em mente, seu fundador, Liang, disse que a empresa focou em “desenvolver os melhores talentos nós mesmo”.
Com isso, a equipe do DeepSeek-R1 desenvolveu a plataforma com uma estratégia inédita, melhorando o DeepSeek-V3 através da técnica de aprendizado de reforço — quando a inteligência artificial recebe um “recompensa” quando responde as questões de maneira satisfatória. O padrão de treinamento da indústria é fazer um novo treinamento de modelo, com base em dados mais específicos.
O modelo R1 aprendeu a priorizar tarefas com base em sua dificuldade, e a reavaliar suas decisões em tempo real.
- Impacto na bolsa e nas big techs
Tendo custos reduzidos, métodos inovadores, e um modelo de código aberto para a comunidade global — quando a empresa permite qualquer pessoa ter acesso, modificar e distribuir o código-fonte — a DeepSeek conseguiu desafiar a narrativa da dominação ocidental no campo das IAs.
Com custos muito inferiores à concorrência, a DeepSeek mostrou que os investidores superestimaram a demanda por equipamentos da Nvidia, ao treinar seus chatbots usando cerca de 2.000 placas da Nvidia, enquanto a das concorrentes americanas usam mais de 10.000 placas em seus supercomputadores.
Isso fez com que as ações da Nvidia caíssem em quase US$ 600 bilhões.
Relacionados
IA e saúde mental disparam como prioridade no mercado de trabalho, aponta pesquisa
66% dos profissionais já utilizaram ou utilizam ferramentas de inteligência artificial para suporte ou orientação no mercado de trabalho
Câmara aprova pena para quem divulgar imagens de nudez geradas por IA
Crime pode ser punido com reclusão de dois a seis anos
A corrida geopolítica pela inteligência artificial
Nenhum outro tema é mais político, no sentido em que esta é uma revolução com impacto nas áreas mais sensíveis da nossa vida em comum