ICL Notícias

No centro de um debate que agitou o mercado de tecnologia global nesta segunda-feira (27), o assistente de IA da startup chinesa DeepSeek vem dando o que falar depois de ultrapassar o ChatGPT como o aplicativo mais bem avaliado na App Store dos Estados Unidos.

O sucesso do DeepSeek-R1 desafia soluções de líderes do mercado mundial, como OpenAI e Meta, com custos muito mais baixos e eficiência surpreendente.

No início desta segunda-feira, a startup foi atingida por interrupções de serviço em seu site e informou que vai limitar temporariamente as inscrições devido ao ataque cibernético. O impacto foi tão significativo que os futuros do Nasdaq caíram mais de 4%, com ações de gigantes como Nvidia, Microsoft e Meta sendo diretamente afetadas.

Os modelos de IA da DeepSeek, como o DeepSeek-R1, são projetados para lidar com tarefas complexas de raciocínio. Modelos como o OpenAI o1 já são considerados rivais, segundo o Wall Street Journal. Mesmo usando chips de menor custo e enfrentando restrições de exportação dos EUA, a empresa conseguiu alcançar desempenho elevado e competitivo.

DeepSeek

Características da DeepSeek

A DeepSeek foi fundada na China em 2023, inicialmente como um braço de pesquisa da High-Flyer, um fundo quantitativo de US$ 8 bilhões. De lá para cá, vem se tornando uma das startups de IA mais comentadas no mundo. Sua missão inicial era desenvolver modelos de IA eficientes com foco em pesquisa profunda, não exatamente na comercialização. Isso a diferencia de outras empresas que priorizaram o lucro imediato.

O custo e a eficiência tornam a DeepSeek única. A empresa construiu um formato que reduz drasticamente os custos de treinamento de seus modelos. Segundo a revista Nature, o DeepSeek-R1, por exemplo, foi treinado por aproximadamente US$ 6 milhões, enquanto modelos como o Llama 3.1 da Meta custaram mais de US$ 60 milhões para serem desenvolvidos.

O fundador da DeepSeek é Liang Wenfeng, um gestor de hedge fund conhecido por sua atuação em tecnologia e finanças. Ao criar a startup, ele reuniu uma equipe jovem e altamente talentosa, principalmente formada por recém-formados de universidades de elite chinesas, como Tsinghua e Peking. Essa abordagem permitiu à empresa cultivar uma cultura de inovação e explorar caminhos não convencionais no desenvolvimento de IA.

Em entrevista à publicação chinesa 36Kr, Wenfeng revelou que sua motivação para criar a DeepSeek foi científica, e não comercial. “O retorno financeiro imediato não era o objetivo; queríamos resolver os problemas mais difíceis do mundo”, disse ele.

DeepSeek e a popularidade repentina

Segundo a Forbes, o modelo do DeepSeek desafia a suposição de que são necessários chips avançados e caros para desenvolver IA de ponta. O uso de tecnologias mais acessíveis sugere que grandes empresas americanas podem precisar repensar suas estratégias, incluindo a redução de custos para se manterem competitivas.

As restrições de exportação dos EUA, que limitam o acesso de empresas chinesas a chips avançados como o Nvidia H100, foram o catalisador para que o DeepSeek desenvolvesse métodos inovadores e mais eficientes. Essa abordagem agora ameaça o domínio dos EUA no setor, enquanto demonstra a capacidade da China de inovar mesmo sob sanções.

De acordo com Wendy Chang, analista de políticas do Mercator Institute, “o DeepSeek mostrou que não é preciso um orçamento gigantesco para criar modelos de ponta. Isso muda as regras do jogo para a IA global.”

Relacionados

Mais Lidas

Assine nossa newsletter
Receba nossos informativos diretamente em seu e-mail