No centro de um debate que agitou o mercado de tecnologia global nesta segunda-feira (27), o assistente de IA da startup chinesa DeepSeek vem dando o que falar depois de ultrapassar o ChatGPT como o aplicativo mais bem avaliado na App Store dos Estados Unidos.
O sucesso do DeepSeek-R1 desafia soluções de líderes do mercado mundial, como OpenAI e Meta, com custos muito mais baixos e eficiência surpreendente.
No início desta segunda-feira, a startup foi atingida por interrupções de serviço em seu site e informou que vai limitar temporariamente as inscrições devido ao ataque cibernético. O impacto foi tão significativo que os futuros do Nasdaq caíram mais de 4%, com ações de gigantes como Nvidia, Microsoft e Meta sendo diretamente afetadas.
Os modelos de IA da DeepSeek, como o DeepSeek-R1, são projetados para lidar com tarefas complexas de raciocínio. Modelos como o OpenAI o1 já são considerados rivais, segundo o Wall Street Journal. Mesmo usando chips de menor custo e enfrentando restrições de exportação dos EUA, a empresa conseguiu alcançar desempenho elevado e competitivo.
Características da DeepSeek
A DeepSeek foi fundada na China em 2023, inicialmente como um braço de pesquisa da High-Flyer, um fundo quantitativo de US$ 8 bilhões. De lá para cá, vem se tornando uma das startups de IA mais comentadas no mundo. Sua missão inicial era desenvolver modelos de IA eficientes com foco em pesquisa profunda, não exatamente na comercialização. Isso a diferencia de outras empresas que priorizaram o lucro imediato.
O custo e a eficiência tornam a DeepSeek única. A empresa construiu um formato que reduz drasticamente os custos de treinamento de seus modelos. Segundo a revista Nature, o DeepSeek-R1, por exemplo, foi treinado por aproximadamente US$ 6 milhões, enquanto modelos como o Llama 3.1 da Meta custaram mais de US$ 60 milhões para serem desenvolvidos.
O fundador da DeepSeek é Liang Wenfeng, um gestor de hedge fund conhecido por sua atuação em tecnologia e finanças. Ao criar a startup, ele reuniu uma equipe jovem e altamente talentosa, principalmente formada por recém-formados de universidades de elite chinesas, como Tsinghua e Peking. Essa abordagem permitiu à empresa cultivar uma cultura de inovação e explorar caminhos não convencionais no desenvolvimento de IA.
Em entrevista à publicação chinesa 36Kr, Wenfeng revelou que sua motivação para criar a DeepSeek foi científica, e não comercial. “O retorno financeiro imediato não era o objetivo; queríamos resolver os problemas mais difíceis do mundo”, disse ele.
DeepSeek e a popularidade repentina
Segundo a Forbes, o modelo do DeepSeek desafia a suposição de que são necessários chips avançados e caros para desenvolver IA de ponta. O uso de tecnologias mais acessíveis sugere que grandes empresas americanas podem precisar repensar suas estratégias, incluindo a redução de custos para se manterem competitivas.
As restrições de exportação dos EUA, que limitam o acesso de empresas chinesas a chips avançados como o Nvidia H100, foram o catalisador para que o DeepSeek desenvolvesse métodos inovadores e mais eficientes. Essa abordagem agora ameaça o domínio dos EUA no setor, enquanto demonstra a capacidade da China de inovar mesmo sob sanções.
De acordo com Wendy Chang, analista de políticas do Mercator Institute, “o DeepSeek mostrou que não é preciso um orçamento gigantesco para criar modelos de ponta. Isso muda as regras do jogo para a IA global.”
Relacionados
China acusa CIA de espionagem cibernética e ter feito mais de 1 mil ataques digitais em 2024
DeepSeek passou a ser um dos principais alvos em janeiro deste ano
Teste do ICL com o DeepSeek revela restrições impostas à IA pelo governo chinês
DeepSeek deu resposta e depois apagou informação sobre o Massacre da Praça da Paz Celestial, ocorrido em Pequim
DeepSeek: O que se sabe sobre a nova Inteligência Artificial chinesa
Com apenas uma fração do investimento, a nova IA chinesa já se mostra tão eficiente quanto seus concorrentes ocidentais