Depois de ter ganhado a atenção do mundo na semana passada, a startup chinesa DeepSeek começa a ser alvo de críticas e questionamentos de outros agentes do mercado. Um relatório da SemiAnalysis indica que somente o custo em infraestrutura da DeepSeek teria sido em torno de US$ 1,6 bilhão.
O documento chama a atenção para o fato de que os US$ 6 milhões de investimentos em treinamento do DeepSeek, anunciados pela startup chinesa, representam uma porção muito estreita do custo total. A SemiAnalysis afirma que o número não é nem de longe o valor real gasto no modelo. Somente os custos com hardware são estimados em mais de US$ 500 milhões ao longo da história da companhia chinesa.
A SemiAnalysis lembra ainda da relação entre a DeepSeek e o fundo de hedge quantitativo High-Flyer, que está por de trás da criação e financiamento da IA chinesa. O High-Flyer foi cofundado por Liang Wenfeng para prever tendências de mercado e tomar decisões mais estratégicas de investimento. Como se sabe, Wenfeng também é o fundador da DeepSeek.
A SemiAnalysis acredita que a a DeepSeek tenha acesso a cerca de 10.000 GPUs do modelo H800s e cerca de 10.000 do modelo H100s. Além disso, eles têm pedidos para muito mais modelos H20, com a Nvidia tendo produzido mais de 1 milhão de GPUs específicas da China nos últimos nove meses. Essas GPUs são compartilhadas entre a High-Flyer e a DeepSeek e distribuídas geograficamente até certo ponto. Elas são usadas para negociação, inferência, treinamento e pesquisa.
O relatório também diz que a DeepSeek tem recrutado talentos exclusivamente da China, sem levar em conta credenciais anteriores, colocando um foco pesado na capacidade e curiosidade.
“Eles são extremamente competitivos e supostamente oferecem salários de mais de US$ 1,3 milhão para candidatos promissores, bem acima das grandes empresas de tecnologia chinesas concorrentes e laboratórios de IA como Moonshot. Eles têm cerca de 150 funcionários, mas estão crescendo rapidamente”, afirmou a SemiAnalysis.
Problemas na segurança

Enquanto isso, testes feitos pela empresa de software Cisco indicaram que o DeepSeek tem “falhas críticas de segurança“. A análise da ferramenta foi realizada por pesquisadores de segurança de IA da Robust Intelligence e da Universidade da Pensilvânia.
Segundo a Cisco, os pesquisadores aplicaram técnicas de “jailbreaking” algorítmico no DeepSeek R1, utilizando 50 prompts aleatórios do conjunto HarmBench, que abrange seis categorias de comportamentos prejudiciais, incluindo cibercrime, desinformação e atividades ilegais.
“Os resultados foram alarmantes: o DeepSeek R1 falhou em bloquear todos os prompts prejudiciais, exibindo uma taxa de sucesso de ataque de 100%. Isso contrasta fortemente com outros modelos líderes, que demonstraram resistência parcial”, afirma a empresa.
A companhia diz que as descobertas sugerem que os métodos de treinamento econômicos da DeepSeek podem ter comprometido os mecanismos de segurança do modelo, tornando-o altamente suscetível a “jailbreaking” algorítmico e uso indevido.
“Embora o DeepSeek R1 apresente avanços notáveis em eficiência e capacidades de raciocínio, essas melhorias parecem ter sido alcançadas às custas da segurança. A falta de proteções robustas torna o modelo vulnerável a explorações e uso indevido”, afirmou a Cisco.
Por fim, a empresa destacou a necessidade urgente de avaliações de segurança rigorosas no desenvolvimento de IA, garantindo que avanços em eficiência e raciocínio não comprometam a segurança. Reforça também a importância de as empresas utilizarem mecanismos de proteção de terceiros que ofereçam segurança consistente em aplicações de IA.
Receba em seu email um resumo semanal com notícias exclusivas e reportagens sobre o mercado de IA no Brasil e no mundo