DeepSeek Lança Atualização do Modelo R1 para Aumentar Competitividade no Mercado Norte-Americano

Startup de Inteligência Artificial DeepSeek Lança Atualização do Modelo R1

A startup chinesa DeepSeek anunciou a primeira atualização do seu modelo de raciocínio R1, denominada R1-0528, em uma ação que intensifica a competição com empresas norte-americanas como a OpenAI. A atualização foi realizada na madrugada de quinta-feira e, apesar de ser classificada como uma versão menor, trouxe melhorias significativas na profundidade de raciocínio e nas capacidades de inferência do modelo, especialmente na execução de tarefas complexas, aproximando seu desempenho dos modelos o3 da OpenAI e do Gemini 2.5 Pro do Google.

O lançamento do modelo R1, em janeiro, teve impacto global, influenciando negativamente as ações de tecnologia fora da China e desafiando a noção de que a inteligência artificial requer altos investimentos em computação. Desde então, companhias como Alibaba e Tencent lançaram modelos que afirmam superar o desempenho do R1 da DeepSeek.

Diferentemente do lançamento inicial, que foi acompanhado por um artigo científico detalhado, a atualização R1-0528 foi breve em suas informações. A empresa, sediada em Hangzhou, comunicou em uma postagem no X que o novo modelo apresenta desempenhos aprimorados. Em uma atualização mais elaborada no WeChat, a DeepSeek indicou que a taxa de “alucinações” – resultados falsos ou enganosos – foi reduzida em cerca de 45% a 50% em tarefas como reescrita e resumo.

Além disso, a atualização permite a produção criativa de ensaios, romances e outros gêneros, bem como melhorias em habilidades como a geração de código de front-end e interpretação de papéis. Segundo a DeepSeek, “o modelo demonstrou desempenho excepcional em várias avaliações de benchmark, incluindo matemática, programação e lógica geral.”

A DeepSeek desafiou a ideia de que os controles de exportação dos EUA estariam dificultando os avanços na IA na China, ao lançar modelos que competem com os líderes do setor nos Estados Unidos, a um custo inferior. A startup revelou que uma variante da atualização R1-0528 foi utilizada para melhorar o modelo Qwen 3 8B Base da Alibaba, resultando em uma performance mais de 10% superior ao modelo original.

De acordo com a DeepSeek, “acreditamos que a cadeia de pensamento do DeepSeek-R1-0528 terá uma importância significativa tanto para a pesquisa acadêmica em modelos de raciocínio quanto para o desenvolvimento industrial focado em modelos de menor escala.”

Informações de uma reportagem anterior indicaram que a atualização seria uma “pequena atualização experimental,” com testes disponibilizados para usuários. Em resposta à crescente competição, o Gemini do Google introduziu acesso com desconto, enquanto a OpenAI anunciou a redução de preços e o lançamento do modelo o3 Mini, que exige menos capacidade computacional.

Há também expectativas quanto ao lançamento do modelo R2, sucessor do R1, inicialmente previsto para maio, conforme relatado em março. Recentemente, a DeepSeek também atualizou seu modelo de linguagem V3.

Posts relacionados

Deixe um comentário Cancelar resposta