
Iniciaram-se os rumores sobre o R2, a próxima geração do modelo de IA da DeepSeek. Se confirmados, esses rumores podem impactar significativamente o mercado e as bolsas de valores das grandes empresas de tecnologia ocidentais.
É necessário abordar esses rumores com cautela. As informações emergentes da mídia chinesa subsidiaram as especulações ocidentais. Indica-se que o modelo DeepSeek R2 pode apresentar desempenho comparável ao GPT-4 Turbo da OpenAI e ao Gemini 2.0 Pro da Google.

Um aspecto potencialmente disruptivo da tecnologia é o custo operacional reduzido. De acordo com os rumores, o modelo R2 pode custar até 97,3% menos por token em comparação com o GPT-4. Adicionalmente, especula-se que a DeepSeek incorporou uma versão avançada do MoE (Mixture of Experts), dobrando a quantidade de parâmetros no R2 em relação ao R1, totalizando 1,2 trilhão de parâmetros.
Outra informação relevante é que o novo modelo supostamente atingiu 82% de utilização em aceleradores Ascend 910B. A DeepSeek demonstra interesse nos aceleradores da Huawei desde o R1, o que indica uma continuidade na otimização de seus modelos para componentes fabricados pela empresa chinesa. Tal estratégia visa reforçar a autonomia tecnológica da China.

DeepSeek poderá aproveitar chips Ascend 920 AI em breve
É importante reiterar que estamos diante de especulações e que somente após um anúncio oficial e a utilização prática do modelo será possível validar essas informações. O principal atrativo do R2 é o potencial de custo reduzido de operação, tornando-o atraente para clientes globalmente.
Notícias relacionadas:
Enquanto isso, a Huawei avança com o desenvolvimento de seus aceleradores, recentemente anunciando os Ascend 920 AI. A empresa aproveitou a suspensão dos envios de GPUs H20 da NVIDIA para a China para promover seu novo produto.
Se a empresa puder cumprir suas promessas em relação aos novos chips, a DeepSeek possivelmente conseguirá executar seus modelos utilizando apenas hardware nacional, o que pode resultar em uma redução adicional dos custos operacionais.