Alibaba apresenta Qwen3 como concorrente da IA DeepSeek

Alibaba apresenta Qwen3 como concorrente da IA DeepSeek

A competição para aprimorar a eficiência e capacidade de inteligência artificial, especialmente em relação à DeepSeek, se intensificou com o lançamento do Qwen3 pela Alibaba nesta terça-feira (29). Esta plataforma representa a mais recente evolução da linha de modelos de linguagem grandes de código aberto da empresa.

A Alibaba anunciou que o Qwen3 diminui significativamente a demanda computacional em comparação aos modelos concorrentes e foi treinado utilizando um vasto conjunto de dados, totalizando 36 trilhões de tokens—o dobro da quantidade empregada no modelo anterior, Qwen2.5.

Tokens referem-se a fragmentos textuais que a IA analisa e assimila. Quanto maior o número de tokens a que um modelo é exposto durante o treinamento, melhor ele consegue interpretar instruções e resolver questões complexas.

A nova série é o primeiro conjunto de modelos de raciocínio híbrido da Alibaba, permitindo a alternância entre dois modos: um “modo de pensamento” concebido para lidar com tarefas desafiadoras e um “modo não pensamento” otimizado para oferecer respostas rápidas a consultas simples.

A coleção consistindo de seis modelos densos destinados a tarefas gerais e dois modelos Mixture-of-Experts (MoE) se destaca pela eficiência, utilizando partes do modelo conforme a tarefa requerida. Esse design MoE é um dos fatores que possibilitaram à DeepSeek desenvolver seu modelo V3 por custos significativamente inferiores em comparação a seus principais concorrentes norte-americanos.

Segundo a Alibaba, o modelo central Qwen3-235B-A22B supera os lançamentos de competidores relevantes, como DeepSeek-R1, OpenAI-o1, Grok-3 e Gemini-2.5-Pro, em diversos testes de benchmark. Tais testes incluem raciocínio matemático, habilidades de programação e capacidades de chamada de ferramentas e funções, que medem a competência do modelo em selecionar e utilizar ferramentas externas de forma eficaz.

Este lançamento, que demandou aproximadamente sete meses de trabalho, ocorre em um contexto de crescente concorrência entre as empresas de IA na China, especialmente após o surgimento da DeepSeek no início do ano. Recentemente, a Baidu apresentou dois novos modelos de fundação em IA, que, segundo a companhia, são oferecidos a “uma fração” do preço dos modelos similares da DeepSeek.

Antes do lançamento, circularam especulações nas redes sociais sobre a capacidade da Alibaba de disponibilizar a atualização planejada do modelo, dado que diversos engenheiros seniores deixaram a Alibaba Cloud no final do ano passado para integrar a concorrente ByteDance, que também está realizando investimentos significativos em IA.

A busca por uma inteligência artificial mais eficiente se intensifica em um cenário em que os EUA implementam restrições mais rigorosas à exportação de chips, visando restringir os avanços da China nesse setor. Em abril, Washington interrompeu os envios de chips de IA H20 da Nvidia, embora empresas chinesas como ByteDance, Alibaba e Tencent tenham estocado bilhões de dólares desses componentes, conforme relatado anteriormente.

A Alibaba está investindo fortemente em IA com o objetivo de reformular seu império de comércio eletrônico e modernizar setores tradicionais via sua plataforma de nuvem. Em fevereiro, a companhia anunciou um investimento superior a 380 bilhões de yuan (aproximadamente 52 bilhões de dólares) nos próximos três anos para desenvolver infraestrutura de hardware de nuvem e soluções de inteligência artificial, um valor superior ao que foi destinado ao longo da última década.

As ações da Alibaba apresentaram um aumento superior a 40% neste ano, beneficiando-se do otimismo crescente em torno da inteligência artificial chinesa impulsionado pela ascensão da DeepSeek. O índice Hang Seng Tech também teve uma valorização aproximada de 12,5% no acumulado do ano.

 — Foto: Mark Schiefelbein/AP
— Foto: Mark Schiefelbein/AP

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima