A Anthropic anunciou o lançamento do Claude 3.7 Sonnet, um modelo de inteligência artificial (IA) que emprega uma abordagem híbrida, combinando respostas rápidas com a capacidade de realizar uma análise mais aprofundada de questões complexas. Este modelo é reconhecido como uma inovação no setor ao apresentar recursos que não são amplamente disponíveis em outras ofertas do mercado.
O Claude 3.7 Sonnet oferece respostas em tempo real, permitindo que os usuários ativem um modo de raciocínio avançado, com o qual a IA pode dedicar um tempo maior para estruturar suas respostas. Essa estratégia visa simplificar o acesso aos modelos de IA, eliminando a necessidade de escolha entre várias opções com diferentes custos e capacidades.
O modelo está disponível para todos os usuários, mas as funcionalidades de raciocínio avançado são exclusivas para clientes que optarem por planos pagos. Usuários da versão gratuita terão acesso apenas às capacidades básicas.
Diferenciais do Claude 3.7 Sonnet
O custo do Claude 3.7 Sonnet é de 3 dólares por milhão de tokens de entrada e 15 dólares por milhão de tokens de saída. Embora mais caro em comparação a modelos concorrentes, como o o3-mini da OpenAI e o R1 da DeepSeek, que custam 1,10$/4,40$ e 0,55$/2,19$, respectivamente, o Claude se destaca por sua combinação de respostas instantâneas e raciocínio aprofundado, diferentemente de seus concorrentes que são voltados exclusivamente para raciocínio.
Em futuras atualizações, a Anthropic planeja introduzir a capacidade de o Claude decidir autonomamente o tempo a ser dedicado a cada pergunta. Dianne Penn, responsável pelo produto e pesquisa da empresa, afirmou que o objetivo é criar uma experiência mais integrada que combina raciocínio aprofundado com outras funcionalidades como parte de uma interface coesa.
Uma característica marcante do Claude 3.7 Sonnet é o "bloco de notas visível", que permite aos usuários acompanhar o raciocínio da IA na maioria das interações. Embora algumas partes possam ser ocultadas por questões de segurança, a ferramenta proporciona uma visão clara de como a IA chega a suas conclusões.
Nos testes de avaliação de desempenho, o Claude 3.7 Sonnet obteve precisão de 62,3% no SWE-Bench, que mede tarefas de engenharia de software, superando o o3-mini da OpenAI, que teve 49,3%. No TAU-Bench, que avalia interações no varejo, atingiu 81,2%, enquanto o modelo o1 da OpenAI alcançou 73,5%.
Além disso, a nova versão do Claude apresentou uma redução de 45% nas recusas desnecessárias ao responder, se comparada ao modelo anterior, Claude 3.5 Sonnet.
Introdução do Claude Code
Com o lançamento do Claude 3.7 Sonnet, a Anthropic apresentou também o Claude Code, uma ferramenta voltada para programadores, permitindo que os usuários executem tarefas diretamente no terminal. No momento, o Claude Code está em fase de testes, disponível para um grupo seleto de usuários.
Em demonstrações, foi mostrado que o Claude Code pode analisar projetos com comandos simples, como "Explica a estrutura deste projeto". A ferramenta facilita a modificação de código utilizando linguagem natural, descrevendo cada alteração, testando erros e publicando alterações diretamente no GitHub.
Os primeiros usuários relataram resultados positivos, indicando que o Claude 3.7 Sonnet conseguiu resolver problemas de programação que outros modelos de IA não conseguiram. Um usuário mencionou que a IA desenvolveu um "projeto completo em que estava trabalhando há meses - 5000 linhas de código, interface, exemplos de debug, tudo do zero".
Leia também: