Modelo de IA de Raciocínio Qwen da Alibaba Define Novos Padrões em Open Source

A equipe Qwen da Alibaba acaba de lançar uma nova versão de seu modelo de IA de raciocínio de código aberto com benchmarks impressionantes. Conheça o Qwen3-235B-A22B-Thinking-2507. Nos últimos três meses, a equipe Qwen trabalhou arduamente para aumentar o que eles chamam de “capacidade de raciocínio” de sua IA, com o objetivo de melhorar tanto a qualidade quanto a profundidade de suas análises.

Assista ao vídeo completo aqui:

Clique para ver o vídeo

O resultado dos esforços da equipe é um modelo que se destaca em desafios realmente difíceis: raciocínio lógico, matemática complexa, problemas de ciência e codificação avançada. Nessas áreas que normalmente exigem um especialista humano, este novo modelo Qwen está agora estabelecendo o padrão para modelos de código aberto.

Benchmarks Impressionantes do Qwen

Em benchmarks de raciocínio, o mais recente modelo de IA de código aberto do Qwen alcançou 92,3 no AIME25 e 74,1 no LiveCodeBench v6 para codificação. Ele também se destaca em testes de capacidade mais geral, marcando 79,7 no Arena-Hard v2, que mede como ele se alinha com as preferências humanas.

A Estrutura do Modelo de Raciocínio Qwen

No coração deste modelo de raciocínio AI está a sua enorme estrutura, composta por 235 bilhões de parâmetros ao todo. Contudo, ele utiliza o Mixture-of-Experts (MoE), o que significa que apenas uma fração desses parâmetros – cerca de 22 bilhões – é ativada ao mesmo tempo. Pense nisso como ter uma grande equipe de 128 especialistas à disposição, mas apenas os oito mais adequados para uma tarefa específica são chamados para realmente trabalhar nela.

Memória Extensa para Uma Compreensão Profunda

Uma de suas características mais impressionantes é a sua memória massiva. O modelo de IA de raciocínio Qwen possui um comprimento de contexto nativo de 262.144 tokens; uma grande vantagem para tarefas que envolvem a compreensão de vastas quantidades de informações.

Como Começar a Usar o Modelo Qwen

Para os desenvolvedores e entusiastas, a equipe Qwen facilitou o início. O modelo está disponível no Hugging Face. Você pode implementá-lo usando ferramentas como sglang ou vllm para criar seu próprio ponto de extremidade de API. A equipe também recomenda o seu framework Qwen-Agent como a melhor maneira de utilizar as habilidades de chamada de ferramenta do modelo.

Dicas para Melhor Desempenho com a IA Qwen

Para obter o melhor desempenho do seu modelo de raciocínio AI de código aberto, a equipe Qwen compartilhou algumas dicas. Eles sugerem um comprimento de saída em torno de 32.768 tokens para a maioria das tarefas, mas para desafios realmente complexos, você deve aumentar isso para 81.920 tokens para dar à IA espaço suficiente para “pensar”. Eles também recomendam fornecer instruções específicas no seu prompt, como pedir para “raciocinar passo a passo” em problemas de matemática, para obter respostas mais precisas e bem estruturadas.

O lançamento deste novo modelo Qwen oferece uma poderosa, porém de código aberto, IA de raciocínio que pode rivalizar com alguns dos melhores modelos proprietários disponíveis, especialmente quando se trata de tarefas complexas que desafiam a mente. Será emocionante ver o que os desenvolvedores vão criar com ela.

Siga nosso canal @canalsegredosdodigital no Instagram e TikTok para dicas diárias sobre IA, automações e marketing digital.

Conheça a ferramenta apresentada no vídeo:

Acesse aqui

Perguntas Frequentes sobre a ferramenta

Como usar essa ferramenta de IA no dia a dia?
Você pode utilizá-la para resolver problemas complexos, realizar análises de dados e até mesmo criar aplicações personalizadas via API.

Essa plataforma é gratuita ou paga?
O modelo é de código aberto e pode ser utilizado gratuitamente, embora algumas ferramentas associadas possam ter custos.

Qual a principal vantagem dessa ferramenta?
A principal vantagem é sua capacidade de realizar raciocínios complexos com uma grande profundidade de análise e tomando como base uma enorme quantidade de dados.

Palavras-chave: Qwen, IA de raciocínio, modelo de código aberto, Alibaba, benchmark de IA.

Categoria: [2] Novidades

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *