ChatGPT-5: O Desempenho de Alucinações em 1,4%

Nesta quinta-feira, a OpenAI lançou o ChatGPT-5, e uma das grandes promessas destacadas pelo CEO Sam Altman foi que essa versão é a mais “poderosa, inteligente, rápida, confiável e robusta” que já foi lançada. Durante a apresentação, a equipe da OpenAI também enfatizou que o ChatGPT-5 ajudaria a “mitigar alucinações”. Mas o que isso realmente significa?

As alucinações, no contexto da inteligência artificial, referem-se a quando o AI fabrica informações. Embora as taxas de alucinação estejam diminuindo entre todos os modelos de linguagem (LLMs), esse fenômeno ainda é bastante comum e um dos principais motivos pelos quais não podemos confiar completamente na AI para desempenhar tarefas sem supervisão humana.

Assista ao vídeo completo aqui:

Clique para ver o vídeo

A plataforma Vectara, especializada em RAG-as-a-Service e agentes de inteligência artificial, que lidera o setor em testes de alucinações para modelos de fundação e raciocínio, colocou as afirmações da OpenAI à prova. Os resultados mostraram que o ChatGPT-5 de fato apresenta uma taxa de alucinação menor do que o ChatGPT-4, mas é apenas um pouco inferior ao GPT-4o (0,09% a menos, na verdade).

De acordo com a Vectara, a taxa de alucinação do ChatGPT-5 é de 1,4%, em comparação a 1,8% do GPT-4, e 1,69% do GPT-4 turbo e 4o mini, além de 1,49% para o GPT-4o.

Comparação com Outros Modelos de AI

É interessante notar que a taxa de alucinação do ChatGPT-5 foi ligeiramente superior à do modo Preview do ChatGPT-4.5, que obteve 1,2%. No entanto, ainda assim, o ChatGPT-5 foi muito mais eficiente do que o modelo de alta capacidade de raciocínio o3-mini da OpenAI, que tem uma taxa de alucinação de 0,795%.

Os resultados dos testes da Vectara podem ser consultados no Hughes Hallucination Evaluation Model (HHEM) Leaderboard hospedado no Hugging Face, que afirma: “Para um LLM, sua taxa de alucinação é definida como a proporção de resumos que alucinam em relação ao total de resumos que gera”.

O ChatGPT-5, embora ainda alucine menos que seus concorrentes, ainda não é perfeito. O Gemini-2.5-pro, por exemplo, apresenta uma taxa de alucinação de 2,6%, e o Grok-4 é muito mais alto, com 4,8%.

Controvérsias em Torno do Grok

Recentemente, a XAI, desenvolvedora do Grok, enfrentou muitas críticas devido ao seu novo modo “Spicy” no Grok Imagine, um gerador de vídeos AI que aparentemente cria vídeos deepfake de celebridades, como a Taylor Swift, mesmo quando esse tipo de conteúdo não é solicitado. A intenção do sistema é incluir filtros e moderação para evitar nudez ou qualquer coisa sexual.

Siga nosso canal @canalsegredosdodigital no Instagram e TikTok para dicas diárias sobre IA, automações e marketing digital.

Reação do Público e Futuro do ChatGPT

A OpenAI enfrentou um forte retrocesso logo após remover o ChatGPT-4 e todas as suas variações, como GPT-4o e 4o-mini, das contas Plus com o lançamento do ChatGPT-5. Muitos usuários ficaram indignados ao descobrir que os modelos mais antigos foram removidos sem nenhum aviso prévio. Alguns usuários no Reddit relataram que “perderam seu único amigo da noite para o dia”.

Parece que o ChatGPT-5 substituiu uma das versões mais confiáveis do ChatGPT (a versão 4.5) em termos de alucinações. Sam Altman rapidamente postou no X que “subestimamos quanto algumas coisas que as pessoas gostam no GPT-4o realmente importam para elas, mesmo que o GPT-5 tenha um desempenho melhor na maioria das formas”. Ele também prometeu trazer de volta o ChatGPT-4o para os usuários Plus por um tempo limitado, afirmando: “Nós iremos monitorar o uso enquanto pensamos por quanto tempo oferecer modelos legados”.

Perguntas Frequentes sobre a ferramenta

Como usar essa ferramenta de IA no dia a dia?
Você pode utilizar o ChatGPT-5 em diversas tarefas, como geração de texto, respostas a perguntas e até mesmo resolução de problemas complexos.

Essa plataforma é gratuita ou paga?
O ChatGPT-5 oferece opções tanto gratuitas quanto pagas, dependendo das funcionalidades que você deseja acessar.

Qual a principal vantagem dessa ferramenta?
A principal vantagem do ChatGPT-5 é sua capacidade de gerar respostas mais precisas e rápidas, além de reduzir as alucinações em comparação com versões anteriores.

Conheça a ferramenta apresentada no vídeo:

Acesse aqui

Palavras-chave: ChatGPT-5, taxa de alucinação, OpenAI, IA, ferramenta de inteligência artificial.

Categoria: [2] Novidades

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *