Blog

O que é alucinação em modelos de IA — e por que todo médico precisa entender isso

Modelos de linguagem como ChatGPT, Claude e Gemini produzem texto plausível, não verdade verificada. Essa distinção sutil tem consequências clínicas pesadas — e quase ninguém está contando para os médicos.

O que é alucinação em modelos de IA — e por que todo médico precisa entender isso

Modelos de linguagem como ChatGPT, Claude e Gemini produzem texto plausível, não verdade verificada. Essa distinção sutil tem consequências clínicas pesadas — e quase ninguém está contando para os médicos.


O residente, a referência perfeita e o DOI que não existia

Imagine a cena. Um residente de clínica médica está escrevendo a discussão do TCC. Ele precisa de uma referência sobre manejo de insuficiência cardíaca em pacientes com doença renal crônica avançada. Abre o ChatGPT e pergunta: "Me dê 3 referências recentes sobre HF management in advanced CKD."

A resposta chega em segundos. Três referências completas — com autores reais, journals reais, anos plausíveis e DOIs formatados impecavelmente. O residente copia, cola na bibliografia e segue a vida.

Uma semana depois, o orientador clica no DOI da segunda referência. A página retorna 404. Ele tenta no PubMed. Nada. Tenta pelo nome do primeiro autor combinado com o journal. O autor existe. O journal existe. O artigo? Nunca foi publicado.

A IA inventou uma referência que parecia real em cada detalhe — e a entregou com a mesma confiança com que entregaria uma referência verdadeira.

Isso não é um bug raro. Isso é o comportamento padrão do modelo quando ele não "sabe" a resposta. E se isso acontece com uma referência bibliográfica — onde o erro é rastreável —, imagine o que acontece com uma dose de medicação, uma interação farmacológica ou um critério diagnóstico, onde o erro pode ser silencioso.

O que é "alucinação", tecnicamente

Alucinação, no contexto de modelos de linguagem, é a geração de conteúdo factualmente incorreto, inventado ou não-verificável, apresentado com a mesma confiança de conteúdo correto (Ji et al., 2023).

Repare no que essa definição diz e no que ela não diz. Ela não diz que o modelo errou por acidente. Ela diz que o modelo produziu algo inventado com confiança. Essa é a diferença clínica crucial: num cenário humano, quando um médico não sabe algo, ele hesita, qualifica, encaminha. Quando um LLM não sabe, ele produz texto plausível como se soubesse.

Note

Alucinação não é um defeito — é uma propriedade emergente de como LLMs são treinados. O modelo foi otimizado para produzir texto provável, não texto verdadeiro. A diferença entre essas duas coisas é sutil na maioria dos contextos e perigosa em todos os contextos clínicos.

Por que o nome "alucinação" é enganoso (e ao mesmo tempo útil)

O termo "alucinação" sugere anomalia, algo que deveria ser raro. Mas em LLMs, é um comportamento esperado do sistema. Alguns pesquisadores preferem o termo confabulação — e a analogia clínica é reveladora.

Na síndrome de Korsakoff, o paciente preenche lacunas de memória com narrativas coerentes e detalhadas, sem consciência de que está inventando. Ele não está mentindo — ele está produzindo a melhor história que o cérebro dele consegue montar com a informação disponível. Não há intenção de enganar, não há percepção do erro. A narrativa simplesmente parece real.

É exatamente isso que um LLM faz. Ele não "sabe" que está inventando, porque ele não tem modelo interno de "verdade" separado do modelo de "linguagem". Ele produz a sequência de palavras mais provável dado o contexto — e quando a sequência provável não coincide com a realidade, nasce a alucinação.

Por que isso acontece

Para entender alucinação, vale entender o que um LLM efetivamente faz — sem entrar em matemática, mas sem simplificar a ponto de perder o mecanismo.

Um modelo de linguagem foi treinado sobre quantidades imensas de texto (livros, artigos, sites, fóruns) para aprender padrões estatísticos de linguagem. Quando você faz uma pergunta, ele não "busca" a resposta numa base de dados. Ele prevê a próxima palavra mais provável, depois a seguinte, depois a seguinte — até produzir um texto que, estatisticamente, se parece com o tipo de resposta que existiria no seu treinamento.

Quando há dados suficientes no treinamento sobre aquele tópico, a previsão tende a ser factualmente correta. Quando não há — ou quando os dados são ambíguos, contraditórios ou escassos —, o modelo faz o que sempre faz: produz texto provável. A diferença é que, dessa vez, o texto provável não é verdadeiro.

E o modelo não sinaliza essa diferença. Não há indicador interno de certeza. A confiança aparente é a mesma.

O que o médico assumeO que o LLM realmente faz
Busca informação em fonte confiávelPrevê a próxima palavra mais provável
Responde "não sei" quando não sabeProduz texto plausível independente de saber
Cita referências que existemPode gerar referências bem-formatadas inexistentes
Distingue fato de invençãoNão tem modelo interno dessa distinção

Tipos de alucinação que um médico vai encontrar

Na prática clínica e acadêmica, as alucinações mais comuns não são respostas absurdas — são respostas quase certas, e por isso muito mais perigosas. Um levantamento multinacional recente com clínicos encontrou que mais de 90% já identificaram alucinações médicas em ferramentas de IA, e 85% consideraram que havia risco de dano ao paciente (Kim et al., 2025).

Os tipos mais frequentes:

Referência bibliográfica inventada. Autor real, journal real, ano plausível, DOI formatado — artigo inexistente. É o tipo mais fácil de detectar (basta buscar o DOI) e o mais perigoso em contexto acadêmico, porque pode contaminar uma cadeia de citações.

Dose ou posologia errada com confiança alta. O modelo produz "amoxicilina 500mg 8/8h por 7 dias" com a mesma confiança com que produziria a dose correta para outra indicação. Se a dose estiver errada, nada no formato sinaliza o erro.

Diretriz fictícia. O modelo mistura recomendações de duas diretrizes diferentes (por exemplo, misturando critérios da AHA com os da ESC) e apresenta como se fosse uma fonte única e coerente.

Interação medicamentosa invertida. "Não há interação significativa entre X e Y" — quando a interação é clinicamente relevante. Ou o contrário: alertar para interação inexistente.

Critérios diagnósticos misturados. Aplicar critérios de uma entidade a outra, com formatação perfeita (lista numerada, fontes, tudo "certo").

Warning

Um LLM pode te entregar um dado de dose de medicação com duas casas decimais de precisão — e estar inventando. A precisão aparente não é sinal de veracidade. Essa é talvez a informação mais importante para um profissional de saúde levar desta trilha.

Por que isso é diferente de um erro humano

A diferença crítica não é que a IA erra mais ou menos que o médico — é que ela erra de um jeito que engana mais.

Quando um colega te dá uma informação errada, normalmente há sinais: hesitação, qualificação ("acho que é isso, mas confere"), ou pelo menos o reconhecimento implícito de que pode estar errado. Um LLM produz erro e acerto com o mesmo tom, a mesma formatação, a mesma confiança. Não há inflexão, não há ressalva, não há "espera, deixa eu confirmar."

Isso ativa um fenômeno chamado viés de automação — a tendência humana de confiar mais numa ferramenta automatizada do que no próprio julgamento ou no de um colega. Um estudo de 2024 mediu essa taxa de concordância com recomendações incorretas de IA e encontrou que não-especialistas são significativamente mais suscetíveis ao viés, mas mesmo especialistas não estão imunes (Kücking et al., 2024).

Para o profissional de saúde, isso é duplamente perigoso. Primeiro, porque a IA pode parecer mais "segura" que um colega (ela não demonstra incerteza). Segundo, porque a pressão de tempo no contexto clínico reduz a capacidade de verificação — que é exatamente quando o viés de automação mais atua.

Como mitigar: o que funciona e o que não funciona

O que não funciona sozinho

Algumas estratégias que parecem razoáveis, mas não resolvem o problema:

Pedir para a IA "ter certeza". Isso muda a formulação da resposta, não a veracidade. O modelo pode adicionar "tenho certeza" ou "posso confirmar" sem que isso signifique qualquer coisa.

Usar o "modelo mais caro" ou "mais recente". Modelos maiores alucinam menos em média, mas não eliminam o problema. A arquitetura fundamental é a mesma.

Definir temperatura em zero. Reduz variabilidade, mas não elimina alucinações. O modelo ainda pode convergir deterministicamente para a resposta errada.

Confiar porque "é o ChatGPT Plus" ou "é o Claude Pro". O plano de assinatura não altera o mecanismo de geração. Um modelo pago alucina da mesma forma que um gratuito.

O que funciona

Pedir citação verificável e conferir a citação. Esse é o teste mais simples e mais negligenciado. Se a IA cita um artigo, busque o DOI. Se cita uma diretriz, abra a diretriz. Isso leva minutos e filtra a maioria das alucinações graves.

Usar ferramentas com RAG (Retrieval-Augmented Generation). RAG é uma arquitetura que obriga o modelo a consultar documentos reais antes de responder, ancorando a geração em fontes verificáveis. Ferramentas como o NotebookLM do Google usam essa abordagem. A IRIS, plataforma de apoio à decisão clínica da Humaniza Health, foi construída sobre RAG exatamente por isso — toda resposta é ancorada em evidência clínica rastreável. Vamos explorar RAG em profundidade no post dedicado da trilha.

Perguntar a mesma coisa de formas diferentes. Se a resposta muda substancialmente quando você reformula, é sinal de instabilidade factual — a informação provavelmente não está bem-ancorada no treinamento.

Saber quando NÃO usar IA. Algumas tarefas são categoricamente inadequadas para LLMs sem RAG: dose de medicação em caso raro, diagnóstico diferencial de emergência, interação de drogas com margem terapêutica estreita. Quando o custo do erro é alto e a verificação é difícil, o caminho seguro é a fonte primária.

Tip

Uma boa heurística: se você não consegue verificar a resposta em menos de 2 minutos, não confie nela. Use a IA como ponto de partida, não como veredicto.

Limites do que sabemos

Seria desonesto encerrar sem as ressalvas.

Alucinação não é um "bug a ser consertado na próxima versão". É uma propriedade do paradigma atual de modelos de linguagem. Modelos estão ficando melhores — alucinam menos com mais treinamento, contextos maiores e técnicas como RLHF — mas o problema não foi eliminado e não há previsão de que será enquanto a arquitetura base permanecer a mesma.

Os benchmarks que medem alucinação ainda são imperfeitos. Pesquisadores recentemente argumentaram que os benchmarks médicos mais usados (como MedQA, baseado no USMLE) apresentam problemas significativos de validade de constructo — ou seja, podem não estar medindo o que afirmam medir (Alaa et al., 2025). Quando você lê "GPT-X acertou 90% do USMLE", esse número precisa ser lido com cautela.

Além da alucinação, há outro risco que este post só pode mencionar mas não cobrir: o uso de dados de pacientes em plataformas de IA levanta questões sérias de LGPD e privacidade. Esse tema terá um post dedicado na Onda 1 desta trilha.

O que você leva desta leitura

A alucinação é o primeiro conceito desta trilha porque é o conceito que muda a forma como você usa qualquer ferramenta de IA. Não para parar de usar — mas para usar sabendo o que está embaixo.

Três ideias para carregar:

Primeira: o LLM não busca verdade — ele prevê texto provável. Quando as duas coisas coincidem, parece mágica. Quando não coincidem, parece confiável e está errado.

Segunda: a precisão do formato (DOI correto, dose com decimais, lista estruturada) não é indicador de veracidade. É indicador de boa estatística de linguagem. São coisas diferentes.

Terceira: a melhor defesa não é evitar a IA — é verificar o que ela produz com o mesmo rigor que você aplicaria a qualquer outra fonte clínica. UpToDate não substitui senso clínico. IA também não.

A IA não mente. A IA também não sabe a verdade. Entender essa diferença é a primeira habilidade clínica de quem quer usar IA em saúde.

Próximo passo na trilha

Na próxima semana sai o post "Qual é a tecnologia por trás da inteligência artificial?", que dá o chão conceitual do que tratamos aqui. Depois entramos em LLMs e depois em RAG — onde o problema da alucinação começa a ter uma resposta prática.

Se você ainda não leu, vale conferir o post de apresentação da trilha, que explica o caminho inteiro. E, quando quiser enxergar a série completa na V0, use o filtro editorial /pt/blog?category=guia-ia-saude.

Referências

  1. Ji Z, Lee N, Frieske R, et al. Survey of Hallucination in Natural Language Generation. ACM Computing Surveys. 2023;55(12):248. doi:10.1145/3571730
  2. Kim Y, et al. Medical Hallucinations in Foundation Models and Their Impact on Healthcare. arXiv. 2025. arXiv:2503.05777
  3. Kücking F, Hübner U, et al. Automation Bias in AI-Decision Support: Results from an Empirical Study. Stud Health Technol Inform. 2024;317:298-304. doi:10.3233/SHTI240871
  4. Alaa A, Hartvigsen T, et al. Medical Large Language Model Benchmarks Should Prioritize Construct Validity. arXiv. 2025. arXiv:2503.10694. Aceito na ICML 2025.