Benchmarks em IA médica — o que realmente significa dizer que um modelo 'passou no USMLE'
Quando uma manchete diz que um modelo foi melhor que médicos numa prova, ela parece encurtar o debate inteiro em um número. O problema é que benchmark não é prática clínica, e desempenho em teste não equivale a confiabilidade no mundo real.