segunda-feira, 20 de abril de 2015

O jogo das hipóteses e a confusão do Estudo PROMISE


O ensaio clínico PROMISE foi apresentado em março no congresso do American College of Cardiology e simultaneamente publicado no New England Journal of Medicine. Passadas algumas semanas, começo a perceber interpretações equivocadas destes estudo, que nos serve de gancho para uma interessante discussão a respeito do que chamo de jogo das hipóteses científicas. 

O PROMISE estudou 10.000 pacientes com indicação de pesquisa de doença coronária, randomizados para duas estratégias de investigação não invasiva: teste anatômico (tomografia de coronárias) ou funcional (teste ergométrico, cintilografia miocárdica ou eco-estresse). O objetivo foi avaliar a influência da estratégia de investigação nos desfechos cardiovasculares. 

Não houve diferença alguma entre os dois grupos na incidência do desfecho primário (3.3% versus 3.0%). A despeito disso, estranhamente, muitos estão interpretando o resultado do PROMISE como indicativo de que a melhor estratégia é a avaliação funcional. Vejam nos exemplos abaixo, como há uma conotação negativa para a tomografia de coronária. Ou uma conotação positiva para testes funcionais. 

UpToDate: A randomized trial compared coronary computed tomographic angiography (CCTA) and functional testing and clinical outcomes over a median follow-up of two years were similar for both groups. We continue to recommend functional testing as the initial test for most patients with suspected coronary artery disease.

The Heart: CT angiography does not reduce coronary events compared with functional tests.

A razão destes estranhas interpretações está no jogo das hipóteses. Mas antes de explicar o que ocorreu neste trabalho, vamos revisar os diferentes testes de hipóteses que se adequam a ensaios clínicos randomizados: superioridade unidirecional, superioridade bidirecional e não inferioridade. O uso de hipóteses inadequadas gera vieses cognitivos de interpretação do resultado, como veremos a seguir. 

Os 3 Tipos de Hipóteses


A superioridade unidirecional é o tipo que estamos mais acostumados e se aplica quando precisamos demonstrar a eficácia de uma estratégia para que se justifique sua utilização. Esta eficácia diz respeito a duas situações: (1) uma conduta deve ser superior à ausência de conduta; (2) uma conduta nova deve ser superior a uma conduta antiga quando esta conduta antiga já teve sua eficácia anteriormente comprovada. Estas duas situações se diferenciam pelo grupo controle. No primeiro caso, o grupo controle é não fazer a conduta (placebo, sham ou controle aberto). No segundo caso, o grupo controle é a estratégia tradicional. 

Embora o teste estatístico de comparação seja sempre bicaudal nesta situação, o ônus da prova é unidirecional, pois o único resultado que influencia nossa conduta médica é a superioridade da nova proposta.

Antes de indicar reposição para pessoas que tem vitamina D baixa, precisamos demonstrar que esta estratégia é eficaz clinicamente, comparada a placebo. Este é exemplo da ausência de estratégia como grupo controle. Por que eu faria vitamina D se esta não fosse superior a não fazer vitamina D? Percebam que o ônus da prova está na superioridade.

Já o estudo PARADIGM-HF pretendeu demonstrar que LCZ696 é melhor que enalapril na insuficiência cardíaca. É um exemplo de que no novo precisa se provar melhor do que o antigo que já foi comprovado no passado. É o que se chama de eficácia comparativa. Por que eu trocaria enalapril por esse tal de LCZ696 se este não fosse superior? Não há vantagens práticas desta nova droga, e provavelmente ela viria com um maior custo. Mesmo se tivesse um custo igual, o tradicional é comprovado há muitos anos, está dando certo e já somos experientes com enalapril. Então porque mudar? Não haveria porque mudar se o LCZ696 fosse apenas igual ao enalapril. 

A segunda situação que discutiremos é da hipótese de não inferioridade. Esta se aplica quando já existe uma conduta tradicional comprovada e a nova proposta traz alguma vantagem prática (mais simples de usar, mais segura, menos traumática). Neste caso, a nova proposta não precisa ser mais eficaz do que a tradicional, só precisa não ser muito pior. Daí testamos sua não inferioridade. Vejam postagem antiga sobre este tipo de desenho.

É o caso de demonstrar que um novo anticoagulante (que não necessita de controle do TP) é não inferior ao cumarínico; demonstrar que o fondaparinux (que sangra menos) é não inferior à enoxaparina; ou a tentativa mal sucedida do recente trial BEST em demonstrar que intervenção coronária percutânea com stent everolimus (tratamento menos traumático) é não inferior à cirurgia de revascularização. 

Por fim, temos uma situação menos frequente, que é a superioridade bidirecional, o caso do estudo PROMISE. Nesta situação, temos duas estratégias e não há uma grande preferência por uma delas. Ambas são não invasivas; se considerarmos o funcional mais utilizado, a cintilografia, ambas as estratégias oferecem ao paciente uma certa dose de radiação. Se por um lado a tomografia usa contraste, a cintilografia às vezes usa dipiridamol (que causa grande desconforto). E por aí vai, vantagens e desvantagens para os dois lados. 

Do ponto de vista prático, há pacientes que se adequam melhor a uma estratégia, outros à outra estratégia. Mas se houver uma estratégia superior em eficácia, esta será a primeira opção independente de questões de ordem prática. E isso valerá para qualquer dos lados. O ônus da prova é bidirecional.

Aí vem o desvio de hipótese promovido pelo estudo PROMISE. Inadequadamente, os autores descreveram um objetivo unidirecional, "testar a hipótese de que o prognóstico de pacientes submetidos ao teste anatômico seria superior aos pacientes submetidos ao teste funcional". Não há razão para que o ônus da prova esteja na tomografia. Mas o desvio na descrição da hipótese gerou o fenômeno de ancoragem cognitiva na maioria dos leitores. 

Ancoragem Cognitiva


Este fenômeno cognitivo foi primeiro demonstrado por Daniel Kanheman e Amos Tvesky, dois psicólogos israelenses que ganharam o prêmio Nobel por descreverem nosso principais vieses cognitivos. Em um de seus experimentos, Kanheman pergunta a um grupo de competentes corretores se eles acham que o valor de um certo imóvel avaliado é maior ou menor que 10 milhões de dólares. Após responderem, os voluntários recebem uma segunda pergunta: e quanto você acha que vale o imóvel? A média da resposta foi algo como 7 milhões. Em seguida, ele mostra o mesmo imóvel a um segundo grupo de competentes corretores, só que troca a primeira pergunta. Desta vez, pergunta se o apartamento vale mais ou menos que 1 milhão de dólares. Isto fez com que a média da resposta à segunda pergunta fosse 3 milhões. Percebam que a primeira pergunta induziu a resposta da segunda pergunta. A segunda pergunta foi “ancorada” pelo efeito da primeira pergunta. 

Observem que especialistas em apartamento estavam na ilusão de que decidiam o preço baseado em sua experiência. Na verdade, morro de medo de pessoas que se acham muito experientes (especialistas), pois estas esquecem do benefício da dúvida e abrem a guardam para vieses cognitivos. 

E foi isso que aconteceu com o estudo PROMISE. A hipótese colocou o ônus da prova na tomografia de coronária e no momento em que esta não conseguiu se provar melhor, a negatividade do resultado ancorou a tomografia para um status abaixo dos exames funcionais. Parece um erro primário cometido por especialistas que escrevem o UpToDate. Mas assim são os vieses cognitivos, nos influenciam de forma inconsciente. É por isso que o pensamento científico precisa ser organizado de uma maneira cuidadosa.

Se reconhecemos esta hipótese do PROMISE como bidirecional, podemos reformular a interpretação. Se nenhuma estratégia foi superior, temos a liberdade de escolher a que melhor se adeque ao paciente.

O PROMISE nos mostra que vieses não provém apenas da metodologia dos trabalhos. Às vezes, o viés está em nossa mente, de maneira involuntária. Tenho dito que o raciocínio científico deve ser permeado pela humildade em reconhecer a incerteza de nossas crenças. A segunda razão para humildade é reconhecer as armadilhas de nosso pensamento. 

5 comentários:

  1. Sensacional avaliação. Especialmente o comentário ''Na verdade, morro de medo de pessoas que se acham muito experientes (especialistas), pois estas esquecem do benefício da dúvida e abrem a guardam para vieses cognitivos. '' Infelizmente vemos muito isso. A opinião do ''especialista'' ser superior aos dados existentes, baseados em crenças que muitas vezes conduzem à condutas duvidosas e pouco efetivas.

    ResponderExcluir
  2. Os autores do PROMISE discutem os avanços em diagnóstico por imagem na cardiologia e sua custo-efetividade. Partindo deste pressuposto não poderíamos considerar tratar PROMISE com o raciocínio feito no PARADIGM-HF? Ou seja, não deveríamos supor que a simples introdução de um novo método traz gastos que neste caso não seriam justificados pelos benefícios? Isso tornaria correto o raciocínio feito pelos autores quando decidiram a forma de comparação. Ou estou caindo em uma armadilha mais trivial que a ancoragem cognitiva?
    Agradeço por mais esse artigo e aguardo resposta.

    ResponderExcluir
  3. Mais um ótimo post Prof. Luis.
    Um dado que achei interessante neste trial foi o fato de terem ocorrido quase o dobro de revascularizações no grupo da TC ( 6,2% x 3,2% ) sem que isso se traduzisse em benefício clínico. É claro que o estudo não foi desenhado para isso, mas podemos levantar a hipótese de que o uso da TC leva a mais revascularizações desnecessárias.
    Além disso, creio que as recomendações de que deva-se seguir com exames funcionais primeiramente baseiam-se na premissa de que não deve-se revascularizar um vaso sem que haja comprovação de isquemia associada. Desta forma, parece sensato realizar o teste funcional primeiro e, se houver isquemia, parte-se para o teste anatômico.

    ResponderExcluir
  4. Boa lembrança Luis! Compartilho com você esse "medo" da absoluta certeza de alguns!
    Grande abr Ricardo Chalhub

    ResponderExcluir
  5. Concordo com análise do professor, mas ousaria insinuar que em comparação com a cintilo, a relação de custo benefício e eposição à radiação pode não parecer tão diferente, mas se comparássemos com Eco de estresse com ESFORÇO teríamos uma análise diferente. Menor custo, SEM exposição a drogas ou à radiação.
    Mas é operador dependente, vão dizer... Mas isso nunca parece ter afetado o desempenho em comparação com cintilo ou mesmo neste trabalho, direi...

    ResponderExcluir