domingo, 19 de novembro de 2017

O Crepúsculo do Novembro Azul


Novembro vai terminando e a bela luminosidade azul do Elevador Lacerda começará a se esvair. É neste crepúsculo azul que o patologista clínico Fernando Araujo defenderá uma das mais importantes Teses de Doutorado desenvolvidas na Escola Bahiana de Medicina e Saúde Pública, sob orientação do urologista-cientista Ubirajara Barroso.

Fernando revisou sistematicamente guidelines internacionais sobre o assunto Azul, demonstrando uniformidade na recomendação de cautela quanto ao rastreamento de câncer de próstata em homens saudáveis. Depois ele saiu de congresso em congresso entrevistando médicos, e encontrou que 93% dos urologistas brasileiros e 83% dos generalistas brasileiros prescrevem rastreamento de câncer de próstata regularmente. 

Mas como algo que requer cautela tem uso tão universal?

Em outubro (“rosa”) Richard Thaler, professor da Universidade de Chicago, foi laureado com o Prêmio Nobel de Economia. Seus experimentos psicológicos demonstraram que a decisão humana carece do pensamento econômico, não temos uma boa habilidade de ponderar o valor versus o custo das nossas escolhas. 

Muitas vezes perdemos foco discutindo se algo existe ou não existe. Porém o que importa é se o que existe tem magnitude suficiente para impactar em nossas vidas. 

Uma boba discussão se faz prevalente. Alguns argumentam que o rastreamento do câncer de próstata salva vidas, outros dizem que não. Dois grandes ensaios clínicos testaram essa hipótese, um demonstrou redução de morte por câncer, outro não conseguiu demonstrar este achado. Quem é a favor do rastreamento cita o primeiro estudo, quem é contra cita o segundo estudo. Mas poucos percebem que o resultado dos dois estudos é igual: se existe benefício, este é pequeno e inferior ao custo pessoal dos homens que decidem pelo rastreamento. 

É óbvio que rastrear câncer salva algumas vidas do câncer em questão. O estudo não serve para testar o óbvio, mas sim para quantificar a magnitude do beneficio e os possíveis dados da conduta. A eventual redução de morte por câncer observada pelo primeiro estudo não é suficiente para tornar perceptível a consequente redução de mortalidade geral. Claro, existirá redução de mortalidade geral, mas esta é tão pequena que fica imperceptível em um estudo com 160.000 homens. Mas o imperceptível benefício tem um preço: para cada 1000 homens rastreados, 50 terminarão com impotência ou incontinência urinária. Parte dos rastreados terminam em biópsia, outra parte destes em cirurgia para ressecção da próstata e boa parte desses ficam sequelados. É probabilidade condicional.

Existe também o fator tempo nesta equação. O malefício, quando ocorre, é imediato. Esse malefício precoce existe em função da expectativa de um benefício que poderá surgir, porém no longo prazo. Muitos se prejudicam agora na esperança de um benefício futuro. Isso deve ser levado em conta no pensamento econômico.

A cautela sugerida pelos guidelines vem sob a forma de recomendação de que seja discutido com os pacientes se estes desejam fazer o rastreamento. Apenas devemos prescrever se for o desejo do paciente. Mas será que esta tem sido de fato uma decisão informada? Ou seja, os pacientes sabem que se aderirem ao rastreamento terão 5% de probabilidade de virem a precisar de fraldas ou próteses penianas? São informados de que o retorno desse arriscado investimento seria uma redução de mortalidade geral tão pequena que não é detectada por estudo com mais de 100.000 pacientes?

Por que tomamos decisões anti-econômicas a toda hora?

Em seu excelente ensaio sobre o Homo Sapiens, o historiador israelense Yuval Harari menciona que o maior advento de nossa espécie, responsável por termos prevalecido e dizimado outras espécies humanas, é nossa capacidade de fantasiar. Ao fantasiar, o Sapiens foi capaz de reunir grandes exércitos em torno de uma causa fictícia, coisa que outras espécies não conseguiam. Prevaleceram os fantasiosos Sapiens sobre os realistas Neandertals.

A fantasia é essencial quando precisamos reunir muitas pessoas com alto grau de motivação. Por que conseguimos reunir 30.000 pessoas na Fonte Nova torcendo e vibrando com a excelente vitória do Bahia sobre o Santos, na semana passada? Porque nós fantasiamos que Bahia é um ser concreto, algo que tem um sentido simbólico maior. Mas se for ver, tem até jogadores que foram trocados entre os dois times oponentes na temporada anterior. Não é concreto, o Bahia é uma fantasia. Uma boa fantasia que mobiliza milhares, assim como o Azul do novembro mobiliza milhões. E todos ficam felizes. 

Mas nosso Bahia, este pode até perder quase sempre, mas não deixa ninguém impotente. 

Na final década de 70, o Reverendo Jim Jones, fundador do culto Tempo dos Povos, promoveu um suicídio coletivo de 918 pessoas. Impressionante seu poder de convencimento. Com racionalidade ou pensamento econômico, ele não conseguiria fazer com que aquelas pessoas tirassem suas vidas e a de suas famílias. Mas com o pensamento fantasioso conseguimos dar valor a uma causa maior, mesmo que absurda. 

Não estou querendo falar que rastreamento de câncer é suicídio, nem comparar médicos bem intencionados a Jim Jones. Mas o que faz os homens desejarem o rastreamento é parecido: o pensamento fantasioso de que aquilo nos garantirá não morrer de câncer. Assim, somos capazes de optar por um investimento muito grande (dano) em troca de um retorno incerto (benefício).

Outra conduta muito comum, porém irracional, é gastar dinheiro na loteria. A probabilidade de ganhar é tão baixa, que só devemos jogar a menos de 20 minutos do sorteio. Pois se jogarmos antes disso, a probabilidade de morrermos antes do sorteio é maior do que de ganhar no sorteio.

Richard Thaler também menciona o “conservadorismo coletivo: uma tendência de grupos a permanecer com comportamento padrão. Uma vez que a prática se estabelece, é provável que se perpetue, mesmo na ausência de base racional.” Lembra rastreamento de câncer de próstata?

Por isso precisamos compreender de que não é pecado, nem desonestidade, promover rastreamento de câncer, pois isso decorre de algumas deficiências cognitivas naturais da mente humana. 

Mas se é questionável o benefício do rastreamento, quem se beneficia da propaganda Novembro Azul?

Também em novembro, Olavo Amaral, médico-escritor, publicou um imperdível ensaio na Revista Piauí, intitulado Novembro Cinza, em que traz interessantes fatos relacionados às campanhas de rastreamento de próstata. Sabem quem são os financiadores dessas campanhas, em diferentes países? A indústria produtora de quimioterápicos para câncer de próstata, a indústria de equipamentos cirúrgicos e, pasmem, fabricantes de fraldas descartáveis. Rastreamento aumenta frequência de biópsias, de tratamentos, de incontinências. 

Não vejo nada disso como uma grave crise. Pelo contrário, acho tudo natural. Mesmo se não houvesse interesses, os meses coloridos existiriam, mediados pela nosso desejo humano de reforçar a segurança perceptível. Mas precisamos refletir, discutir, evoluir. Rastreamento de câncer de próstata é a caricatura do pensamento médico anti-econômico. Serve para nos alertar dessa nossa natural limitação.

A observação final da Tese de Fernando é otimista. Utilizando o banco de dados de um grande laboratório nacional, Fernando analisou 2.5 milhões de pedidos de exames de PSA realizados ao longo destes últimos 10 anos. Utilizando sofisticada análise temporal, ficou demonstrado uma redução progressiva na solicitação de PSA ao longo deste período. Embora tênue, essa é uma excelente notícia. Daniel Kahneman, cientista do comportamento, costuma comentar que mudanças de comportamento tendem a ser tênues, lentas e progressivas. Não devemos esperar uma mudança abrupta.

No século XX, a revolução científica foi tecnológica. No século XXI, cabe à ciência aprimorar o processo de decisão humana. E esta nova revolução científica já começou, haja visto que o crescente reconhecimento de estudiosos do pensamento humano, como Kahneman e Thaler, ambos ganhadores do Prêmio Nobel.

No futuro, o rastreamento do câncer de próstata será visto como caricatural, assim como hoje vemos a terapia de sangria como um absurdo que em outras épocas era rotina da prática médica. Estamos em constante evolução. 

Enquanto isso, nosso Elevador Lacerda se livrará da cor azul. Esta será substituída por cores natalinas, trazendo um Papai Noel sábio, em uso de estatina há décadas pois é dislipidêmico, anti-hipertensivo pois é hipertenso e vacina de gripe pois é muito idoso. No entanto, o sábio velhinho nunca foi submetido a rastreamento de câncer de próstata, nem de doença coronária subclínica.  

______________________________________________________________________________________________


Leia também neste Blog: Precisamos do Janeiro Branco.



Conheça nosso curso de medicina baseada em evidências, clicando aqui.

domingo, 12 de novembro de 2017

O Efeito Placebo dos Stents


Um trabalho científico de qualidade merece um interpretação científica de qualidade. Não é isso que vem ocorrendo com o elegante estudo ORBITA, cuja leitura sensacionalista gerou manchetes do tipo “Stents não aliviam dor cardíaca, mostra estudo” (Folha de São Paulo) ou “Stents não melhoram sintoma de angina, diz estudo” (Revista Veja).

O ORBITA é um ensaio clínico inglês, recentemente publicado no prestigioso Lancet. Dentre os inúmeros ensaios clínicos que comparam angioplastia versus controle, este é o primeiro a cegar os pacientes quanto à alocação do tratamento. 

Ensaios clínicos prévios, todos abertos, são consistentes em não demonstrar redução de mortalidade ou incidência de infarto. Por outro lado, baseado em forte lógica e em observações abertas, acredita-se que a angioplastia contribui substancialmente no controle da angina. O ORBITA é o primeiro estudo devidamente preparado a avaliar este efeito.

Após a coronariografia e demonstração de lesão funcionalmente importante pelo FFR, pacientes com angina classe II ou III foram randomizados para angioplastia versus controle, sendo os dois grupos igualmente sedados para o procedimento. Desta forma, ficaram cegos os pacientes e seus médicos quanto à verdadeira realização do procedimento. Este avanço metodológico ajustou o resultado para um esperado efeito placebo do procedimento. 

Coincidindo com a experiência clínica, o estudo demonstrou que pacientes submetidos a angioplastia desfrutaram de melhora da angina. No entanto, de forma surpreendente, essa melhora não foi significativamente superior à melhora obtida pelo fingimento da angioplastia. Subtraindo um pelo outro, não sobrou um efeito verdadeiramente decorrente da dilatação do vaso.

Dor (angina) é um tipo de desfecho reconhecidamente susceptível ao efeito placebo. Mesmo um analgésico que tenha um mecanismo real oferece um efeito placebo adicional (o que é bom). Cientificamente, precisamos reconhecer quanto do efeito é placebo e quanto resulta do mecanismo primário do tratamento (efeito direto). 

O estudo ORBITA não detectou efeito além do placebo. 

Mas o que isso quer dizer? Isso prova que a dilatação do vaso e implante de stent não oferecem efeito anti-anginoso direto?


Interpretação de Resultado Negativo


Para interpretar um resultado negativo, devemos partir de uma premissa científica básica: experimentos científicos não se prestam a provar ausência de um fenômeno. Isso é impossível, por dois motivos. 

Primeiro, a frase “demonstrar que não existe” é uma armadilha filosófica. Se não existe, não podemos demonstrar. Segundo, para provar que algo não existe precisaríamos de  uma ferramenta observacional capaz de observar qualquer fenômeno, por menor que seja,  por mais efêmero que dure, por mais escondido que esteja. Isso não é possível.

Por exemplo, não é possível provar que não existem discos voadores. Como nenhuma observação tem lente de aumento infinita, o fenômeno pode ser tão discreto que não está sendo visto. Para demonstrar ausência, precisaríamos ser capazes de observar o infinito. Ainda não somos …

Sendo assim, o ônus da prova nunca pode estar na inexistência de um fenômeno, mas sim na existência. Isso explica a sequência do teste de hipótese. A premissa natural, nossa posição inicial, é a hipótese nula. Caso se demonstre o fenômeno, rejeitamos a nulidade e adotamos uma posição a favor da existência. Se o estudo não consregue rejeitar a hipótese nula, ficamos com a premissa básica = não sei se existe = não existe até que se prove o contrário.

Portanto, devemos evitar dizer que um estudo prova que algo não tem benefício. 

Mas vamos além nesta discussão. Quando estamos diante de uma observação negativa, precisamos avaliar qual o tamanho do fenômeno que a lente de observação do estudo era capaz de perceber. Pois o estudo é negativo para este tamanho de efeito, não tendo capacidade de sugerir inexistência de efeitos menores

O desfecho primário do ORBITA era tempo de exercício no teste de esforço, um desfecho que traduz o quanto a angina limita o paciente. Por ser um desfecho de caráter objetivo, este é muito utilizado na avaliação de efeito anti-anginoso.

O ORBITA tinha poder para detectar uma melhora de 30 segundos no tempo de exercício, decorrente da dilatação do vaso: subtraindo a melhora do grupo angioplastia pela melhora do placebo, sobraria 30 segundos. Mas o que significa 30 segundos?

Os autores partiram de evidências prévias de que o uso de drogas anti-anginosas superam o placebo em 55 segundos. Espera-se que a dilatação do vaso seja mais efetiva do que drogas. Assim, era provável que o efeito do stent fosse maior que 55 segundos. Mesmo assim, o estudo se preparou para detectar uma diferença menor que esta,  a de 30 segundos. Portanto, o ORBITA tem poder para detectar o benefício típico de intervenção anti-anginosas e até efeitos menores do que esse. 

Assim, o resultado do ORBITA pode ser resumido em duas frases:

  1. Angioplastia não promove um efeito anti-anginoso tipicamente esperado.
  2. Por outro lado, o estudo não prova inexistência de efeitos menos relevantes.

Não seria científico dizer que o estudo demonstra que “stents não melhoram sintoma de angina”.

Na verdade, o grupo stent apresentou uma melhora de 28 segundos e o grupo placebo de 12 segundos. Isso gerou um incremento de 16 segundos com a angioplastia (após subtraída do efeito placebo). Porém esse pequena melhora não alcançou significância estatística, portanto não sabemos se é real ou acaso. Mas não deixa de ser um indício de que pode haver alguma melhora. 

Vale salientar que o resultado se reproduziu de forma negativa em todos os outros desfechos secundários: escore de angina, classe funcional, qualidade de vida, tempo para surgimento de isquemia no exercício, escore de DUKE, consumo máximo de oxigênio. É um estudo consistente.

E essa é uma das utilidades de desfechos secundários. Mostrar a consistência do resultado primário. Errado é procurar um resultado positivo em algum desfecho secundário quando o estudo é primariamente negativo. Mas desfechos secundários podem reforçar o resultado primário.

De fato, é difícil encontrar algo que coloque em dúvida o resultado do ORBITA, por mais inquietante que este seja. E isso fica mais claro quando analisamos com cuidado os detalhes metodológicos.


A Veracidade do Resultado

O ORBITA é um ensaio clínico randomizado, cego para paciente, médicos e avaliadores dos desfechos, com número mínimo aceitável de pacientes (200) para gerar homogeneidade de grupos da randomização, sem potencial de viés de desempenho (cegamento, drogas utilizadas de forma semelhante), risco baixo de viés de observação (desfecho primário objetivo, estudo cego), analisado por intenção de tratar. Além destas questões clássicas, vale salientar cuidados adicionais:

  • Pacientes foram testados quanto à efetividade do cegamento e o índice foi perfeito (resposta igual entre os dois grupos quando os pacientes eram perguntados em que grupo estavam).
  • Mesmo sedados, havia um isolamento acústico que reduzia a possibilidade do pacientes ouvir o som dos procedimentos.
  • Em 69% a obstrução estava na descendente anterior, a mais importante coronária.
  • Classe funcional III (angina aos mínimos esforços) estava presente em 39% dos pacientes, sendo o restante classe funcional II.
  • Todas as lesões eram confirmadas pelo FFR como hemodinamicamente importantes e a média de estenose foi 84%.
  • Pacientes que teriam alguma lesão não angioplastada foram excluídos, evitando angina residual decorrente de outro vaso.
  • O grupo sham também manteve dupla anti-agregação plaquetária.


Surpreendente?

Na verdade, o resultado não é muito surpreendente, pois dor é muito susceptível ao efeito placebo e quanto mais complexo for o procedimento, mais forte será o placebo. Comprimido azul tem placebo mais forte que comprimido branco, placebo injetável é mais intenso que placebo oral e placebo caro é mais “eficaz” que placebo barato. 

Portanto, o resultado de que stent tem efeito placebo não é surpresa e de certa forma já havia sido demonstrado. 


Em 1960 foi publicado o primeiro ensaio clínico da história a utilizar sham no grupo controle de um procedimento cirúrgico. Coincidentemente, a doença em questão era angina do peito e o estudo foi publicado no American Journal of Cardiology. O estudo foi realizado para avaliar se uma popular cirurgia na época (ligadura da artéria mamária interna) realmente melhorava angina. Na prática, a melhora da angina relatada pelos pacientes entusiasmava os clínicos. Até que cientistas (céticos) resolveram testar a verdade. Fizeram um ensaio clínico onde todos os pacientes recebiam a incisão cirúrgica, mas apenas metade era sorteada para ligadura da artéria. O resultado? Igual ao estudo ORBITA. A melhora do grupo cirurgia também ocorreu no grupo sham. 

Portanto, já sabíamos que angina é um sintoma muito susceptível ao efeito placebo de intervenções. Porém esperávamos um maior efeito direto do stent.

E como fica a prática clínica?

Na prática clínica atual, quando o paciente tem angina estável, considera-se a intervenção coronária percutânea como um meio eficaz de melhorar os sintomas, melhor do que o tratamento clínico. Essa é uma indicação frequente. Isso muda depois do ORBITA?

Para responder a esta questão, devemos utilizar o pensamento científico bayesiano, calculando o valor preditivo negativo do ORBITA. Sendo o ORBITA um estudo negativo, qual a probabilidade de inexistência de um efeito direto minimamente relevante do stent?

Valor preditivo resulta da probabilidade pré-estudo da hipótese ser verdadeira e da qualidade do estudo. Antes do estudo, a probabilidade do stent melhorar angina era alta, com base na lógica e em estudos randomizados não cegos. O ORBITA é um estudo de boa qualidade, portanto deve ser capaz de promover uma redução desta probabilidade. Mas como partimos de uma probabilidade pré-estudo alta, terminamos com uma probabilidade pós-estudo ainda razoável. Devido à probabilidade pré-teste, o ORBITA não afasta de todo alguma melhora da angina.

Por outro lado, o ORBITA é suficiente para nos alertar que provavelmente superestimamos o benefício direto do stent na angina estável. O estudo reduz o “valor” do procedimento, colocando um pouco menos de peso neste benefício dentro de uma perspectiva econômica (benefício - custo). 

Benefício = evidência clínica x preferência do paciente
Custo = custo pessoal do paciente + custo monetário do sistema. 

Valor = benefício - custo. 

Nesta equação, o “valor” do stent ficará algo menor após o ORBITA, principalmente se a preferência do paciente pender ao tratamento clínico e/ou se o custo pessoal do paciente for individualmente grande (risco de complicações, por exemplo).

Há sempre uma questão filosófica quanto ao placebo, que já abordamos nesse Blog: se placebo promove uma melhora real, não poderíamos fazer uso disso? Bem, é interessante desfrutar do placebo quando este incrementa um tratamento que já tem efeito direto. No entanto, entraremos em um dilema ético ao propor “simular” para o paciente que algo funciona apenas para obter um efeito placebo. É uma linha tênue que se desenha entre o adequado e o inadequado.

Epílogo


A elegância do ensaio clínico ORBITA nos faz lembrar que medicina baseada em evidências nada mais é do que medicina baseada em humildade. A humildade de reconhecer que muito do que fazemos possui impacto menor do que imaginamos. Nem por isso fecharemos com a negação plena do efeito anti-anginoso do stent. Este efeito ainda é provável.

“Nudge” é um termo proposto pelo ganhador do prêmio Nobel de economia deste ano. Richard Thaler demonstrou que o pensamento humano é anti-econômico, superestimando ganho e subestimando custos. "Nudge" é um empurrãozinho que realoca nosso pensamento em uma direção menos enviesada. O resultado do ORBITA funciona como um “nudge” na direção do pensamento clínico racional.

_______________________________________________________________________



Conheça nosso curso de medicina baseada em evidências, clicando aqui.

quarta-feira, 6 de setembro de 2017

Carboidrato versus Gordura: Estudo PURE, glamour e impureza



É garantido o glamour de um estudo apresentado como destaque no Congresso Europeu de Cardiologia, com autores de renome internacional, envolvendo 135.000 indivíduos, publicado no Lancet. É a mesma garantia de sucesso que tem um blockbuster de Hollywood com autores famosos e orçamento estratosférico. Mas como sabemos, filmes de Hollywood nem sempre são os melhores, assim como estudos glamourosos nem sempre são os que trazem as melhores evidências.  

Este foi um estudo de coorte prospectiva, observacional, de amostra gigantesca, recrutada em 18 países, a maioria deles de baixo-médio nível sócio-econômico. A grande repercussão deste estudo reside no fato de que seu resultado contradiz o que se tem recomendado como dieta preventiva de eventos cardiovasculares (American Heart Association - AHA). Em resumo, houve associação entre dieta rica em carboidrato e maior mortalidade, enquanto dieta rica em gordura foi associada a menor mortalidade.

Há décadas, o AHA recomenda que a base da pirâmide alimentar seja constituída por carboidratos, enquanto o percentual de gordura deve ser < 10% das calorias totais. De fato, deve-se reconhecer que a recomendação do American Heart Association, copiada pela maioria das sociedades de cardiologia do ocidente, nunca foi embasada em evidências científicas de qualidade. Essa recomendação se baseia principalmente na plausibilidade biológica: colesterol é fator de risco para doença cardiovascular, dieta rica em gordura saturada aumenta colesterol, portanto a dieta pobre em gordura prevenirá eventos cardiovasculares. No entanto, não existem dados empíricos comprovando que a plausibilidade da dieta pobre em gordura se confirma como estratégia preventiva. Do ponto de vista epidemiológico, há apenas questionáveis estudos ecológicos e observacionais.

Portanto, é correto levantar a dúvida em relação à recomendação dietética preventiva de eventos cardiovasculares. Por outro lado, não é correto considerar que o estudo PURE tem poder de promover uma mudança de paradigma, como os autores tentam sugerir na frase conclusiva do artigo:

“Global dietary guidelines should be reconsidered in light of the consistency of findings from the present study …”

Na verdade, o estudo PURE não oferece um nível de evidência proporcional ao seu sucesso quanto à  prova de conceito de qual a melhor dieta preventiva de eventos cardiovasculares. E há duas razões para esta minha afirmação: (1) uma teórica, relacionada ao desenho observacional do estudo e (2) outra empírica, relacionada a uma interessante peculiaridade do próprio resultado do estudo que não foi discutida pelos autores.  

Considerações Teóricas quanto ao Caráter do Estudo


Não se trata apenas do PURE ser um estudo observacional, sujeito a viés de confusão. Estamos diante do maior risco de viés de confusão, que ocorre quando estudos observacionais avaliam o impacto de comportamento (behavioral studies). Isto porque comportamento tem forte associação com características de influência prognóstica, tornando impuras inferências causas a partir de associações entre exposição e desfecho. Neste sentido, o nome do estudo (PURE) soa paradoxal. Fico a imaginar como foi o processo de escolha deste nome pelos autores. Bastidores ...

Aproveitarei esse assunto para aprofundar a história do risco de viés de confusão em estudos observacionais. Na verdade, há dados mostrando uma razoável acurácia de estudos observacionais em predizer eficácia. Portanto, nem todo estudo observacional é tão impuro. Isso pode soar estranho ou diferente do que venho falando, mas explicarei.

Quando se compara de forma observacional tratamento A versus tratamento B, e a escolha destes tratamentos não tem muita associação com fatores prognósticos, estes estudos ganham mais acurácia para causalidade. Por exemplo, se comparo dois tipos de cirurgia, onde a escolha se dá pela conduta do serviço (serviço A prefere cirurgia A, serviço B prefere cirurgia B) e não pela gravidade do paciente, estes estudos tendem a ter resultados confirmados por ensaios clínicos. Mas se a cirurgia A for menos invasiva do que a cirurgia B, e a escolha se der pela gravidade do paciente, claro que haverá um imenso viés de confusão.

Portanto, há situações e situações … e aqui estamos na pior das situações em que um estudo observacional tenta inferir sobre causalidade: hábitos de vida. 

Esta é a situação responsável por equívocos históricos (vitaminas, exercício, fio dental, terapia de reposição hormonal por opção da mulher). E como sabemos, todos estes estudos observacionais apresentaram sofisticadas análises multivariadas que ajustavam para conhecidos efeitos de confusão. Se o ajuste para os “conhecidos” é imperfeito, imaginem o ajuste para variáveis de confusão desconhecidas. Tudo isso gera efeito de confusão residual. E residual não significa pequeno.

Epidemiologicamente, dieta rica em carboidratos é sinônimo de condição sócio-econômica desfavorável, tal como reforçado pelos próprios resultados do PURE: regiões mais pobres tiveram maior ingestão de carboidrato. Um indivíduo do Zimbábue que caia do cavalo ou desenvolva um câncer poderá ter um atendimento de pior qualidade no seu hospital comunitário, se comparado ao sueco que precise de assistência médica. Em paralelo, a dieta do Zimbábue é mais rica em carboidrato do que a dieta da Suécia. Isso me faz lembrar do estudo caricatural publicado no NEJM que mostrou associação do consumo de chocolate e sucesso da conquista de prêmios Nobel. Nível sócio-econômico pode explicar aquela associação representada na figura abaixo.



Mas devemos lembrar, a teorização acima é apenas um exemplo de potencial fator de confusão. No fundo, não sabemos que fatores poderiam estar agindo, há fatores previsíveis e imprevisíveis.

Confusão entre “veracidade” e “precisão”


Percebo nesta discussão que parte do glamour está na confusão entre tamanho do estudo e  sua assertividade. Um grande tamanho amostral é responsável por maior precisão do estudo, menor risco de erro aleatório, intervalos de confiança mais estreitos, associações estatísticas mais significantes. Tudo isso reduz o efeito do acaso como causador de ilusões. Mas isso não garante veracidade dos resultados.

Podemos estar com um estudo muito preciso para uma informação muito errada.

Assim, precisamos então relembrar o que é precisão. 

Se fizéssemos o mesmo estudo, com a mesma metodologia, em outras 100 amostras de 135.000 pacientes, os resultados das medidas de associação (hazard ratio) seria quase o mesmo nestas 100 amostras. A isso chamamos de precisão, o mesmo que reprodutibilidade. 

Porém a informação que sempre será a mesma pode estar errada devido a erros sistemáticos. E aqui estamos em potencial com o maior causador de ilusões epidemiológicas: o viés de confusão.

Viés é um erro sistemático, que tende a se repetir da mesma forma. Se temos um grande tamanho amostral, o erro sistemático tende a se repetir mais vezes e o achado influenciado pelo viés terá maior significância estatística. O imenso tamanho amostral amplifica estatisticamente um erro sistemático.

Será que o estudo PURE precisava mesmo de 135.000 pacientes? Fico a questionar como se chegou a este número, até porque não está descrito nos métodos o cálculo do gigante tamanho amostral. Sem dúvida esse tamanho amostral tem um impacto: glamour.

Fica a mensagem: precisão não é exatamente a mesma coisa que veracidade. 


Considerações quanto ao Resultado do Estudo


Até aqui argumentei com base em princípios da medicina baseada em evidências. Agora vem o argumento mais importante, o qual sugere que no caso específico do estudo PURE estamos tratando de um resultado decorrente de efeito de confusão.

Os autores se isentaram de comentar sobre o mais importante resultado do estudo: embora dieta rica em carboidrato se associe a maior mortalidade geral e dieta rica em gordura a menor mortalidade geral, nenhuma delas se associa a mortalidade cardiovascular, nem eventos cardiovasculares! Ou seja, a discussão a respeito de prevenção cardiovascular perde todo o sentido. Se alguém morreu ou viveu, não foi pela influência da dieta no sistema cardiovascular. Foi por outra coisa. 

Que coisa?

Quando vemos efeitos de intervenções em mortalidade geral que não são explicados por redução nos eventos específicos que explicariam o benefício na mortalidade, estamos diante de uma forte sugestão de que os resultados decorrem de efeito de confusão.

Se a prevenção (dieta rica em gordura) ou causa (dieta rica em carbo) não ocorreu por intermédio de eventos cardiovasculares, ocorreu por quê? Os estudos mostram associações com morte não cardiovascular, que podem estar representando o conjunto de condições que terão uma maior mortalidade quando a assistência médica é deficitária. Ou seja, a causa do resultado são efeitos de confusão. 

Não quero deixar este post mais longo... Desta forma, prometo que em postagem futura discutirei quando é melhor escolher o desfecho mortalidade geral ou mortalidade específica.

Mas então não seria de se esperar que a dieta rica em carboidrato tivesse maior mortalidade cardiovascular, pelos mesmos efeitos de confusão que estariam causando as outras mortes? Sim, pode ser que haja esse efeito, mas ele estaria apenas anulando uma menor mortalidade cardiovascular na dieta rica em carboidrato. O efeito de confusão poderia neutralizar um resultado que seria a favor da dieta rica em carboidrato.  

Reconheço que acabo de especular. Mas como já disse, quanto ao mecanismo de confusão exato, podemos apenas especular. Confusão é um sistema complexo, imprevisível. Embora não tenhamos como prever que os mecanismos de confusão, temos como prevenir qualquer um deles quando desejamos inferir causalidade: a randomização.


O que dizem os ensaios clínicos randomizados?


Em 2015 foi publicada pela Cochrane uma revisão sistemática dos ensaios clínicos randomizados que avaliaram a eficácia da redução de gordura saturada na dieta, tal como recomenda o American Heart Association. São 15 ensaios clínicos, com alto nível de heterogeneidade em seus resultados (I = 65% - vide post sobre meta-análise), sendo que a qualidade média das evidências foi considerada apenas moderada. É sempre bom lembrar que meta-análise de estudos de moderada qualidade não resulta em evidência de alta qualidade. Pelo contrário, fica mais incerto combinar estudos problemáticos e heterogêneos.

Portanto, devemos considerar a incerteza em relação a estes assuntos, que precisam ser explorados por melhores ensaios clínicos. Ao reconhecer esta incerteza devemos concluir que a totalidade das evidências intervencionistas nos traz mais insights exploratórios do que confirmatórios.

Mas o que dizem esses insights exploratórios? Sugerem que há um pequeno efeito benéfico na restrição de gordura saturada na prevenção de eventos cardiovasculares:

The findings of this updated review are suggestive of a small but potentially important reduction in cardiovascular risk on reduction of saturated fat intake.

Ou seja, aqui temos um grande estudo observacional, com alto risco de viés de confusão sendo comparado ao conjunto de ensaios clínicos randomizados de qualidade moderada.  Fica a critério de cada um decidir qual a tendência, mas torna-se bastante duvidoso se apostar nos resultados do PURE.

É frequente se utilizar o argumento da dificuldade de realizar estudos randomizados sobre dieta: como garantir que as pessoas randomizadas para dieta A de fato façam dieta A, e as pessoas alocadas para dieta B de fato comam B? Isso não é o mesmo que usar um comprimido. No entanto, essa colocação não leva em conta um conceito científico importante: contraste. 

O que testa conceitos é o contraste entre os grupos, e não a perfeição na execução da recomendação, que não existe em nenhum experimento. Claro que pessoas randomizadas para dieta rica em gordura vão transgredir com carboidrato em alguns momentos, porém o efeito desejado da randomização é garantir um contraste de exposição entre os grupos. Mesmo transgredindo, o grupo gordura vai comer mais gordura do que o grupo carboidrato e vice-versa. É o contraste que testa a hipótese. 

Portanto, realizar estudos intervencionistas com dieta é factível, pois estes são capazes de gerar contraste dietético e testar hipóteses. Nestes estudos estarão as respostas para nossas perguntas, não em gigantescos estudos observacionais que amplificam efeitos de confusão.


Epílogo


A antítese da medicina baseada em evidências é a medicina baseada em autoridade. A autoridade dos autores, do tamanho do estudo, do destaque no Congresso Europeu. Autoridade sob a forma de glamour. 

O glamour do estudo PURE nada tem a ver com a qualidade ou relevância da evidência. O problema é que nossa mente é mais seduzida por glamour do que pela rigidez do pensamento científico. Precisamos de novidades, mesmo que estas sejam falsas.

Esse estudo não faz evoluir o conhecimento científico a respeito de dieta preventiva de eventos cardiovasculares. Apenas confunde uma questão já carente de evidências. Este estudo, serve mais para nos lembrar que (1) precisão não é o mesmo que veracidade e (2) precisão pode ser uma forma de amplificar erros aleatórios, aumentando sua significância estatística. 

Devemos reconhecer a incerteza quanto ao impacto de carboidratos e gorduras no risco cardiovascular. Incerteza das recomendações do AHA e incertezas do impuro estudo PURE.   Por enquanto recomendações não devem ser baseadas em qualidade do alimento, mas sim quantidade, pois esta última é plausibilidade extrema. Seja carboidrato, seja gordura, o pior é quando um alimento é muito gostoso, nos fazendo passar dos limites da necessidade biológica. Comer demais reduz qualidade de vida no longo prazo.

Que sempre diferenciemos medicina baseada em evidências de medicina baseada em glamour.  Diferenciar pureza e impureza.


_______________________________________________________________________



Conheça nosso curso de medicina baseada em evidências, clicando aqui.

segunda-feira, 21 de agosto de 2017

Espiritualidade Baseada em Evidências


Potenciais benefícios clínicos da espiritualidade têm sido tema crescente de discussão. Recentemente foi publicado no JAMA um ponto de vista entitulado Health and Spirituality, escrito por autores da Universidade de Harvard. Este artigo tem sido compartilhado amplamente nas redes sociais, de forma entusiasmada, o que nos motivou a discutir este assunto.

Pessoalmente, acredito nos benefícios da espiritualidade, principalmente do ponto de vista de qualidade de vida e talvez em termos prognósticos.

Cientificamente, devo evitar o verbo “acreditar”.

Acreditar é a antítese da ciência moderna, cujo método se baseia na tentativa de refutar hipóteses plausíveis. O incômodo é que ao eliminar o verbo “acreditar” a vida parece perder parte de sua poesia. Portanto, do ponto de vista pessoal, pode ser uma boa ideia manter a prática do acreditar. Mas uma linha tênue separa o pessoal do profissional e devemos estar atentos a isso. 

Podemos também perceber a poesia do método científico, principalmente quando este se propõe a estudar coisas tão misteriosas como a espiritualidade. Ao meu modo de ver, espiritualidade e ciência se entrelaçam, e ciência pode ser vista como um modo espiritual de ser.

Sendo assim, proponho discutir ceticamente duas perguntas que não foram adequadamente abordadas pelo tão citado artigo do JAMA. Afinal, ceticismo é a base da ciência.

Qual o nível de evidência a respeito dos benefício da espiritualidade?
Qual o tamanho do efeito do benefício da espiritualidade?

Estamos Preparados?


Antes de começar a análise, trago a questão de se estamos preparados para colocar nossa espiritualidade no crivo científico?

Este é um desafio especial. Se pensar cientificamente é pouco natural e (muito) difícil e , quanto mais pensar cientificamente sobre espiritualidade. Digo isso pois muitos ritos espirituais têm aspecto religioso, no sentido do “acreditar” em uma ideologia.

Mas temos que separar duas coisas que se confundem. A fé é intrínseca de certos ritos espirituais. Por outro lado, a fé deve estar ausente das investigações de eficácia, efetividade ou eficiência destes mesmos ritos espirituais. Praticar espiritualidade e testar espiritualidade são coisas diferentes. 

Que pratiquemos agora o rito científico, de forma espiritual, científica e profissional.


O Nível de Evidência


O artigo do JAMA traz uma clara conotação de alto nível de evidência para benefícios  clínicos da espiritualidade:

“Recent studies suggest a broad protective relationship between religious participation and population heath.”

Traz também uma crítica à comunidade médica por não adotar espiritualidade de uma forma mais ampla:

“responde to these calls have been limited.”
“formal systems of collaboration between spiritual leaders and clinicians remain limited.”

De fato, caso o nível de evidência fosse alto para um relevante tamanho de efeito, a implementação de cultos religiosos ou espirituais nos hospitais e ambulatórios deveria ser obrigatório. Seria omissão não implementar.” 

Mas estamos cientificamente neste ponto?  

O mundo é repleto de ruído e a função da ciência é diferenciar sinal de ruído. Como já comentamos tantas vezes, um dos piores tipos de ruído na avaliação de causalidade é o viés de confusão. E viés de confusão está especialmente presente quando testamos o modo de ser de uma pessoa (behavioral studies) como determinante de desfechos clínicos prognósticos.

Se compararmos um grupo de pessoas espiritualizados versus outro grupo de não espiritualizados, a diferença entre esses grupos não será apenas o grau de espiritualização. Talvez o grupo espiritualizado beba menos álcool, use menos droga, se alimente melhor, coma de forma mais moderada, cuide melhor da saúde. 

Desta forma, ao observar que espiritualização se associa a melhores desfechos em saúde, devemos ter dúvida se esta é uma relação diretamente causal ou se é mediada por variáveis de confusão. Uma pessoa que mantém os mesmos bons hábitos pode ter os mesmos desfechos favoráveis mesmo não sendo espiritualizada? 

A avaliação do impacto de comportamentos é sempre acompanhada de alto risco de viés de confusão em estudos observacionais. Historicamente muitos destes estudos observacionais tiveram seus resultados positivos negados por ensaios clínicos (exercício, uso de vitaminas, uso de terapia de reposição hormonal). 

Portanto, não é surpresa que chegamos à conclusão que o modelo ideal para testar a eficácia de intervenções espirituais seja o ensaio clínico randomizado. 

Mas que sacrilégio, falar em ensaio clínico para espiritualidade … sei que alguns pensaram assim.  Por isso que questiono, estamos mesmo preparados para falar cientificamente de espiritualidade?

Neste momento volto ao artigo do JAMA. Este cita entusiasticamente o Nurses’ Health Study que seguiu 74.000 mulheres (!), mostrando que aquelas que frequentavam cultos religiosos tiveram 26% menor mortalidade! 

Em seguida reforça a possível associação causal, dizendo que a análise multivariada não atenuou a força de associação. Como se essa observação resolvesse o conhecido problema de confusão residual típica desses estudos observacionais. 

Muito elucidativo é notar que no mesmo Nurses’ Health Study (publicação de 1997) a análise multivariada também não atenuou a redução de mortalidade nas mulheres que usavam terapia de reposição hormonal (37% de redução de morte geral e 53% de redução de morte cardiovascular, mesmo depois do ajuste), mas hoje se sabe que este efeito protetor é falso, tendo o ensaio clínico WHI demonstrado aumento de eventos cardiovasculares. Será que não aprendemos ainda?

Portanto esta e outras soluções dadas pelos autores do artigo para que aceitemos as evidências observacionais como robustas não passam de sofismas anti-científicos. 

Mas será que é factível realizar ensaios clínicos com intervenções espirituais? Em uma rápida revisão no PubMed, pesquisei a palavra espiritualidade no título e 9.000 artigos foram detectados. Quando restringi a pesquisa a ensaios clínicos randomizados com paravra espiritualidade no título, ficaram 28 trabalhos que avaliam diferentes formas de intervenções espirituais, em diferentes tipos de condições clínicas. 

Portanto, a realização de ensaios clínicos é factível em várias circunstâncias, tem sido feito e precisa ser um modelo de estudo melhor explorado. 

O que dizem os ensaios clínicos?

Avaliando minha rápida pesquisa o PubMed, testemunhei ensaios clínicos positivos (mindfulness em enxaqueca) e outros negativos (religiosidade e depressão), não me parecendo uma clara predominância numérica de nenhum dos tipos. Mas o principal achado é que este corpo de evidência ainda é insuficiente, visto que a maioria dos estudos são ensaios clínicos pequenos, que quando positivos devem ser melhor interpretados como geradores de hipótese e quando negativos não afastam um real benefício. 

Os autores do artigo do JAMA também cita ensaios clínicos, mas nitidamente apresenta um viés de citação, visto que só relata trabalhos positivos. Isso pode estar sendo mediado pelo viés de confirmação de suas prováveis crenças.

Em paralelo, procurei na Cochrane revisões sistemáticas sobre o tema e estas concluem por um baixo nível de evidência a respeito do assunto. Pore exemplo, uma revisão sobre o efeito de intervenções espirituais e religiosas para pacientes terminais conclui:


"We found inconclusive evidence that interventions with spiritual or religious components for adults in the terminal phase of a disease may or may not enhance well-being. Such interventions are under-evaluated."

Há várias formas de intervenções espirituais para serem testadas, assim como diferentes desfechos, variando desde aqueles relacionados à esfera de bem estar como desfechos prognósticos. A maioria destes ensaios clínicos se refere a desfecho de bem estar, como qualidade de vida, aceitação da finitude, etc. Estes são desfechos importantes, mas devemos notar que sabemos menos ainda sobre os desfechos prognósticos. 

Naturalmente, se temos um baixo nível de evidência para a prova do conceito do benefício da espiritualidade, maior ainda é a incerteza quanto ao tamanho do efeito. 

Epílogo


Segundo Carl Sagan “ciência é não só compatível com espiritualidade, é uma profunda fonte de espiritualidade.” Louis Pauster falou “um pouco de ciência nos afasta de Deus, muito nos aproxima.”

Praticar espiritualidade é algo pessoal e não precisa de demonstração científica. Recomendar uma prática espiritual como parte de um tratamento ou definir que o sistema de saúde deve investir nesta causa é um ato profissional e necessita de comprovação científica. Que as duas coisas não se confundam, como me parece ter ocorrido no tão festejado artigo do JAMA.

Dada a importância do tema espiritualidade para a humanidade, este deve ser tratado com imensa reverência científica. Muito temos que aprender e para isso precisamos reconhecer a incerteza de nosso conhecimento. Penetrar cientificamente em seus mistérios será mais fascinante do que adotar uma crença precipitada. 


_______________________________________________________________________


Conheça nosso curso de medicina baseada em evidências, clicando aqui.