segunda-feira, 2 de julho de 2012

Cirurgia Precoce em Endocardite - Analisando um Estudo Pequeno




No último número do New England Journal of Medicine foi publicado o primeiro ensaio clínico randomizado que testou a hipótese de que cirurgia precoce reduz o risco do desfecho combinado de morte ou embolia sistêmica em pacientes com endocardite e grande vegetação em valva nativa. Este trabalho randomizou 76 pacientes para cirurgia em 48 horas da randomização ou tratamento convencional, demonstrando que o grupo cirúrgico reduziu significativamente o risco deste desfecho combinado (3% vs. 23%; P = 0.03), à custa de prevenção de evento embólico (mortalidade foi igual).

Mesmo tendo alcançado significância estatística, ensaios clínicos pequenos como este merecem uma análise crítica mais cuidadosa. Seguindo nosso roteiro de análise critica (1234, 5), vamos avaliar veracidade, relevância e aplicabilidade destes resultados.

Veracidade

O valor de P < 0.05 indica que é pouco provável que este resultado tenha decorrido do acaso. Ou seja, se a hipótese nula fosse verdadeira, a probabilidade de um resultado tão diferente entre os dois grupos (3% vs. 23%) ter aparecido aleatoriamente é de apenas 3%. Isso rejeita a hipótese nula e ficamos com a hipótese alternativa de que a cirurgia é melhor do que o tratamento convencional.

Porém seria simplório parar por aqui. Quando um estudo pequeno assim alcança significância estatística para desfechos duros ficamos a nos questionar se este valor de P representa a realidade. Revisando, o que poderia gerar um valor de P inacurado?

Primeiro, um resultado proveniente de desfecho secundário. Neste caso há o problemas das múltiplas comparações (muitos desfechos testados simultaneamente), fazendo com que haja uma maior probabilidade de significância estatística na ausência de diferença real. Não é o caso deste estudo,  pois a conclusão é baseada no desfecho primário, que foi pré-definido e o tamanho amostral dimensionado para oferecer um poder de 80%.

Segunda preocupação, um estudo truncado pode gerar um valor de P significativo, por acaso. Também não á o caso deste estudo, pois o tamanho amostral planejado de 74 pacientes foi alcançado e o seguimento hospitalar foi completado.

Sendo assim, acreditamos que o valor de P de 0.03 é representativo da realidade.

Mas ainda há um problema capcioso, mas que é real: para um estudo pequeno ter um resultado estatisticamente significante (P < 0.05) em relação a um desfecho categórico (evento ou não evento), é necessário que haja uma diferença absoluta tão grande que esta pode se tornar inverossímil.  A diferença pode ser tão inverossímil que passamos a acreditar mais na possibilidade de que o estudo caiu naqueles 3% de probabilidade desta diferença aparecer na presença da ausência de benefício real (hipótese nula verdadeira). Ou seja, aqui não estamos questionando o valor de P de 3%, este deve está certo. Mas a questão é se o estudo caiu exatamente nestes 3% de probabilidade do resultado ter aparecido aleatoriamente.

Lembram-se do estudo de Poderman, do beta-bloqueador em pré-operatório de cirurgia não cardíaca? Tinha apenas 112 pacientes e mostrou redução de mortalidade (3.4% vs. 17%, P = 0.02). Este enorme benefício é inverossímil, pois nenhuma droga cardiovascular provocou tal redução de mortalidade (nem trombólise no IAM, cuja redução de mortalidade é 1/3 desta), quanto mais beta-bloqueador em cirurgia não cardíaca. Como sabemos, estudos posteriores mostraram que esse benefício não é verdadeiro.

Portanto, devemos nos perguntar se uma diferença absoluta de 20% neste estudo é plausível. Primeiro, 23% de eventos é o que se espera de embolia sem a cirurgia? Parece que sim, de acordo com registros prévios citados pelo próprio autor. Segundo, faz sentido praticamente eliminar o risco de embolia com a cirurgia? Também parece fazer sentido, pois se a vegetação é retirada, não vai embolizar.

Portanto, este resultado não parece ter sido devido ao acaso, devemos acreditar no valor de P e acreditar que um valor de P < 0.05 sugere benefício, pois neste caso a diferença é clinicamente plausível.

Ainda resta a possibilidade dos resultados serem decorrentes de efeito de confusão ou vieses. Efeito de confusão não parece existir, pois a randomização foi suficiente para que as amostras fossem homogêneas. Quanto a vieses, nos preocupamos com o fato do estudo ser aberto poder gerar erro na aferição dos eventos embólicos (tendenciosidade). Porém estes desfechos foram definidos de forma bastante objetiva: embolia teria que ser um evento muito bem caracterizado clinicamente e demonstrado por exame de imagem. Sendo assim, é pouco provável que o resultado seja decorrente deste viés. Quanto ao tratamento, todos os pacientes do grupo cirúrgico foram operados; e apesar de que 70% do grupo convencional foram operados também, estas cirurgias foram bem tardias e todos os eventos registrados nesse grupo ocorreram antes da cirurgia. Portanto, o estudo é adequado para avaliar o benefício da cirurgia precocemente indicada.

Sendo assim, concluímos que o benefício é verdadeiro, de fato a cirurgia previne embolia sistêmica.

Relevância

Se formos calcular, ficaremos impressionados com um NNT de 5. Muito baixo, benefício de magnitude quase nunca observado. É verdade? Tal como mencionamos na postagem do estudo da tenecteplase no AVC, estudos pequenos não possuem precisão na medida do NNT.

Só de olhar o intervalo de confiança do hazard ratio percebemos a imprecisão na magnitude do benefício. Vejam, os autores descrevem um hazard ratio de 0.10, mas com intervalo de confiança que varia de 0.01 a 0.82. Vejam que imprecisão, a redução relativa do risco pode ser tão grande quando 99% a tão pequena quando 16%.  Mas a medida do hazard ratio é relativa, precisamos ir para a redução absoluta e calcular o NNT. O autor não faz isso, porém podemos calcular os intervalos de confiança com um simples software estatístico (WINPEPI, por exemplo):

Risco de embolia/morte no grupo cirúrgico = 3% (95% IC = 0.1% a 13% - que imprecisão!)
Risco de embolia/morte no grupo convencional = 23% (95% IC = 12% a 38% - que imprecisão!)

Sendo assim, a redução absoluta do risco (risco cirúrgico - risco convencional) tem o intervalo de confiança variando de 1% a 38%. Portanto, o NNT (100/RAR) pode variar de 100 (pequeno impacto) a 2.6 (impacto enorme).

Portanto, este estudo não é suficiente para nos garantir que o benefício é de grande magnitude. Isto seria importante, pois se soubéssemos que a magnitude é enorme, insistiríamos em cirurgia mesmo para pacientes de muito alto risco ou instáveis clinicamente. Mas diante da incerteza na magnitude do benefício, a escolha deve ser mais ponderada, caso a caso.

Aplicabilidade

Conhecendo os pacientes pela tabela de características clínicas, 3 aspectos julgo dignos de nota.

Primeiro, o mais óbvio: todos tinham vegetação > 10 mm, tal como definido pelo critério de inclusão. Portanto aqui nos referimos a pacientes com vegetação grande, não qualquer vegetação. Seguindo o raciocínio da postagem anterior (aplicabilidade), há razão para acreditarmos que se a vegetação for pequena, o benefício pode não existir. Como estamos falando de cirurgia cardíaca, um procedimento agressivo, os resultados não devem ser extrapolados para vegetação muito menores que isso.

Segundo, aqui não se tratam de pacientes com infecção descontrolada, sépticos, daqueles que os cirurgiões não gostam de colocar na sala. Digo isso pois os tempo sem febre teve uma mediana de 2 dias, com 75% dos pacientes com mais de um dia sem febre (intervalo interquartil = 1 – 3). Há razão para o resultado cirúrgico ser pior em pacientes sem controle da infecção? Acho que sim. Portanto, não devemos extrapolar estes resultados para pacientes com infecção descontrolada, pois o resultado cirúrgico pode não ser o mesmo.

Corroborando com esta observação, a grande maioria dos casos era por infecção estreptocócica, a mais branda de todas, sendo apenas 10% dos pacientes com infecção por estafilococos.

Conclusão

Embora o resultado seja visualmente impressionante (vide gráfico acima), nossa conclusão deve ser mais ponderada, em se considerando as características deste estudo.

Devemos indicar cirurgia precoce de rotina na endocardite de valva nativa na presença de grandes vegetações e quadro infeccioso parcialmente ou plenamente controlado (em sépticos há incerteza). Mesmo assim, considerando a imprecisão da magnitude do benefício, devemos ponderar a decisão quando nos deparamos com risco cirúrgico muito alto, desconforto do cirurgião quanto às condições do paciente ou desejo do paciente em evitar cirurgia.

Seríamos mais enfáticos na indicação se a mesma magnitude de benefício fosse demonstrada em estudo de grande porte, de maior precisão. Mas este provavelmente nunca existirá ...

Nenhum comentário:

Postar um comentário