Intervallo di confidenza
Come misurare l’entità dell’imprecisione del risultato e determinarne l’importanza clinica e la riproducibilità di un risultato.
Di Renato Luigi Rossi
Ops! Per usare il Centro di Lettura devi prima effettuare il log in!
Password dimenticata?Non hai un account? Registrati
Hai già un account? Log in
Come misurare l’entità dell’imprecisione del risultato e determinarne l’importanza clinica e la riproducibilità di un risultato.
Di Renato Luigi Rossi
Gli intervalli di confidenza di una misura di efficacia (AR, NNT o RR) indicano l’entità dell’imprecisione del risultato. In pratica l’intervallo di confidenza si esprime con un range entro cui viene a trovarsi la misura di efficacia con una probabilità del 95% (= IC95%). Questo significa che se si ripetesse per cento volte la stessa sperimentazione si troverebbero cento valori diversi della misura di efficacia considerata: 95 di questi valori si situerebbero entro l’intervallo di confidenza, mentre 5 si troverebbero al di fuori di esso. In inglese questo stesso parametro viene chiamato “Confidence Interval 95%” (CI95%).
Nella maggior parte degli studi l’intervallo di confidenza viene riportato per il rischio relativo (RR). La rappresentazione grafica dell’intervallo di confidenza si ottiene costruendo una tabella a due colonne: la colonna di sinistra rappresenta il braccio di trattamento, quella di destra il braccio di controllo, la linea verticale che separa le due colonne corrisponde all’unità (cioè alla parità). Si possono verificare quattro eventualità:
Questa figura esemplifica quanto appena esposto.
Figura. Rappresentazione grafica di RR e IC95%
Nel primo caso l’RR puntuale è di 0,75 e l’IC95%, andando da 0,60 a 0,90, è sempre minore di 1. Si dirà quindi che con il trattamento si ottiene una riduzione del rischio relativo del 25% e che tale riduzione è statisticamente significativa in quanto nella migliore delle ipotesi è del 40% e nella peggiore del 10%.
Nel secondo caso l’RR puntuale è di 1,28 e l’IC95% va da 1,15 a 1,40: qui si dirà che il trattamento aumenta il rischio del 28% e che il dato è statisticamente significativo (nella migliore delle ipotesi tale aumento è del 15%, nella peggiore del 40%).
Nel terzo caso con il trattamento si ottiene una riduzione del rischio del 13%, tuttavia il dato non è significativo in quanto l’IC95% interseca la linea di parità: in pratica con il trattamento si potrebbe ottenere una riduzione del rischio del 40% oppure un aumento del 12%. Lo studio non permette di stabilire se l’intervento è migliore o peggiore del controllo.
Nel quarto caso il trattamento comporta un aumento del rischio del 12%, tuttavia anche qui l’IC95% interseca la linea di parità: nel migliore dei casi il trattamento porta a una riduzione del rischio del 15%, nel peggiore a un aumento del 25%. Lo studio non permette di stabilire se l’intervento è migliore o peggiore del controllo.
Gli intervalli di confidenza consentono quindi di determinare la significatività statistica di un risultato, così come lo permette il valore della “P”. Detto in altre parole, se si trova un IC95% che comprende il numero “1” si deve considerare che il valore trovato per l’RR (sia esso favorevole o sfavorevole al trattamento) è dovuto al caso. Oltre a questo vantaggio l’IC95% permette di determinare anche l’importanza clinica e la riproducibilità di un risultato. Tanto più l’intervallo di confidenza è stretto tanto più l’intervento è riproducibile, tanto più è lontano dalla linea di parità tanto più è verosimile che il risultato sia clinicamente rilevante.
Per esempio se si trova che un determinato trattamento riduce il rischio di infarto del 30% (RR = 0,70) con un IC95% compreso tra 0,60 e 0,99 si può dire che il dato è statisticamente significativo, ma forse clinicamente poco importante perché la riduzione potrebbe essere molto piccola dato che l’estremo di destra dell’intervallo è vicinissimo all’unità. In un altro studio invece si trova che il rischio di frattura femorale nel gruppo trattamento è di 0,65 con un IC95% compreso tra 0,60 e 0,69. In questo caso possiamo dire che l’intervento è ben riproducibile (IC95% stretto) e clinicamente importante (IC95% lontano dall’unità).
Come detto all’inizio l’IC95% viene calcolato di solito per il rischio relativo, ma potrebbe benissimo essere determinato anche per altre misure di efficacia come il rischio assoluto (AR) e l’NNT. Per esempio in uno studio si può trovare che il rischio assoluto nel braccio di trattamento è del 5% con un IC95% compreso tra 4,5% e 5,5%, mentre nel braccio di controllo l’AR è del 7% con un IC95% compreso tra 6,5% e 7,5%. In un altro studio l’NNT puntuale può risultare di 80 con un IC95% compreso tra 60 e 100: nella migliore delle ipotesi basta trattare 60 pazienti per evitare un evento, nella peggiore se ne devono trattare 100. Nello studio WOSCOPS [1] furono arruolati 6595 soggetti con ipercolesterolemia, randomizzati a placebo oppure pravastatina. L’endpoint primario erano gli eventi coronarici (infarto non fatale o decesso da coronaropatia). Dopo un followup di quasi 5 anni l’endpoint primario si manifestò nel 7,9% del gruppo placebo e nel 5,5% del gruppo pravastatina. Gli autori riportarono una RRR del 31% con un IC95% compreso tra 17 e 43. Questo è un modo alternativo di riportare le misure di efficacia. In effetti l’RR è dato da 5,5/7,9 = 0,69 (RRR = 1 – 0,69 = 0,31 = 31%). L’IC95% espresso in modo usuale è compreso tra 0,57 e 0,83.
Infine, a scopo dimostrativo, nel box “The SPRINT trial” si riporta una sintesi dello studio SPRINT [2]. In questo caso viene usato l’hazard ratio (HR) al posto di RR. L’HR verrà trattato in un capitolo successivo, per il momento lo si può considerare simile (ma non uguale) all’RR.
The SPRINT trial | Nello studio SPRINT sono stati arruolati 9361 pazienti con valori di pressione arteriosa sistolica maggiori o uguali a 130 mmHg e ad alto rischio cardiovascolare. Per essere arruolati i pazienti dovevano avere almeno uno dei seguenti fattori di rischio: malattia cardiovascolare sintomatica o asintomatica, nefropatia o velocità di filtrazione glomerulare compresa tra 20 e 59 ml/ min/1,73 m2, rischio cardiovascolare a 10 anni (calcolato con il metodo di Framingham) superiore o uguale al 15%. Sono stati esclusi i pazienti diabetici e quelli con ictus. I partecipanti sono stati randomizzati a due diversi target di pressione sistolica: inferiore a 120 mmHg e inferiore a 140 mmHg. L’endpoint primario era composto da: infarto miocardico, sindrome coronarica acuta, ictus, insufficienza cardiaca o morte cardiovascolare. Lo studio è stato interrotto anticipatamente dopo un follow-up medio di poco più di 3 anni in quanto si è visto che il trattamento intensivo riduceva in modo statisticamente significativo l’endpoint primario: 5,2% versus 6,8% (HR 0,75; IC95% 0,64- 0,89). Anche la mortalità totale, che non era un endpoint primario, risultava ridotta nel gruppo in trattamento intensivo: 3,3% versus 4,5% (HR 0,73; IC95% 0,60-0,90). Tuttavia questi benefici devono essere valutati alla luce di possibili effetti collaterali. Il trial ha infatti evidenziato una maggiore frequenza, statisticamente significativa, di episodi gravi di ipotensione, sincope ed eventi avversi renali gravi nel gruppo trattato con terapia intensiva.
Renato Luigi Rossi
Medico di famiglia
Bibliografia
1. Shepherd J, Cobbe SM, Ford I et al. for the West of Scotland Coronary Prevention Study Group. Prevention of coronary heart disease with pravastatin in men with hypercholesterolemia. N Engl J Med 1995; 333: 1301-8.
2. The SPRINT Research Group. A randomized trial of intensive versus standard blood-pressure control. N Engl J Med 2015; 373: 2103-16.
Questo testo è tratto dal libro “Come leggere uno studio clinico” di Renato Luigi Rossi (Roma: Il Pensiero Scientifico Editore, 2021). Per gentile concessione dell’editore.
Disuguaglianze sociali e cattiva salute. Dall’ultimo libro di Luca Carra e Paolo Vineis, Il capitale biologico
L’empatia è sia un’abilità da apprendere e coltivare sia una qualità del cuore: la nota di Richard McQuellon
La cura richiede competenze emotive per poter andare incontro alla sofferenza del paziente senza troppa distanza difensiva. La nota...