Significatività statistica
Il valore P e l'errore beta, tra convenzioni e accettabilità.
Di Renato Luigi Rossi
Ops! Per usare il Centro di Lettura devi prima effettuare il log in!
Password dimenticata?Non hai un account? Registrati
Hai già un account? Log in
Il valore P e l'errore beta, tra convenzioni e accettabilità.
Di Renato Luigi Rossi
Dopo che si è trovata una differenza tra i due gruppi negli endpoint di un trial clinico randomizzato bisogna essere sicuri che tale differenza sia reale e non dovuta semplicemente al caso. Affermare che una differenza è vera mentre è solo un capriccio del caso realizza in statistica il cosiddetto errore alfa. Per convenzione si è deciso di accettare una probabilità di errore alfa inferiore al 5% (= 0,05). Questa probabilità viene espressa con “P”. In altri termini si può affermare che la differenza trovata per un determinato endpoint tra i due gruppi studiati è statisticamente significativa se la “P” è inferiore al 5% (P <0,05). In questo caso, infatti, si ritiene che la probabilità di una differenza puramente casuale sia bassa e che possa essere accettata.
Per esempio nello studio Ascend [1] sono stati reclutati 15.480 soggetti (età ≥40 anni) con diabete tipo 2, randomizzati a supplementi di omega-3 (1 g/die) oppure placebo. L’endpoint primario era di tipo composto: infarto non fatale, ictus, TIA, decesso da causa cardiovascolare. Il follow-up è stato in media di 7,4 anni. L’endpoint primario si è verificato nell’8,9% del gruppo omega-3 e nel 9,2% del gruppo placebo (P = 0,5). Gli autori correttamente affermano che la differenza trovata per l’endpoint primario tra gruppo trattato e gruppo di controllo non era statisticamente significativa. La P, infatti, non era inferiore a 0,05 quindi la probabilità che il risultato fosse del tutto casuale era troppo elevata.
Non è detto che un risultato statisticamente significativo sia anche clinicamente rilevante.
Il box che segue riassume i risultati e la relativa significatività statistica per vari endpoint di una metanalisi che ha confrontato terapia invasiva precoce e approccio standard nelle sindromi coronariche acute.
TERAPIA INVASIVA PRECOCE NELLE SINDROMI CORONARICHE ACUTE |
La metanalisi [2] si era proposta di valutare se la terapia invasiva precoce nelle sindromi coronariche acute senza elevazione di ST riduca gli eventi cardiovascolari e migliori la sopravvivenza. La metanalisi ha analizzato i risultati di 7 RCT (per un totale di 8375 pazienti). A un mese la mortalità totale risultava ridotta nel gruppo terapia invasiva precoce del 18%, ma non in modo statisticamente significativo (P = 0,43). A 2 anni la mortalità risultava ridotta del 25% nel gruppo terapia invasiva e questa volta in modo statisticamente significativo (P = 0,001). Sempre a 2 anni l’incidenza di infarto non fatale risultava essere rispettivamente del 7,6% nel gruppo sottoposto a terapia invasiva precoce e del 9,1% nel gruppo di controllo (differenza statisticamente significativa, P = 0,012) mentre la riduzione di questo endpoint a un mese era del 7% ma non significativa (P = 0,57). Ad un follow-up medio di 13 mesi la terapia invasiva precoce comportava una riduzione dei ricoveri per angina instabile (P <0,0001). |
Importante è considerare sempre attentamente il valore della P perché non è detto che un risultato statisticamente significativo sia anche clinicamente rilevante. Per esempio in un trial su pazienti diabetici si trova che il trattamento riduce il ricorso alla dialisi del 25% (RR = 0,75) e che il risultato è statisticamente significativo perché il valore della P è uguale a 0,049. Formalmente la conclusione è corretta. Però supponiamo che un farmaco concorrente ottenga una riduzione del ricorso alla dialisi ma che il risultato non sia statisticamente significativo perché la P è di 0,051.
Nel primo caso la probabilità di errore alfa è del 4,9% e nel secondo caso del 5,1%. Si può affermare che la differenza tra i due farmaci abbia importanza dal punto di vista clinico e cioè che col primo farmaco si ottenga un beneficio che non si ha con il secondo? In realtà, tanto più basso è il valore della P tanto più si può dire che la differenza trovata è reale. Per esempio se si trova una P <0,0001 si può essere ragionevolmente sicuri che il caso non abbia influito sul risultato in quanto la probabilità di errore alfa è davvero bassa (0,01%).
In conclusione, bisognerebbe sempre ricordare che la definizione di significatività statistica è una invenzione umana, una convenzione: per valori di P troppo vicini al cut-off (0,05) l’importanza clinica del risultato probabilmente è trascurabile.
Esiste anche l’errore beta: considerare statisticamente non significativo un risultato che invece lo è.
Per inciso si ricorda che esiste anche l’errore beta: considerare statisticamente non significativo un risultato che invece lo è. Si è deciso di accettare una probabilità di errore beta inferiore a 0,1 (= 10%). Un tipico esempio di errore beta si può avere negli studi con un numero limitato di partecipanti: si potrebbe trovare per l’outcome considerato una differenza tra gruppo trattato e gruppo di controllo non significativa dal punto di vista statistico mentre in realtà lo è.
Renato Luigi Rossi
Medico di famiglia
Bibliografia
Questo testo è tratto dal libro “Come leggere uno studio clinico” di Renato Luigi Rossi (Roma: Il Pensiero Scientifico Editore, 2021). Per gentile concessione dell’editore.
Sei risposte a sei domande sul conflitto di interesse che mina la credibilità in medicina: Marco Bobbio
A cura di Maria Teresa Busca
L’evoluzione sia scientifica che sociale ha modificato il rapporto con la natura.
Le scelte che tutelano la salute dei cittadini nei riguardi dei rischi ambientali sono difficili per le pressioni del...