Gli endpoint
Che cosa sono. E cosa differenzia gli endpoint "veri" da quelli "surrogati", e gli "hard" dai "soft". Lo spiega Renato Luigi Rossi.
Ops! Per usare il Centro di Lettura devi prima effettuare il log in!
Password dimenticata?Non hai un account? Registrati
Hai già un account? Log in
Che cosa sono. E cosa differenzia gli endpoint "veri" da quelli "surrogati", e gli "hard" dai "soft". Lo spiega Renato Luigi Rossi.
In maniera semplificata, ma efficace, possiamo definire gli endpoint (conosciuti anche come “esiti” o “outcome”) in questo modo: “quello” che alla fine dello studio gli autori si sono proposti di misurare. Per esempio se si sta testando un farmaco per l’ipercolesterolemia si può valutare, al termine del follow-up, di quanto il trattamento ha ridotto i valori iniziali di colesterolo rispetto al placebo oppure rispetto al farmaco di paragone. Allo stesso modo se si sta valutando l’efficacia di un farmaco per il diabete si può decidere di misurare di quanto si riduce il rischio di comparsa di insufficienza renale o di retinopatia diabetica.
Questi due esempi mostrano che esistono sostanzialmente due tipi di endpoint: quelli detti “veri o maggiori” e quelli “surrogati”. Esempi di endpoint maggiori sono i decessi, gli infarti, gli interventi di rivascolarizzazione coronarica, il numero di fratture, ecc. Sono esiti clinici molto importanti che influenzano in modo rilevante la vita dei pazienti. Gli endpoint surrogati, al contrario, sono per esempio il valore dell’emoglobina glicata o del colesterolo, la riduzione della pressione arteriosa o l’incremento della massa ossea misurato tramite densitometria.
Un’altra classificazione degli endpoint li suddivide in “hard” e “soft”. Spesso si usa il termine hard per indicare gli endpoint veri o maggiori. In realtà un endpoint hard, a essere rigorosi, è un parametro di facile misurazione, come per esempio il numero di infarti o di decessi, ma anche la riduzione del colesterolo o dell’emoglobina glicata. Invece un endpoint soft è un parametro di misurazione più difficile e che spesso è anche soggettivo: per esempio il miglioramento della sintomatologia o della qualità di vita in un paziente con asma o con artrite reumatoide. Per rendere maggiormente oggettivo un endpoint soft si usano di solito degli score o dei sistemi a punteggio.
Alcuni distinguono anche gli endpoint intermedi (per esempio la frequenza di comparsa di crisi asmatiche o la distanza percorsa dal paziente con claudicatio intermittens). Sono detti intermedi perché non sono clinicamente rilevanti come gli endpoint maggiori, ma sono comunque un obiettivo da perseguire.
Si comprende facilmente che gli endpoint maggiori sono quelli più importanti per valutare l’efficacia di un trattamento. Gli endpoint surrogati sono più facili da misurare: un conto è condurre uno studio per diversi anni per determinare se un farmaco riduce la mortalità o i ricoveri, un altro predisporre un trial che si limita a valutare la riduzione della pressione arteriosa o della colesterolemia dopo pochi mesi di terapia.
Gli endpoint surrogati sono più comodi per i ricercatori e si usano spesso perché si ritiene che siano in qualche modo correlati agli endpoint maggiori. Per esempio è logico ritenere che se un farmaco riduce la pressione arteriosa questo si tradurrà in un beneficio clinico (riduzione dell’ictus o dello scompenso cardiaco). Se un farmaco antivirale al decimo giorno di trattamento facilita la clearance del sars-cov-2 si può ritenere che sia anche utile nel ridurre i ricoveri in terapia intensiva o la mortalità. Gli endpoint surrogati sono molto utili nelle prime fasi di studio di un farmaco. Se si sta valutando un farmaco antipertensivo o antidislipidemico è ovvio che il primo requisito che si deve misurare è la riduzione della pressione arteriosa o del colesterolo. In seguito, negli studi successivi, si procede però a determinare endpoint veri che hanno un maggior peso clinico. Infatti non è detto che a un miglioramento di un endpoint surrogato corrisponda un miglioramento di un esito clinico rilevante.
In generale un endpoint surrogato può essere accettato come valido se è ben dimostrata la sua correlazione con endpoint maggiori. Per esempio nel caso dell’epatite cronica C si accetta come endpoint di uno studio la clearance del virus per 6 mesi perché è dimostrato che vi è una relazione forte tra questo endpoint e la regressione della malattia. Un esempio molto suggestivo e sempre citato a proposito degli endpoint surrogati è lo studio Cast. Nel trial vennero usati due farmaci antiaritmici per prevenire le aritmie ventricolari pericolose che possono complicare un infarto miocardico. Lo studio dimostrò che nel gruppo trattato vi era, in effetti, una riduzione delle aritmie rispetto al braccio placebo, tuttavia si notò anche che in questo gruppo vi era un eccesso di mortalità (probabilmente a causa di un’attività proaritmica dei farmaci). Questo studio dimostra che non necessariamente il miglioramento di un endpoint surrogato (le aritmie all’ecg) comporta anche dei benefici clinici. Qualcuno parlò di “effetto cosmetico sull’ecg”.
Un altro esempio si può trovare nello studio Choir in cui erano stati reclutati 1432 pazienti con anemia da insufficienza renale cronica, randomizzati a ricevere epoietina alfa con un target di emoglobina di 13,5 g/dl (n = 715) oppure di 11,3g/dl (n = 717). Dopo un follow-up medio di 16 mesi l’endpoint primario composto (morte, infarto miocardico, ricovero per scompenso cardiaco e stroke) si verificò più frequentemente nel gruppo che doveva raggiungere il target di emoglobina più elevato (125 eventi versus 97 eventi; hazard ratio 1,34; IC 95 per cento 1,03-1,74; p = 0,03). Lo studio dimostra chiaramente che il miglioramento di un endpoint surrogato (in questo caso la concentrazione di emoglobina) non sempre si traduce in un miglioramento di outcome clinici rilevanti (in questo caso addirittura si assiste a un peggioramento).
Un esempio altrettanto didattico è fornito dallo studio Illuminate. In questo studio vennero somministrati torcetrapib (un inibitore della cholesterol ester transfer protein) oppure placebo in soggetti a elevato rischio di eventi cardiovascolari. Il farmaco ridusse il colesterolo ldl del 24,9 per cento e aumentò, mediamente, il colesterolo hdl del 72,1 per cento, tuttavia il trial venne sospeso anticipatamente. Infatti l’analisi a interim dimostrava un eccesso di mortalità del 58 per cento nel gruppo trattato rispetto al gruppo di controllo.
L’analisi a interim è una procedura di sicurezza prevista mentre il trial è in corso: i dati preliminari vengono costantemente controllati e se il numero di eventi in un braccio supera una certa soglia rispetto all’altro braccio lo studio viene sospeso. La sospensione può avvenire perché nel braccio di trattamento vi è un eccesso di eventi (come nel caso dello studio Illuminate) oppure se l’eccesso si verifica nel braccio di controllo. Nel primo caso il razionale della sospensione è ovvio: non si può continuare a somministrare un farmaco che appare più rischioso del placebo o del farmaco di paragone. Nel secondo caso la sospensione è dovuta al fatto che non sarebbe etico continuare lo studio privando i soggetti arruolati nel braccio di controllo di un trattamento efficace.
Tuttavia l’interruzione precoce di uno studio decisa dal “safety board” può portare da una parte a un’enfatizzazione dei benefici del trattamento, dall’altra a non evidenziare eventuali effetti collaterali. Si supponga, per esempio, di studiare contro placebo un farmaco che potrebbe ridurre l’incidenza di frattura in donne con osteoporosi post-menopausale. Lo studio viene programmato per durare 4 anni, ma già dopo 2 ci si accorge che effettivamente il farmaco riduce in maniera significativa le fratture femorali per cui il trial viene interrotto. L’analisi dei dati evidenzia, però, anche un aspetto negativo: nel gruppo trattato vi è un aumento dei casi di nefropatia grave rispetto al gruppo di controllo. L’aumento tuttavia non è significativo dal punto di vista statistico e il dato passa in seconda linea, ma potrebbe diventarlo se lo studio durasse i 4 anni programmati. L’interruzione precoce, in questo caso, non permette di valutare appieno il rapporto tra benefici e rischi del farmaco.
Un punto critico quando si decidono gli endpoint di un trial è quello dei criteri diagnostici. Per alcuni endpoint, come per esempio la mortalità totale, non è necessario specificare alcun criterio diagnostico. Ma se uno studio si propone di determinare di quanto un farmaco migliorerà la sintomatologia dell’artrite reumatoide si dovranno usare dei criteri di valutazione standardizzati (per esempio intensità del dolore determinata con uno score oppure numero delle riacutizzazioni definite in modo preciso in un certo periodo di tempo, ecc.).
Anche la valutazione non dei decessi totali ma dei decessi specifici (vale a dire quelli dovuti ad una specifica patologia) necessita di essere standardizzata. In mancanza di questo si potrebbero verificare difficoltà interpretative. Per esempio, si ipotizzi uno studio che si proponga di valutare la mortalità da cancro prostatico in soggetti con neoplasia iniziale sottoposti a prostatectomia o vigile attesa. Si dimostra che l’intervento riduce la mortalità specifica ma non quella totale. Una spiegazione potrebbe essere che lo studio non ha una potenza statistica tale da determinare un qualche impatto sulla mortalità totale (per esempio per casistica limitata). Un’altra spiegazione, però, potrebbe essere che nel gruppo di intervento i decessi imputabili a complicanze post-operatorie immediate o tardive (setticemie, embolie polmonari, ecc.) non vengono contati come decessi da cancro prostatico.
Questo problema è stato sottolineato da vari esperti e riguarda soprattutto i trial sugli screening oncologici. Molti sostengono che l’unico endpoint da considerare quando si valuta l’efficacia di uno screening oncologico è l’impatto sulla mortalità totale. Considerare la mortalità specifica può essere fuorviante perché questo endpoint può essere inficiato da una “errata classificazione” diagnostica e potrebbe portare a un’enfatizzazione dei benefici dello screening.
Renato Luigi Rossi
Medico di famiglia
Questo testo è tratto dal libro “Come leggere uno studio clinico” di Renato Luigi Rossi (Roma: Il Pensiero Scientifico Editore, 2021). Per gentile concessione dell’editore.
Non si tratta di politica. Non si tratta di preservare lo status quo o di avere paura di creare scompiglio. Tutto...
È il momento di ringraziare i medici di medicina generale, non di demoralizzarli: Martin Marshall, presidente del Royal college...
A cura di Maria Teresa Busca
Non ha nulla a che vedere con l’eutanasia e il suicidio medicalmente assistito: l’obiettivo...