flag english flag italian flag french flag korean flag german flag portuguese flag saudi flag spanish flag polish flag japanese
 
 
 
 

Questa breve guida è strutturata in modo da aiutare i lettori di studi clinici, a distinguere tra studi validi e non. Viene inoltre spiegato brevemente quanto il terapista debba utilizzare risultati della letteratura per prendere decisioni cliniche. Molto del materiale riprodotto è stato tratto dalle "Readers' Guides", prodotte dal  “Department of Clinical Epidemiology and Biostatistics at McMaster University” e pubblicate nel Canadian Medical Association Journal.  Le “Readers’ Guides” sono state successivamente esaminate dall' "Evidence-Based Medicine Working Group” e pubblicate come "Users' Guides"  sul Journal of the American Medical Association (Guyatt GH, Rennie D (1993) JAMA 270: 2096-2097). Raccomandiamo e rimandiamo alle “Users’ Guides” chi voglia approfondire le informazioni sugli studi clinici e la pratica basata sull'evidenza in generale. Le citazioni sono riportate al termine di questa pagina.

  1. Parte I: I risultati di questo studio sono validi?
  2. Part II: Questa terapia è clinicamente utile?
 

1. Parte I: I risultati di questo studio sono validi?

Il laser a bassa energia è un trattamento efficace per l’epicondilite? Programmi di stretching prevengono lo svilupparsi della spasticità nel paziente con esiti di ictus cerebri? L’uso del “triflo” riduce le complicazioni respiratorie postoperatorie? Risposte rigorose a queste domande si possono ottenere solo attraverso studi sprimentali ben strutturati e ben condotti.  Sfortunatamente nella letteratura è possibile trovare sia studi ben impostati che giungono a conclusioni valide che no; il lettore deve essere in grado di distinguere  tra i due. Questa guida descrive gli elementi chiave (o “filtri metodologici”) che conferiscono qualità agli studi clinici.

Alcuni studi che hanno la pretesa di determinare l’efficacia di un trattamento fisioterapico si limitano semplicemente a raggruppare soggetti con una particolare condizione e ne misurano la gravità prima e dopo il trattamento. Se i soggetti migliorano dopo il trattamento, si dice che il trattamento è stato efficace. Gli studi che utilizzano questi metodi raramente forniscono evidenze soddisfacenti sull’efficacia del trattamento: infatti con questa struttura sperimentale non si può attribuire inequivocabilmente il miglioramento osservato al trattamento effettuato, piuttosto che a variabili esterne quali il recupero spontaneo, la regressione statistica (un fenomeno statistico per il quale i pazienti diventano meno “estremi” con il tempo semplicemente come risultato della variabilità delle loro condizioni), l’ effetto placebo, o l’effetto “Hawthorne” (quando i soggetti riferiscono miglioramenti perché pensano sia ciò che l’investigatore vuole sentire).  L’unico modo soddisfacente per evitare queste vere e proprie minacce alla validità di uno studio è avere un gruppo di controllo. In questo caso si potranno confrontare i risultati clinici ottenuti dal gruppo sperimentale con quelli ottenuti dal gruppo di controllo.

Il razionale degli studi controllati è che, mediamente, le variabili esterne agiscono allo stesso modo sia nel gruppo di trattamento che nel gruppo di controllo, cosicché ogni differenza fra i due gruppi alla fine dello studio sia attribuibile al trattamento. E’ ampiamente noto, ad esempio, che la maggior parte delle lombalgie si risolvono spontaneamente e rapidamente, anche in assenza di qualsiasi trattamento, pertanto la mera osservazione di un miglioramento a seguito di un intervento terapeutico non costituisce una prova dell’efficacia del trattamento. Uno studio controllato che mostrasse un più marcato miglioramento dei soggetti trattati rispetto a quelli del gruppo di controllo costituirebbe quindi una dimostrazione più forte che il miglioramento è dovuto al trattamento, dato che il recupero spontaneo sarebbe stato uguale in entrambi i gruppi.  L’osservazione che i soggetti trattati migliorano di più dei soggetti di controllo suggerisce che qualcosa in più del recupero spontaneo ha fatto migliorare i soggetti. E’ da notare che, in uno studio controllato, il gruppo di controllo non deve ricevere alcun trattamento. Spesso, negli studi controllati, il confronto è fra il gruppo di controllo che riceve una terapia convenzionale ed un gruppo sperimentale che riceve la terapia convenzionale con in aggiunta la nuova terapia. Altre volte gli studi comparano un gruppo di controllo che riceve il trattamento convenzionale con un gruppo sperimentale che riceve una nuova terapia.

Da notare è, che il gruppo di controllo protegge dagli effetti di confondimento dovute alle variabili esterne, nella misura in cui i due gruppi, quello di trattamento e quello di controllo, sono simili.  Solo quando il gruppo di  trattamento e di controllo sono paragonabili per ogni caratteristica in grado di influire sul risultato (a parte ovviamente al fatto che ricevano o meno il trattamento oggetto di studio) lo sperimentatore può essere certo che le differenze fra i gruppi alla fine dello studio siano dovute al trattamento. In pratica questo si raggiunge assegnando in maniera casuale i soggetti dello studio fra il gruppo di controllo ed il gruppo di trattamento. Questo assicura che fattori esterni quali l’estensione del recupero spontaneo abbia, circa, lo stesso effetto nei due gruppi. Infatti, quando i soggetti sono assegnati in maniera randomizzata ai due gruppi, le differenze fra il gruppo di trattamento e quello di controllo possono essere dovuti solamente al trattamento o al caso, ed è possibile eliminare il caso se le differenze sono abbastanza grandi - questo è quello che fanno i test statistici. E’ importante notare che la randomizazione è l’unico modo per assicurare la comparabilità fra gruppo di trattamento e gruppo di controllo. Non esistono alternative realmente valide all’assegnazione randomizzata.

Anche quando i soggetti sono assegnati in modo randomizzato ai gruppi, è necessario assicurarsi che l’effetto (o la mancanza di effetto) del trattamento non sia distorto da “errori dell’osservatore”. Ci si riferisce alla possibilità che la convinzione dell’investigatore dell’efficacia del trattamento possa inconsciamente distorcere la misura dei risultato del trattamento. La protezione migliore è data dalla “cecità” dell’osservatore – assicurandosi che la persona che misura i dati non sappia se il soggetto riceva o no il trattamento sperimentale. È generalmente preferibile che anche il paziente ed il terapista siano “ciechi”. Quando anche i pazienti sono “ciechi” si può essere ragionevolmente sicuri che l’effetto oservato non dipenda dall’effetto placebo o dall’effetto “Hawthorne”.  Rendere “ciechi” i terapisti alla terapia che stanno praticando è spesso difficile o impossibile, ma in quegli studi dove i terapisti sono “ciechi” alla terapia (ad esempio negli studi sui laser a bassa energia, dove lo strumento emette comunque una luce colorata, ma il terapista non è a conoscenza se in quel momento sta erogando luce laser o meno), si può attribuire l’eventuale effetto alla terapia stessa e non invece all’entusiasmo del terapista verso la terapia.

É anche importante che pochi soggetti interrompano la partecipazione ("drop-out") durante lo svolgimento dello studio. Questo perché gli abbandoni possono sviare in maniera consistente i risultati dello studio. L’efficacia di un trattamento può essere oscurata dall’abbandono dei pazienti nel gruppo di controllo dovuto ad un peggioramento delle loro condizioni durante il periodo dello studio; in questo modo la media dei risultati del gruppo di controllo appare migliore di quanto in realtà non sia. Al contrario, se il trattamentoprovoca in alcuni soggetti un peggioramento e questi lasciano lo studio, il trattamento appare più efficace di quanto non sia. Per questo motivo gli abbandoni rendono incerti in merito alla validità di uno studio clinico. Naturalmente, maggiori sono gli abbandoni, maggiore è l’incertezza - una buona regola empirica vuole che se gli abbandoni superano il 15% dei soggetti, la validità dello studio è seriamente pregiudicata.  Alcuni autori non riportano il numero degli abbandoni.  Secondo il principio scientifico di “colpevole fino alla provata innocenza”, questi studi sono da considerarsi potenzialmente non validi.

Riassumendo, uno studio clinico ben fatto:

· assegna in modo randomizzato i soggetti al gruppo di trattamento o di controllo
· rende “ciechi” gli osservatoti, i terapisti ed i pazienti
· ha pochi abbandoni

Ogni volta che si legge uno studio clinico su un trattamento fisioterapico, bisognerebbe chiedersi se lo studio ha queste caratteristiche. Come regola generale, gli studi che non soddisfano questi criteri possono non essere validi e non sono da considerarsi come forti evidenze sull’efficacia (o inefficacia) di un trattamento. Gli studi che soddisfano questi criteri devono essre letti attentamente ed i loro risultati affidati alla memoria!

Se volete ulteriori informazioni su come valutare l'idoneità di uno studio, provate:

Guyatt GH, Sackett DL, Cook DJ (1993). User's guide to the medical literature: II. How to use an article about therapy or prevention: A. Are the results of this study valid? JAMA 270: 2598-2601.

   

2. Part II: Questa terapia è clinicamente utile?

La sezione precedente ha presentato una lista di criteri che i lettori possono usare per differenziare studi che sono probabilmente validi da quelli che non lo sono. Gli studi che non soddisfano la maggior parte dei filtri metodologici vengono di solito ignorati.  Questa sezione considera come un terapista debba interpretare quegli studi  che soddisfano i filtri metodologici.  Non è sufficiente accontentarsi di un risultato statisticamente significativo.  É necessario che lo studio dimostri risultati che siano anche clinicamente rilevanti, e che gli effetti positivi siano tanto grandi che valga veramente la pena di effettuare quella terapia.  Gli effetti dannosi della terapia devono essere rari o di piccola entità, cosicché la terapia produca un vantaggio maggiore del danno.  Da ultimo, la terapia deve avere un buonn rapporto costo-beneficio.

E’ ovvio che per essere utile uno studio deve ricercare un effetto clinicamente rilevante.  Questo significa che i risultati misurati siano quelli realmente utili.  In generale, dato che di solito giudichiamo l’utilità di un trattamento in base a quanto questo soddisfa i bisogni dei pazienti, i risultati clinici da prendere in considerazione devono essere quelli che hanno un senso per i pazienti stessi.  Per questo uno studio che mostra come la laserterapia a bassa enrgia abbassi i livelli di serotonina è meno utile di uno in cui si possa dimostrare che la laserterapia riduce il dolore, ed uno studio che dimostra come l’esercizio riduca la spasticità è meno utile di uno che dimostri la sua capacità di ridurre la disabilità del paziente.

La dimensione dell’effetto della terapia è ovviamente importante, ma spesso sopravvalutato. Forse perchè molti lettori di studi clinici non tengono conto della distinzione fra “significatività statistica” e “significatività clinica”.  Forse questo riflette l’ansia per il “p < 0.05” di molti autori di studi clinici.  La significatività statistica ("p < 0.05") si riferisce all'ipotesi che l’effetto della terapia sia maggiore di quello che si può ragionevolmente attribuire al caso. Questo è importante (abbiamo bisogno di sapere se l’effetto osservato sia dovuto al mero caso) ma non ci fornisce nulla in merito alla dimensione di questo effetto.  La migliore misura della dimensione dell’effetto della terapia è la differenza media fra i due gruppi. Così se un ipotetico studio sull’effetto della mobilizzazione sul dolore di spalla, misurato con la scala analogico visiva di 10cm,  desse una riduzione di 4 cm nel gruppo sperimentale e di 1 solo cm nel gruppo di controllo, la nostra migliore misura dell’effetto del trattamento sarebbe una riduzione di 3cm della scala analogico visiva (4cm – 1 cm = 3 cm).  Un altro studio ipotetico sull'efficacia dello stretching prima dell’attività sportiva potrebbe riportare una incidenza di infortuni del 2% nei soggetti nel gruppo dello stretching ed un 4% nel gruppo di controllo. In questo caso l’evidenza è che lo stretching riduce il rischo di infortunio del 2% (4 meno 2).  I lettori di studi clinici devono considerare la dimensione dell’effetto riportato per decidere se sia suficientemente grande da essere clinicamente utile.  E' importante ricordare che i pazienti spesso vengono in terapia per ottenere la guarigione (ovviamente questa generalizzazione non è universalmente applicabile in clinica) – la maggior parte di loro non è interessata a terapie che abbiano effetti meramente marginali.

C’è un’importante aspetto della valutazione di un effetto terapeutico che riguarda quegli studi i cui risultati sono misurati con variabili dicotomiche (un risultato dicotomico può assumere un solo valore dei due possibili, come vivo o morto, ferito o non ferito, ammesso o non ammesso in casa di riposo; si noti la differenza con altre variabili [dette variabili continue, perché appunto variano con continuità] come ad esempio la scala del’analogo visivo, che può assumere qualunque valore tra 1 e 10).  Molti studi con variabili dicotomiche riportano gli effetti del trattamento in termini di ratios (rapporti), piuttosto che di differenze. (Il rapporto è talvolta chiamato “rischio relativo” o "odds ratio" o "hazard ratio", ma può avere anche altri nomi).  Espressi in questo modo i risultati del nostro ipotetico studio sullo stretching sarebbero riportati come una riduzione del 50% del rischio di infortunio (il 2% e la metà del 4%).  Di solito l’esprimere gli effetti del trattamento come “rapporti”  fa apparire più ampio l’effetto della terapia.  La misura migliore è la differenza fra i due gruppi. (Infatti la misura più usata è l’inverso della differenza. Questa è chiamata "number needed to treat" [NNT = numero di pazienti da trattare] perchè ci dice, mediamente, quanti pazienti dobbiamo trattare per prevenire un evento negativo - nell’esempio dello stretching l’NNT è 1/0.02 = 50, così un infortunio è prevenuto ogni 50 soggetti che sottoponiamo allo stretching)

Molti studi non riportano gli effetti negativi della terapia (cioè gli “effetti collaterali” o le “complicanze” della terapia).  È un vero peccato perchè il mancato riferimento degli effetti indesiderati è spesso interpretato come se la terapia non ne abbia, ma non è chiaramente questo il caso.  Glaziou and Irwig (BMJ 311: 1356-1359, 1995) hanno discusso sul fatto che gli effetti della terapia sono usualmente più forti quando riferiti a pazienti con condizioni più severe (per esempio, l’aspirazione bronchiale produce una maggiore riduzione del rischio d'arresto respiratorio in pazienti traumatizzati cranici con ritenzione catarrale copiosa piuttosto che in pazienti con ritenzione minima di catarro).  Al contrario, il rischio della terapia (in questo caso, l’aumento della pressione intracranica) tende ad essere relativamente costante senza dipendere dalla severità della condizione.  Quindi una terapia ha più benefici che danni quando applicata a pazienti in gravi condizioni, ed i terapisti dovrebbero essere più riluttanti nel portare una terapia con potenziali danni se il paziente non è in gravi condizioni.

In pratica, è spesso difficile per gli studi clinici rilevare gli eventi avversi, perchè questi tendono ad essere infrequenti,  e la maggior parte degli studi non hanno campioni di tale entità da rilevare gli eventi avversi quando accadono.  Quindi, anche quando sono stati condotti buoni studi sperimentali sull’efficacia di una terapia, acquistano rilevanza gli studi ad ampio raggio allo scopo di verificare che gli eventi avversi non avvengano troppo di frequente.  Fino a quando questo tipo di studi non viene effettuato il terapista dovrebbe essere molto cauto nell’applicare terapie potenzialmente dannose, particolarmente in quei pazienti che non possono aspettarsi grandi risultati dal trattamento.

Un ulteriore livello di sofisticazione nella valutazione critica della letteratura riguarda alcune considerazioni in merito alla misura della dimensione dell’effetto di uno studio clinico. Gli studi sono costruiti su campioni di soggetti, che ci si aspetta essere rappresentativi, di una certa popolazione. Questo significa che il meglio che uno studio può fornire è una stima (imperfettamente precisa) della dimensione dell’effetto del trattamento.  Gli studi clinici su ampi numeri di soggetti forniscono stime migliori (più precise) dell’effetto di un trattamento rispetto a studi con un numero minore di soggetti.  Idealmente i lettori dovrebbero considerare il grado di imprecisione della stima, decidendo sul merito del peso di uno studio,  perché questo spesso influenza l'ffidabilità delle conclusioni di un particolare studio.  Il modo migliore per farlo è di calcolare gli intervalli di confidenza della misura che esprime l’effetto del trattamento, se questi non sono esplicitamente forniti dagli autori.  [Una guida su come calcolare ed interpretare gli intervalli di confidenza è in corso di preparazione. Nel frattempo il lettore interessato può consultare Sim, J and Reid, N. (1999). Statistical inference by confidence intervals: issues of interpretation and utilization. Physical Therapy, 79, 186-195. I lettori che hanno dimestichezza con gli intervalli di confidenza possono trovare utile scaricare il calcolatore degli intevalli di confidenza di PEDro premendo qui. Il calcolatore è in formato di un foglio Excel (Excel  versione 97 SR-2)].

L’ultima considerazione da fare sull’utilità di una terapia riguarda il decidere se essa ha un buon rapporto costo-beneficio.  Il dato assume una paticolare rilevanza quando le cure sanitarie sono a totale carico o sono parzialmente finanziate con denaro pubblico. Non ci saranno mai abbastanza fondi da investire in tutte le innovazioni nell’ambito della salute (probabilmente neppure se ci limitiamo alle innovazioni utili).  Il costo di una qualunque terapia consiste quindi anche nel fatto che il denaro speso per essa non potrà essere speso per altri interventi per la salute.  Un'assegnazione oculata delle risorse vuole che si spenda dove il vantaggio è maggiore [in salute] per la cifra spesa.  Certamente una terapia non può avere un buon rapporto costo-efficacia se non è efficace.  Al contrario, terapie efficaci possono non avere un buon rapporto costo-beneficio.  I metodi usati per determinare il rappoto costo-beneficio sono al di là delle competenze dell’autore, ed è probabilmente meglio se rimando a fonti più autorevoli. Se siete interessati potreste leggere:

Drummond MF, Richardson WS, O'Brien BJ, Levine M, Heyland D (1997). User's guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 277: 1552-1557.
O'Brien, BJ, Heyland D, Richardson WS, Levine M, Drummond MF (1997). User's guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 277: 1802-1806.

Riassumendo questa sezione, una significatività statistica non equivale ad un utilità clinica.
Per essere utile clinicamente una terapia deve:

· agire su risultati clinici considerati rilevanti dal paziente
· avere una dimensione dell’effetto tale da valerne la pena
· dare più beneficio che danno
· avere un buon rapporto costo-beneficio

Se volete ulteriori letture sulla valutazione della grandezza di un effetto consultate:

Guyatt GH, Sackett DL, Cook DJ (1993). User's guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 271: 59-63.

Altre due pubblicazioni (molto meno autorevoli) sono:

Herbert RD (2000). How to estimate treatment effects from reports of clinical trials. I: Continuous outcomes. Australian Journal of Physiotherapy 46: 229-235.

Herbert RD (2000). How to estimate treatment effects from reports of clinical trials. II: Dichotomous outcomes. Australian Journal of Physiotherapy 46: 309-313.

 
 
 

Contattateci a PEDro@george.org.au

Tradotto in italiano da Roberto Iovine e Francesco Gambino