flag english flag italian flag french flag korean flag german flag portuguese flag saudi flag spanish flag polish flag japanese
 
 
 
 

Ce petit cours pratique est conçu pour aider les lecteurs des essais cliniques à différencier les essais qui sont susceptibles d'être valides de ceux qui ne pourraient pas l'être. Il analyse également brièvement la façon dont les thérapeutes pourraient employer les résultats des études correctement réalisées pour les aider à prendre des décisions cliniques. L'approche développée ici utilise une grande partie du "guide des lecteurs" produit par le service d'épidémiologie et de la biostatistique clinique de l'Université de McMaster et publié dans le Canadian Medical Association Journal. Les guides ont été ultérieurement mis à jour par le groupe de travail sur la médecine basée sur les preuves comme "un guide de l'utilisateur" et publié dans le Journal of the American Medical Association (Guyatt GH, Rennie D (1993) JAMA 270: 2096-2097). Les guides des utilisateurs sont fortement recommandés pour obtenir une source plus détaillée d'informations sur les essais cliniques et la pratique basée sur les preuves en général. Les points clés sont détaillés ci-dessous.

  1. Partie I: Les résultats de cet essai sont-ils valides?
  2. Partie II: Est-ce que le traitement est cliniquement utile?
 

1. Partie I: Les résultats de cet essai sont-ils valides?

Le laser à énergie réduite est-il un traitement efficace pour l'epicondylite? Est-ce que les programmes d'étirements empêchent le développement des contractures après une attaque cérébrale? Est-ce que l'utilisation des "flutter" peut réduire les complications respiratoires postopératoires? Des réponses rigoureuses à ces questions peuvent être fournies par des essais cliniques correctement conçus et correctement mis en oeuvre. Malheureusement la littérature contient à la fois des essais bien menés qui donnent des conclusions valides et des essais mal conduits qui tirent des conclusions incorrectes; le lecteur doit pouvoir distinguer les deux. Ce cours pratique décrit les points clés (ou "les filtres méthodologiques") que doit contenir un essai clinique pour être jugé comme valide.

Certaines études qui prétendent déterminer l'efficacité des traitements de kinésithérapie regroupent simplement quelques sujets avec un état particulier et prennent des mesures avant et après le traitement. Si les sujets s'améliorent au cours de la période de traitement, il est déclaré que le traitement est efficace. Les études qui utilisent ces méthodes fournissent rarement les preuves satisfaisantes de l'efficacité du traitement parce qu'il est rarement certain que les améliorations observées soient dues au traitement et non pas à des variables externes telles que l'évolution normale de la maladie, la régression statistique (qui est un phénomène statistique par lequel les gens deviennent moins "extrême" avec le temps simplement en raison de la variabilité de leur état), l'effet placebo, ou l'effet de "Hawthorne" (où les sujets rapportent des améliorations parce qu'ils pensent que c'est ce que l'investigateur veut entendre). La seule voie satisfaisante pour éviter ces pièges (remettant en cause la validité d'une étude) est d'avoir un groupe contrôle. La comparaison s'effectue alors entre les résultats des sujets qui ont reçu le traitement et les sujets qui n'ont pas reçu le traitement.

La logique des études avec groupe contrôle est que, en moyenne, les variables extérieures devraient agir autant sur les groupes traités que sur les groupes contrôles, de sorte que n'importe quelle différence entre les groupes à la fin de l'expérience devrait être due au traitement. A titre d'exemple, nous savons tous que la plupart des cas de lombalgie aiguë s'améliorent spontanément et rapidement, même en l'absence de traitement et, l'amélioration des sujets avec un traitement ne constituerait pas la preuve de l'efficacité du traitement. Une étude contrôlée prouvant que les sujets traités vont mieux que les sujets témoins constituerait une preuve plus forte attestant que l'amélioration est liée au traitement, parce que l'évolution normale de la maladie devrait s'être produite à la fois dans les groupes traités et témoins. L'observation qui montre que le groupe traité va mieux que le groupe témoin suggère que quelque chose de plus que l'évolution naturelle de la maladie s'est produit pour que les sujets aillent mieux. Notez que, dans une étude contrôlée, le groupe contrôle n'a pas besoin de ne pas recevoir de traitement. Souvent, dans des essais contrôlés, la comparaison s'effectue entre un groupe contrôle qui reçoit le traitement habituel et un groupe expérimental qui reçoit le traitement habituel plus le traitement étudié. Parfois, quelques essais thérapeutiques comparent un groupe contrôle qui reçoit le traitement habituel avec un groupe expérimental qui reçoit une nouvelle thérapie.

Il faut savoir que les groupes contrôles assurent uniquement la protection contre les biais liés aux des variables externes pour autant que les groupes traités et contrôles soient semblables. C'est seulement lorsque les groupes traités et contrôles sont en tous points semblables (mis à part le fait d'être traité ou pas) que les résultats peuvent être sûrs, et que les différences entre les groupes à la fin de l'étude sont liées au traitement. Dans la pratique ceci est réalisé en assignant de manière aléatoire la population disponible dans le groupe traité et le groupe contrôle. Ceci assure que les facteurs extérieurs tels que l'évolution naturelle de la maladie ont un effet à peu près identique dans les groupes traités et contrôles. En fait, quand les sujets sont assignés de manière aléatoire dans les groupes, les différences entre le traitement et le groupe contrôle peuvent seulement être dues au traitement ou à la chance, et il est possible d'éliminer la chance si les différences sont assez grandes - c'est ce que les statistiques font. Notez que c'est la seule voie pour assurer la que les groupes traités et contrôles sont comparables. Il n'y a aucune alternative véritablement satisfaisante à la répartition aléatoire.

Même lorsque des sujets sont aléatoirement répartis dans les groupes, il est nécessaire de s'assurer que l'effet (ou le manque d'effet) du traitement n'est pas déformé par un "biais d'observateur". Ceci est lié au fait que la croyance de l'investigateur dans l'efficacité d'un traitement peut inconsciemment dévier la mesure des résultats thérapeutiques. La meilleure protection est assurée en rendant l'observateur - en "aveuglant" s'assurant que la personne qui mesure les résultats ne sait pas si le sujet recevait ou ne recevait pas le traitement. Il est généralement souhaitable que le patient et le thérapeute soient également "aveugles". Quand des patients sont en aveugle, vous savez que l'effet apparent de la thérapie n'a pas été produit par l'effet placebo ou l'effet de Hawthorne. Rendre aveugle les thérapeutes à la thérapie qu'ils appliquent est souvent difficile voire impossible, mais dans les études où les thérapeutes sont aveugles à la thérapie (comme, par exemple, dans les essais sur le laser à basse énergie où le dispositif peut produire le laser ou une lumière colorée, et que le thérapeute ne sait pas ce qu'il applique), vous pouvez être sûr que les effets du traitement n'ont pas été produits par l'enthousiasme des thérapeutes pour le traitement, mais plutôt par la thérapie elle-même.

Il est également important que seulement quelques sujets abandonnent ("drop-out") pendant l'essai. Car les abandons peuvent sérieusement déformer les résultats de l'étude. Un véritable effet thérapeutique pourrait être masqué si les sujets du groupe témoin dont la condition empire au cours de la période de l'étude abandonnent l'étude pour rechercher un autre traitement. En effet ceci aménerait le groupe contrôle à avoir des résultats meilleurs qu'ils ne le sont réellement. Inversement, si le traitement faisait empirer l'état de santé de quelques sujets et que ces sujets quittaient l'étude, le traitement apparaîtrait plus bénéfique qu'il ne l'est réellement. Pour cette raison les abandons représentent toujours une incertitude dans la validité d'un essai clinique. Naturellement, plus il y a d'abandons, plus l'incertitude est grande - un principe de base approximatif établi que, si plus de 15% des sujets abandonnent une étude, l'étude est potentiellement sérieusement biaisée. Quelques auteurs ne répertorient tout simplement pas le nombre d'abandons. En accord avec le principe scientifique établi qui déclare coupable tant que l'innocence n'est pas prouvée, ces études doivent être considérées comme potentiellement biaisées.

Pour résumer, les essais cliniques valides sont:

· randomisés avec allocation aléatoire des sujets dans le groupe traité et le groupe contrôle
· avec un observateur aveugle, et si possible les patients et les thérapeutes également aveugles
· avec peu d'abandons.

La prochaine fois que vous lirez un essai clinique d'un traitement de kinésithérapie, demandez-vous si l'essai répond à ces critères. En règle générale, les essais qui ne satisfont pas ces critères peuvent être incorrects et ne devraient pas être considérés pour constituer des preuves fortes de l'efficacité (ou de l'inefficacité) d'un traitement. Les essais qui satisfont ces critères devraient être lus soigneusement et leurs résultats devraient être gravés dans votre mémoire !

Si vous voulez lire d'autres documents sur les moyens d'évaluer la validité d'un essai, essayer:

Guyatt GH, Sackett DL, Cook DJ (1993). User's guide to the medical literature: II. How to use an article about therapy or prevention: A. Are the results of this study valid? JAMA 270: 2598-2601.

   

2. Partie II: Est-ce que le traitement est cliniquement utile?

La section précédente a présenté une liste de critères que les lecteurs peuvent employer pour différencier les études qui sont susceptibles d'être valides de celles qui peuvent ne pas l'être. Les études qui ne satisfont pas la plupart des filtres méthodologiques sont habituellement ignorées. Cette section aborde comment les thérapeutes devraient interpréter les essais qui satisfont la plupart des filtres méthodologiques. Le message est qu'il n'est pas suffisant de regarder simplement un effet statistiquement significatif du traitement pour donner la preuve de son efficacité. Pour être satisfaisant il faut que l'essai mesure des résultats significatifs, et que les effets positifs du traitement soient assez grands pour rendre le traitement valable. Les effets nocifs de la thérapie doivent être peu fréquents ou inexistants de sorte que le traitement fasse plus de bien que de mal. Pour finir, le traitement doit être rentable.

Naturellement, pour que l'essai soit utile il doit présenter des effets thérapeutiques significatifs. Ceci signifie que les résultats doivent être mesurés d'une manière valide. C'est parce que nous jugeons habituellement la valeur de base d'un traitement comme répondant aux besoins des patients, que les résultats mesurés doivent signifiés quelque chose pour les patients. Ainsi un essai qui prouve que le laser à basse énergie abaisse le niveau de sérotonine est beaucoup moins utile qu'un essai qui prouve qu'il réduit la douleur, et un essai qui prouve que la rééducation "motor training" réduit la spasticité est beaucoup moins utile qu'un essai montrant l'amélioration de l'indépendance fonctionnelle.

La taille ou l'importance de l'effet thérapeutique est évidemment importante, mais souvent négligée. Peut-être parce que beaucoup de lecteurs d'essais cliniques n'apprécient pas la distinction entre "la signification statistique" et "la signification clinique". Ou peut-être il reflète la préoccupation de beaucoup d'auteurs des essais cliniques avec le "p<0.05". La signification statistique ("p<0.05") se rapporte à un effet thérapeutique plus grand que celui que l'on pourrait raisonnablement attribuer à la chance. C'est important (nous devons trouver que les effets observés du traitement ne sont pas seulement dû à la chance) mais seul, cela ne nous dit rien sur la grandeur de l'effet. La meilleure évaluation de la taille de l'effet d'un traitement est la différence de moyenne entre les groupes. Ainsi, imaginons un essai sur les effets de la mobilisation sur les douleurs d'épaule, mesurés par une échelle visuelle analogique de 10 centimètres. La diminution de la douleur a été en moyenne de 4 centimètres dans le groupe traité et de 1 centimètre dans le groupe contrôle. La meilleure évaluation de l'effet moyen du traitement est une réduction de 3 centimètres de l'EVA (car 4 centimètres moins 1 centimètre font 3 centimètres). Imaginons un autre essai sur les étirements des muscles avant le sport qui pourrait rapporter que 2% des patients dans le groupe traité ont été ultérieurement blessés, comparé à 4% dans le groupe contrôle. Dans ce cas notre preuve la meilleure est que l'étirement a réduit le risque de lésions de 2% (car 4% moins 2% font 2%). Les lecteurs des essais cliniques doivent regarder la taille de l'effet enregistré pour décider si l'effet est assez grand pour être médicalement valable. Rappelez-vous que les patients viennent souvent chercher un traitement pour être guéri (naturellement cette généralisation peut ne pas correspondre à tous nos domaines de pratique clinique) - la plupart ne sont pas intéressés par des traitements qui n'ont que des effets légers.

Il y a une importante subtilité en regardant la taille des effets thérapeutique. Elle s'applique aux études dont les résultats sont mesurés avec des données dichotomiques (les résultats dichotomiques peuvent avoir deux "valeurs", telle que la mort ou la survie, blessé ou non blessé, admis à la maison de repos ou non admis ; ceci diffère des variables telles que les mesures de l'EVA pour la douleur, entre lesquelles il peut y avoir n'importe quelle valeur inclue entre 0 et 10). Beaucoup d'études qui mesurent des résultats dichotomiques indiqueront l'effet de la thérapie en termes de taux, plutôt qu'en terme de différences. (Le taux s'appelle parfois "un risque relatif" ou "odds ratio" ou le "taux de risque", mais il y a parfois d'autres noms). Exprimés de cette façon, les résultats de notre étude hypothétique sur les étirements seraient présentés comme une réduction de 50% du risque de lésions (car 2% est la moitié de 4%). Habituellement le fait d'exprimer des effets de traitement à travers un taux est utilisé pour amplifier l'effet de la thérapie. La meilleure mesure est la différence entre les deux groupes. (En fait, la mesure la plus utile peut aussi bien être l'inverse de la différence. Ceci s'appelle parfois le "nombre requis pour traiter" parce qu'il nous indique, en moyenne, combien de patients nous devons traiter pour empêcher un événement défavorable - de se produire dans l'exemple des étirements le nombre de patient nécessaire au traitement est 1/0.02 = 50, ainsi un dommage sera empêché pour chaque 50 sujets étirés).

Beaucoup d'essais n'indiquent pas les effets nocifs des traitements (c'est à dire "les effets secondaires" ou " les complications" de la thérapie). C'est malheureux, parce que l'absence de description des effets nocifs est souvent interprétée comme indiquant que la thérapie ne fait aucun mal, mais ce n'est pas certains. Glaziou et Irwig (BMJ 311: 1356-1359, 1995) ont débattu sur le fait que les effets du traitement sont habituellement les plus prononcés lorsqu'ils sont donnés aux patients dans des conditions les plus graves (par exemple, l'aspiration bronchique pourrait produire une plus grande réduction de risque d'arrêt respiratoire pour un patient traumatisé crânien présentant un encombrement massif que pour un autre patient traumatisé crânien présentant un plus faible encombrement). En revanche, les risques du traitement (dans ce cas-ci, l'augmentation de la pression intra-crânienne) tendent à être relativement constants, indépendamment de la sévérité de l'état du patient. Ainsi une thérapie fait plus de bien que de mal quand elle est appliquée aux patients dans des conditions graves. Les thérapeutes devraient donc être moins enclins à donner une thérapie qui a des effets secondaires potentiellement sérieux quand le patient est moins gravement atteint.

Dans la pratique, il est souvent difficile pour les essais cliniques de détecter des effets néfastes, car ces effets tendent à se produire rarement, et la plupart des essais cliniques ont des tailles d'échantillon insuffisantes pour détecter des effets néfastes quand ils se produisent. Ainsi, même après que de bons essais contrôlés randomisées d'une thérapie aient été exécutés, il y a un grand rôle à jouer pour les études à grande échelle "surveillant" de grandes cohortes de patients traités pour démontrer que les effets néfastes ne se produisent pas trop fréquentement. Jusqu'à ce que de telles études aient été réalisées, les thérapeutes devraient être méfiants pour appliquer une thérapie potentiellement nocive, en particulier pour des patients qui ont un gain relativement faible à attendre de la thérapie.

L'évaluation critique atteint un niveau supplémentaire de sophistication lors de l'évaluation du degré d'imprécision de l'importance de l'effet offert par les essais cliniques. Des essais sont exécutés sur des groupes de sujets dont on attend qu'ils représentent certaines populations. Ceci signifie que ce que peut fournir de mieux un essai est une estimation (imparfaitement précise) de l'ampleur des effets du traitement. Les essais cliniques sur un grand nombre de sujets fournissent de meilleures estimations (plus précises) de l'importance des effets du traitement que des essais sur un petit nombre de sujets. Dans le meilleur des cas les lecteurs devraient considérer le degré d'imprécision de l'estimation en se demandant ce que l'essai clinique signifie, parce que ceci affectera souvent le degré de certitude qui peut être attaché aux conclusions tirées d'une étude particulière. Le meilleur moyen pour effectuer ceci est de calculer des intervalles de confiance de l'estimation de l'importance de l'effet du traitement, si ceux-ci ne sont pas explicitement fournis dans l'étude publiée. [Un cours pratique expliquant comment calculer et interpréter des intervalles de confiance des mesures habituelles de la taille de l'effet est en cours de préparation. En attendant le lecteur intéressé peut consulter Sim, J and Reid, N. (1999). Statistical inference by confidence intervals: issues of interpretation and utilization. Physical Therapy, 79, 186-195. Les lecteurs qui sont familiés avec calculle des intervalles de confiances peuvent trouver utile de télécharger la calculatrice d'intervalle de confiance de PEDro en cliquant ici. La calculatrice est sous forme de feuille de tableur Excel].

La dernière chose à faire pour décider de l'utilité d'une thérapie est de décider si la thérapie est rentable. C'est particulièrement important quand la santé est payée ou subventionnée, par des financements publiques. Il n'y aura jamais assez de ressources pour placer toutes les innovations dans la santé (probablement mêmes pas toutes les bonnes innovations). Ainsi le coût d'une thérapie quelconque implique que l'argent dépensé pour elle ne pourra pas être dépensé pour d'autres formes de soins. L'allocation raisonnée des fonds implique que l'argent dépensé va là où l'effet par dollar est le plus grand. Naturellement une thérapie ne peut pas être rentable si elle n'est pas efficace. Mais les thérapies efficaces peuvent être non-rentables. Les méthodes employées pour déterminer la rentabilité sont en dehors de l'expertise de cet auteur, et il est probablement mieux de se reporter à des sources plus détaillées. Si vous êtes intéressés, vous pouvez lire:

Drummond MF, Richardson WS, O'Brien BJ, Levine M, Heyland D (1997). User's guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 277: 1552-1557.
O'Brien, BJ, Heyland D, Richardson WS, Levine M, Drummond MF (1997). User's guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 277: 1802-1806.

Pour récapituler cette section, la signification statistique ne signifie pas utilité clinique. Pour être médicalement utile, une thérapie doit:

· cibler des résultats qui intéressent les patients
· avoir des effets suffisamment grands pour être valables
· faire plus de bien que de mal
· être rentable.

Si vous voulez lire plus sur l'évaluatioin de la taille d'un l'effet, vous pouvez consulter:

Guyatt GH, Sackett DL, Cook DJ (1993). User's guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 271: 59-63.

Deux autres articles (plutôt moins réputés), par l'auteur actuel, sont:

Herbert RD (2000). How to estimate treatment effects from reports of clinical trials. I: Continuous outcomes. Australian Journal of Physiotherapy 46: 229-235.

Herbert RD (2000). How to estimate treatment effects from reports of clinical trials. II: Dichotomous outcomes. Australian Journal of Physiotherapy 46: 309-313.

 
 
 

Contactez PEDro@george.org.au

La traduction par Pierre Trudelle, masseur-kinèsithèrapeute (Sociètè Franàaise de Kinèsithèrapie)