flag english flag italian flag french flag korean flag german flag portuguese flag saudi flag spanish flag polish flag japanese
 
 
 
 

臨床試験が有効かどうかを見分けるのに、この短いチュートリアルをご利用ください。また、ここでは治療者が臨床的判断をする ために、適切に実施された研究結果をどのように用いているかについて簡潔に触れます。ここで用いたアプローチは、マックマスター大学の臨床疫学と生物統計学学科(Department of Clinical Epidemiology and Biostatistics at McMaster University)によって開発され、カナダ医学協会誌(Canadian Medical Association Journal)で発表された「Readers' Guides」から、多くを借用しています。その手引きは、その後Evidence-Based Medicine Working Groupによって「Users' Guides」として改定され、アメリカ医学協会誌(Journal of the American Medical Association)で発表されました(Guyatt GH, Rennie D (1993) JAMA 270: 2096-2097)。臨床試験や一般的な根拠に基づく治療に関する詳細な情報源として、このUsers' Guidesを強くお勧めします。引用文を下に示します。

  1. パート I: この試験の研究結果は妥当か?
  2. パート II: その治療は臨床的に有益か?
 

1. パート I: この試験の研究結果は妥当か?

低出力レーザーは外側上顆炎の治療に有効でしょうか?ストレッチプログラムで脳卒中後の拘縮の進行を予防できるでしょうか?フラッターバルブの使用により、手術後の呼吸器合併症 を削減できるでしょうか?それらの問いに対する厳密な回答は、適切にデザインされ、適切に実施された臨床試験によってのみ提供されます。残念ながら文献の中には、妥当な結論を導いた適切な臨床試験と、妥当でない結論をだした不適切な臨床試験があります。読者はこれらを区別できなくてはなりません。このチュートリアルでは、妥当性のある臨床試験(または方法論的フィルター)の重要な特徴を挙げています。

理学療法の効果を決定することを目的とした研究には、ある症状を有する対象者の集団を集めて治療前後の症状の重症度の測定をするだけのものもあります。対象者が 治療期間中に改善した場合、その治療は有効であったといわれます。このような方法を採用した研究では、治療効果の十分な根拠を提供することはほとんどありません。なぜなら、その観察された改善は治療によるものであり、自然治癒や統計的な回帰(対象者の状態のばらつきの結果として、単に時間経過とともにより“極度”でなくなってしまうという統計的現象)、 プラセボ効果、あるいはホーソン効果(対象者が、調査者はなにを聴取したいかということを考慮することで結果が向上する)といった剰余変数によるものではないということが確かではないためです。研究の妥当性を脅かすそれらの要因を取り除くには対照群をおき、治療を受けた対象者と治療を受けなかった対象者間の結果を比較することが唯一の解決法となります。

比較試験の論理は、平均的に、剰余変数が治療群と対照群の両方に同程度作用するはずであり、試験終了時おける群間の違いはすべて治療によるものであると考えられるところにあります。一例として、多くのぎっくり腰は治療しなくても、自然かつ急速に緩和することはよく知られており、対象者が治療過程において改善したことを示すだけでは、治療の効果を論証することにはなりません。治療した対象者が対照となる対象者よりも改善したことを示した比較研究は、治療により改善したとするより強い根拠となります。なぜなら、自然回復は治療群と対照群の両方に作用するはずだからです。治療群が対照群よりも改善したという観察結果は、対象者の回復には自然回復以外の要因があることを示しています。比較研究においては、対照群がどのような治療も受けないことが必須ではないということに注意してください。比較研究では、一般的な治療を受ける対照群と一般的な治療に加えた治療を受ける実験群の間での比較が多く行われます。また、一般的な治療を受ける対照群と、新しい治療を受ける実験群と比較する試験もあります。

治療群と対照群が類似している限りにおいて、対照群の役割は剰余変数の交絡因子を除外するだけであるということが重要です。治療群と対照群が治療を受けるかどうかの違いを除いてすべての点で同一であるときに初めて、実験者はその試験の終了時における群間の違いが治療によるものであると確信できるのです。診療の場においては、対象者を無作為に治療群と対照群に割りつけることによって可能になります。このことにより、自然回復等の背景因子の効果は群間での違いがないと言えます。 実際、対象者が無作為に割りつけられている場合、治療群と対照群の違いは治療による違いか偶然による違いに限られ、もしその違いが十分に大きければ統計的検定によって偶然による違いを除外することができます。この方法においてのみ、治療群と対照群の比較可能性が確保されるということに注意してください。

対象者が無作為に割りつけられている場合でも、治療効果(あるいは効果のなさ)が観察者のバイアスによって歪められているのではないことを確認する必要があります。このことは、実験者が治療の効果を信じている場合に治療結果の測定を無意識に歪めてしまう可能性に関連しています。観察者に“目隠しする”、つまり結果を測定する人物が、対象者が治療を受けたかどうかを知らない状態にしておくことによってそのバイアスを防ぎます。患者と治療者にも割り付けを知らせていないことが一般的には望ましいとされます。患者がそれを知らない場合には、観察された治療効果がプラセボ効果やホーソン効果によるものではないと言えます。その治療をおこなう治療者に知らせないということは、困難または不可能であることも多いですが、治療者が治療の有効性について知らされていない場合(例えば、低出力レーザーの臨床試験において、その器具が放射しているのがレーザーなのか色つきの光線なのかを知らされていないような場合)、治療効果は治療者の治療に対する熱意によるものではなく、治療そのものである可能性ということができます。

研究の成果がひどく歪められてしまうこともあるため、臨床試験の途中で参加をやめてしまう対象者がいることにも、注意すべきです。もし、対照群の対象者が研究期間中に症状が悪化したために別の治療を求めて参加をやめてしまった場合、そのことによって対照群の平均結果が本来よりもよくなってしまい、本当の治療効果が見られない可能性があります。逆に、ある治療が対象者の症状を悪化させてしまい、その人が参加をやめてしまった場合には、その治療は本来よりも効果的に見えてしまう 可能性があります。このように途中で参加をやめてしまう対象者がいると、臨床試験の有効性が不確実になってしまうのです。もちろん途中でやめてしまう参加者が多ければ多いほど、不確実性は増します。大まかに言って、対象者の15%以上がやめてしまった場合、その研究には大きな欠陥がある可能性があります。途中でやめた対象者の数を報告しない執筆者もいますが、確立した科学的原則「推定有罪」に基づいて、そのような研究は無効である可能性があるとみなされます。

妥当な臨床試験とは:

  • 対象者が無作為に治療群と対照群に割りつけられていること
  • 観察者が、可能であれば患者および治療者も、試験について知らないこと
  • 途中でやめる対象者が少ないこと

これから理学療法の臨床試験を読むときには、これらの条件を備えているかどうかを確かめてください。一般的に、以上の条件を満たしていない臨床試験は無効であるか、治療効果の有無を実証するものとはみなされるべきではありません。これらの条件を満たす臨床試験については、注意深く読み、その結果をしっかりと覚えておいてください。

臨床試験の有効性評価についてもっとお知りになりたい場合は、Guyatt GH, Sackett DL, Cook DJ (1993). User's guide to the medical literature: II. How to use an article about therapy or prevention: A. Are the results of this study valid? JAMA 270: 2598-2601.をお読みください。

   

2. パート II: その治療は有益か?

前のセクションでは、臨床試験が妥当かどうかを見分けるための条件を示しました。方法論的フィルターの多くを満たしていない研究は無視したほうがよいでしょう。このセクションでは方法論的フィルターを満たしている研究を、治療者がどう解釈すべきかを考えます。治療効果の統計的有効性の実証を求めるだけでは十分ではないということです。その臨床試験が意味のある結果を測定しており、その治療効果は治療者が実践してみるに足るほど大きいものであると認める必要があります 。また、治療が効果をあげるためにもその悪影響は稀であるか十分に小さいものでないといけません。最後に、その治療法が費用対効果のよいものである必要があります。

もちろん、その臨床試験が有益であるためには、意味のある治療効果を調査していなければいけません。つまり、結果が妥当な方法で測定されていなければいけません。一般的に治療が患者の必要を満たしたかどうかによってその主な価値は判断されるため、結果測定方法は患者にとって意味のあるものであるべきです。つまり、低出力レーザーがセロトニンレベルを下げることを示した臨床試験よりも、痛みを軽減することを示したものの方がずっと実用的であり、運動トレーニングが痙縮を低減することを示した臨床試験よりは、機能的自立を向上させることを示したものの方が有益であるということです。

治療法の効果の大きさは明らかに重要でありながらも見過ごされがちです。おそらく臨床試験を読むときに「統計的有意性」と「臨床的有意性」の区別をきちんとしていないためでしょう。あるいは、多くの臨床試験の執筆者が”p<0.05”かどうかということに気を取られているからかもしれません。統計的有意性(”p<0.05”)とは、効果が単に偶然だけよりも明らかに大きいかを示すものです。(観察された治療効果に対する確率の結果だけではなく)重要なことは、効果が実際にはどの程度であるかについては何も示していないことである。治療効果の最適推定値は、群間の平均である。このように、関節モビライゼーションの効果に関する研究仮説で、10cmのvisual analogue scale(VAS)にて治療群で平均4cm肩痛が改善し、対照群で平均1cm改善したときに、我々は治療の平均効果はVASで3cmであるといえる。他の研究仮説として、スポーツ前にストレッチを行なった2%が受傷したのに対して、対照群では4%が受傷したとする。この場合には、ストレッチが受傷の危険性を2%減少させることを示すものであると考える(4%から2%を引くと2%となる)。臨床的に治療効果が十分あるときには、読者は報告された臨床試験の効果の大きさを確認しなければならない。患者は時折、治療のために理学療法に訪れるが(勿論、このことが全ての臨床治療に当てはまる訳ではないが)、多くの患者は効果が少ない治療には興味を持たない。

治療効果の大きさを見るときには細心の注意を払ってください。それは結果が二者択一の結果で測定される(二者択一の結果とは死と生、負傷か無傷、養護施設に入所するか否かなど、2つのうち1つの変数を持つものであり、0から10の結果がある痛みのVAS測定等の変数とは異なります)研究に適用されます。二者択一の結果で測定される場合、多くの研究では治療効果を差ではなく比率で報告します(その比率は「相対危険度」、「オッズ率」、「危険率」等と呼ばれることもあります)。この方法では、先程のストレッチに関する研究では負傷の危険度は50%減少した(2%は4%の半分です)と報告されます。通常、比率で治療効果を表した場合にはその治療法の効果が大きく見え、2つの群間の差の方がよりよい尺度となります。(実際のところ、もっとも実用的な尺度は「治療を必要とする数:"number needed to treat"」です。というのは、平均的に、ある有害事象を防ぐために何名の患者を治療する必要があるかということがわかるからです。ストレッチの例では、NNT(number needed to treat)は1/0.02 = 50なので、50名の対象者がストレッチすることによって1件の負傷を防げるということになります)。

治療法の有害な影響(例:治療の副作用や合併症など)を報告しない研究も多くあります。残念ながら、有害な影響が報告されていない場合、その治療法は有害ではないと解釈されがちですが、そうとは限らないのは明らかです。Glaziou and Irwig (BMJ 311: 1356-1359, 1995)では、もっとも重症の患者にその治療が施された場合に治療法の効果は最も顕著であると主張しています(たとえば、大量の痰の滞留の見られる頭部外傷の患者は、少量の痰の滞留のみられる患者に比べると、気管吸引によって呼吸停止の危険がより大きく減少することが期待されます)。一方、治療法の危険性(この場合は頭蓋内圧の上昇)は症状の重篤度に関わらず、比較的一定であると言えます。このように、ある治療法は重症の患者に適用された場合には害よりも効果が高くなることが多いにもかかわらず、治療者は軽症の患者に対して重い副作用の可能性がある治療法を適用したがらない傾向があるでしょう。

実際のところ、治療法の有害な影響というのは起こる頻度も低く、それが起こった時に見つけられるほどのサンプルサイズがない研究が多いので、臨床試験によって有害な影響を見つけるのは困難といえます。つまり、しっかりと無作為化された対照臨床試験の場合でも、重大な弊害がでないことを確認するために、たくさんの治療群の患者をフォローアップして大規模な“経過観察”研究を行うことは重要なのです。経過観察研究が行われるまでは、特にその治療法で大きな改善が期待できない患者に対して、有害となる可能性がある治療法を適用することには慎重であるべきです。

臨床試験の結果として推定された治療効果の大きさに関する信頼度については、より批判的によく考える必要があります。臨床試験は、ある集団を代表するとされる対象者に対して実施されます。つまり、ひとつの臨床試験では、治療効果の(不完全な)推定値を示すのがせいいっぱいであるということです。多数の対象者に対して実施された臨床試験のほうが少人数に対して行われたものよりもよりよく(より正確に)治療効果が推定できます。臨床試験の意味を判断するときには、その推定値の信頼度をよく考えてください。これこそが、ある臨床試験から引き出された結論の確実性に影響を与えるからです。治療効果の推定値の信頼区間が臨床試験の結論に明示されていない場合には、それを計算してみてください。(効果の一般的な測定値の信頼区間の計算及び解釈方法のチュートリアルはただ今準備中です。当面のところ、興味のある方はSim, J and Reid, N. (1999). Statistical inference by confidence intervals: issues of interpretation and utilization. Physical Therapy, 79, 186-195をご参照ください。信頼区間について確かな方(笑。すみません)は、ここをクリックしてエクセル形式のPEDroの信頼区間カリキュレーター(confidence interval calculator)をダウンロードすると便利でしょう。

その治療法が有益かどうかを判断する最後の条件はその費用効率です。医療費が国庫により支払われたり補助を受けている場合には特に重要です。すべての医療技術革新に資金提供することは不可能なのです(たぶんすべての優れた技術革新に対しても無理でしょう)。その治療法に使われてしまったお金は他の医療費に使うことはできないのです。限りある資金をきちんと配分するということは、1ドルに対する効果が最大になるようにお金を使うことです。もちろん、その治療法自体が効果的でなければ費用効率がよくはなりません。しかし、効果のある治療法の費用効率をよくすることは可能です。費用効果の話は筆者の専門外ですので、別の専門家に話を譲ることにいたします。もし興味がある場合は以下の文献をご参照ください。

Drummond MF, Richardson WS, O'Brien BJ, Levine M, Heyland D (1997). User's guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 277: 1552-1557.
O'Brien, BJ, Heyland D, Richardson WS, Levine M, Drummond MF (1997). User's guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 277: 1802-1806.

まとめ:

統計的有意性は臨床的有益性と一致するものではありません。臨床的に有益な治療法とは、

  • 患者にとって有益な結果があること。
  • ある程度大きな効果があること。
  • 弊害よりも効果が大きいこと。
  • 対費用効果が優れていること。

さらに、効果の大きさの評定についてさらに詳しく知りたい場合は、以下の文献を参照してください。

Guyatt GH, Sackett DL, Cook DJ (1993). User's guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 271: 59-63.

拙著(そんなに権威がないかもしれませんが)は以下の2つです。

Herbert RD (2000). How to estimate treatment effects from reports of clinical trials. I: Continuous outcomes. Australian Journal of Physiotherapy 46: 229-235.

Herbert RD (2000). How to estimate treatment effects from reports of clinical trials. II: Dichotomous outcomes. Australian Journal of Physiotherapy 46: 309-313.

 

 
 
 

お問い合わせ PEDro@george.org.au