コロナ禍において、臨床試験情報を目にする機会が多くなったかと思いますが、二重盲検試験と非盲検試験の違いが軽視されているケースが散見されます。
・盲検がかかっていないことが何にどの程度影響するのか?
・なぜ盲検化しなければならないのか?
といった点は、なかなか感覚として分かりづらい部分もあるかと思いますので、
今日はその点について、考えていきたいと思います。
内容はごく基本的なものになるように、表現をマイルドに言い換えているところがあります。
もし誤解を招く表現がありましたら、ご指摘頂けますと幸いです。
盲検化とは何か?
「盲検(blind:ブラインド)」とは「どのような治療が行われているのかを知らない状態」のことを指します。
盲検化の対象は治験に参加する患者さん(被験者)、治験を行う医師、被験者や医師と密接に関係/連携するクリニカルリサーチコーディネーター(CRC)や看護師、薬剤師、そして製薬会社の人間等、多岐に渡ります。
本記事ではお話をシンプルにするため、医師と患者さんの二つを中心に、盲検化の必要性や影響を考えていきます。
さて、それを踏まえて、まずは非盲検化と二重盲検化について整理しましょう。
非盲検化とは、医師も患者さんも「どのような治療が行われているのかを知っている状態」になります。
つまりイベルメクチンの非盲検化試験ということであれば、医師はどの患者さんにイベルメクチンを投与しているか知っているし、患者さんも自分の飲んでいる薬がイベルメクチンであることを知っているわけです。
二重盲検化試験とは医師も患者さんも「どのような治療が行われているのかを知らない状態」です。
つまりコミナティのプラセボ対照二重盲検比較試験であれば、医師は自分が投与したワクチンが実薬(本物)であるか、プラセボ(偽薬:生理食塩水等)であるか分からない、同じように患者さんも実薬かプラセボか分からないというわけですね。
盲検化はなぜ行われるのか?
さて、ではなぜわざわざ面倒な盲検化をする必要があるのでしょうか?
「盲検化」とは、ランダム化と並んで、臨床試験におけるバイアスを最小にするための重要な技法のひとつになります。
そのため、エビデンスの構築を目指す検証的試験では、「ランダム化」「二重盲検」試験が標準的に用いられているわけです。
こう言われてもピンとこない方も多いでしょう。
この点について、もう少し見てみましょう。
バイアスとは何か?
バイアスとは専門的な言葉で表すと「試験治療における効果の推定値と真の値の系統的な差」のことです。
もっとよく分からなくなってきましたね?
誤解を恐れずに言えば
まだ分かりにくいでしょうか?
みなさんは臨床試験というものをどのようにとらえていますか?
臨床試験を行えば、医薬品の効果を正確に確実に判断できるとお考えでしょうか?
もっと言えば、真の医薬品の効果は誰にも分かりません。
どのような手法を用いたとしてもわからないのです。
だから臨床試験ではあくまで推定するのです。
例えば計算機であれば、入力した計算を「正確」に返してくれますね?
計算には答えが存在し、その答えはルールに基づき、確実に導き出せるのです。
しかし臨床試験はそのようなことはなく、実施した結果(導き出された有効性や安全性)が誤りであることもあるのです。
いや、誤りであるというのは誤解を招く表現かもしれませんね。
実際は結果が「よく分からなくなる」ということです。
推定された結果が、どの程度正しいのか、それとも誤りなのか分からなくなるのです。
専門的な表現で記載するとすれば
そのように結果を惑わす要因のひとつがバイアスであると考えると分かりやすいかと思います。
(あくまで用語を感覚的に表現しています。)
バイアスは盲検化の観点以外においても、試験デザインから、試験の運営、解析、結果報告まで、治験のあらゆる場面・場所で生じる事項です。
ゼロにすることは不可能ではありますが、妥当性のある結論を導くためには最小限にするように対応していく必要があるのです。
なお一般的には非盲検化は治験薬に有利に働きます。
治験に参加する医師や患者さんは少なからず、期待しているわけで、
期待していない、治験薬が嫌いだという人はそもそも治験に参加しないため、
この傾向は理解できるものと思います。
つまり非盲検試験の結果はそのような点も加味して確認する必要があります。
バイアスが生じる原因は何か?
治験におけるバイアスの原因として最も注意しなければならないのは、治験に参加する患者さんと医師によるものとなります。
医師や患者さんは実際に治験薬を処方し、服薬し、様々なデータの源となる人たちです。
そのためここで発生するバイアスの影響は極めて大きいわけです。
どのようなケースが考えられるでしょうか?
例えば、患者さんが自身に割り当てられた試験治療を知れば、思い込み・先入観によって様々な身体的影響が生じる可能性があります。
その治験薬に対して期待が大きいほど、その影響は大きくなります。
例えば、イベルメクチンの治験に参加した人がイベルメクチンに極めて高い有効性を期待して、イベルメクチン群に組み入れられた場合、その有効性は大きくなる恐れがあります。
臨床試験における評価項目が医師や患者さんの主観的な指標に基づく場合は特にこの影響が大きくなります。
対して、客観的な評価項目である臨床検査値などはその影響が少なくなる傾向にあります。
期待だけではなく、大きな不安を覚えている場合も影響は大きくなります。
例えば上記のイベルメクチンの例でいえば、治験に参加した人がイベルメクチンの安全性に大きな不安を抱いていたとしたら、腹痛や頭痛、下痢といった有害事象が多くなる可能性があります。
バイアスを招くのは患者さんに限りません。
治験を実施する側の医師にも当然あります。
例えば先のイベルメクチンの試験でいえば、医師がイベルメクチンに多大な期待を抱いていたとしたら、有効性を過大に評価し、安全性を過少に評価する恐れがあるのです。
逆にイベルメクチンに大きな不安があるとしたら、過剰に患者さんに想定される副作用について確認し、有害事象が多く認められるかもしれません。
さらに、併用薬・併用療法、救済薬の使用判断、患者さんへのケアなど、医師の影響は多岐に渡ります。
なお本日は医師と患者さんに限った話で進めていますが、製薬会社側としてもバイアスの要因はたくさんあります。
例えば、CRAは医師/CRCへの治験データの問い合わせ/確認内容に関与していますが、患者の割り付けが実薬群であることが分かれば、何か理由をつけて有害事象の取り下げの協議を行うかもしれません。
例えば糖尿病の試験で、実薬群であることが分かれば、運動療法をちょっと頑張ってもらえば、血糖値は下がるかもしれません。
このような不正というレベルではなくとも、ごく小さな事象でも積みかなされば、全体として大きなうねりとなるのです。
そのうねりが臨床試験の科学的妥当性を飲み込んでしまうかもしれません。
盲検化と科学的妥当性の問題事例
ひとつ事例を挙げてみましょう。
みなさんCOVID-19に対するアビガン(ファビピラビル)の有効性と安全性を検証した臨床試験は覚えておられますか?
臨床試験では統計学的な有意差が認められたにもかかわらず、2020/12/21の薬食審では
「現時点で得られたデータから、アビガンの有効性を明確に判断することは困難」とし、
「現在実施中の臨床試験結果等の早期の提出を待って再審議する」ことになりました。
これについては、陰謀だとか利権だとか、
一部のば・・・・ッカスの酒を飲んだような勢いの人々が叫んでいましたね!
※バッカスの酒=バーサク効果
すんなりと承認されなかった要因の一つが、「単盲検試験で実施されたことによる影響の評価」でした。
単盲検ということで、非盲検よりはましではあるのですが、それでも科学的妥当性という点には少々影を落としたということが分かりますね。
おまけ:どっちが悪い?効く効かないの誤り
医薬品開発における統計的仮説検定では、
本来は効果がない治験薬を「効果あり」と判断する誤りと、
本来は効果がある治験薬を「効果なし」と判断する 2つの誤りがあります。
臨床試験において統計学的仮説検定で判断を下す場合には、被験者数を大きくすることなくこれら2つの誤りを同時に小さくすることができません。
では、どちらを優先させるべきだと思いますか?
効果がない薬剤を世に出す確率
それはすなわち患者さんに対する危険です
それを大きくすることはできないので、効果がない治験薬を「効果あり」と判断する確率を許容できるレベル以下に抑えることが優先されるのです。
なおこの制御の基準がいわゆる統計的仮説検定における有意水準であり、慣例的に5%とされています
まとめ
バイアスが生じる原因やそれが臨床試験の科学的妥当性に与える影響について、ご理解いただけたでしょうか?
・臨床試験が科学的妥当性を導き出すためにはバイアスを減らさなければならない、
・そのバイアスを減らすために用いられる手法がランダム化であり、盲検化というわけですね。
そのため非盲検化ということは、バイアスの影響をより気にしなければならない。
もっと言えば、非盲検化はその臨床試験の科学的妥当性について、二重盲検試験より落ちる可能性があるということです。
※あくまで一般論としてです。疾患や臨床試験デザイン、評価項目により影響の度合いは異なります。
COVID-19のワクチンや治療薬については、様々な情報が飛び交っていますが、その内容については客観的に冷静に確認していくようにしたいですね。