インフルエンザ治療薬としての切り札であるアビガンが、新型コロナウイルスに有効だという論文が発表され、様々な国で試験的な投与や臨床試験が計画され、承認に向けて動き始めました。
ところがその根拠の一つであった論文が撤回されてしまったのはご存じですか?
今日はその論文の内容と撤回された理由を考察します。
Contents
要約
・アビガンの有効性を示唆する論文が理由不明で撤回された
・ベースラインが揃っていなかった可能性
・選択除外基準が緩すぎた可能性
・オープンラベルかつ母数が少なくバイアスが大きかった可能性
・アビガンが終わったわけではない!
根拠論文の概要
Experimental Treatment with Favipiravir for COVID-19: An Open-Label Control Study
上記の論文が取り下げされた論文です。
論文の中身は見られませんでしたが、Abstractを抜粋して和訳しました。
本試験では「新型コロナウイルス患者に対して、アビガン(ファビピラビル)とカレトラ(ロピナビル/リトナビル)をオープンラベルで無作為に割り付けて使用」しました。
両群ともにインターフェロンも併用されています。
母数はアビガン群が35名、対照群が45名です。
ベースライン特性は2つの群間で同等とあります。
胸部CT画像で有効性評価を行ったところ、改善率はアビガン(91.43%)、対照群(62.22%)(P = 0.004)と、アビガン群が統計学的に有意な改善を示していたというものです。
また副作用も対象群より低かったとのことです。
オープンラベルとは盲検をかけてない状態ということです。
つまりDr.はどの患者にアビガンが投与されているかわかっている状態である、
ただ無作為化割り付けなので割り付け自体に恣意的なものはないはずと言えます。
例えば、効きそうな患者にアビガンをわざと割り付けるといったことはないと思います。
撤回された理由の推測
当該論文が撤回された理由は明らかにされていません。
データの詳細が分からないので確たることは言えませんが、何個か挙げて考えてみましょう。
患者群のベースラインの違い?
Abstには患者群のベースライン特性は同質とあります。
しかしこれが異なっていた可能性が考えられます。
例えば、「年齢や体重、発現していた症状の有無、重症度、基礎疾患の有無、発病してからの経過日数、併用薬」等がばらばらだった可能性です。
通常の層別割り付けでは因子を決めて群間のベースラインに大きな差が出ないように調整しますが、母数が少なくこのあたりがおろそかであった可能性があります。
重症度や症状の違い?
その重症度は何を基準に考えますか?
酸素飽和度でしょうか?肺炎の程度でしょうか?
それをそろえたとして、それ以外の症状、例えば熱が高い人は症状が治りにくい等の因子があった場合、どうなるでしょうか。
そのような人が対象群に割り付けされた場合、見かけ上、対照群のほうが治りにくくなるということもありうるのです。
また重症度そのものについても完全にそろえることはできません。
ここは母数が大きければ影響は低減されますが、合計80例程度の少人数では難しい可能性があります。
発病してからの経過日数?
薬には効果的な使用タイミングというものがあります。
ウイルスの増加のタイミングで服薬できればより効果的かもしれませんし、症状が進行してから服薬しても効果は薄いかもしれません。
そのような部分まで考慮されていたでしょうか。
選択除外基準の甘さ?
通常の試験では「ガイドライン等をもと」に「狙う適応も考慮に入れて」、選択除外基準を定めます。
つまり治験に組み入れる患者さんを限定しているということです。
そうでないと患者さんの範囲が広すぎて、ベースラインがばらばらになってしまうためです。
今回の試験は選択除外基準が雑であった可能性も考えられるかと思います。
つまり「患者の選択基準や除外基準が緩すぎて、患者さんのベースラインがばらばらで」、何だかよく分からない試験になってしまった可能性があります。
オープンラベル試験で母数も少ないから?
今回はオープンラベル試験なので、誰がアビガンを飲んでいるか分かります。
これは非常にバイアスがかかりやすい試験です。
通常の臨床試験は二重盲検で行います。
つまり患者さんもDr.も、もちろん製薬会社側も誰も、治験薬のどちらが割り付けられているか分からない状態で治験を進めて、データを取るわけです。
そうではないと、実薬だからおまけしちゃう!とか新しい薬だからよく効くかも?とか、副作用が起きやすいかもしれない!といった、余計なバイアスが働き、データの信頼性を損ねるためです。
まとめ
オープンラベルで母数も少ない、選択除外基準も甘くて、ベースラインも揃っていなければ、まるで学生実習のような結果になるかもしれません。
全部がダメということはないと思いますが、これらが複合的に影響して、論文取り下げのような結果になってしまったのかもしれません。
しかし勘違いしてはいけないことは「アビガンの有効性が否定されたわけではない」ということです。
今回、有効性を示唆していた論文が取り下げとなってしまいましたが、それがイコール、アビガンの有効性そのものを否定したわけではないのです!
アビガンについてはもう少しきちんとした臨床試験が始まります。
その結果をもって白黒つけられることでしょう。
参考:アビガンのこと
おまけ:表と裏のプロトコル
治験においては綿密な選択除外基準が定められます。
選択除外基準とは治験に参加するための患者さんの条件です。
これはガイドラインや医学専門家の意見、狙う適応などをもとに、規制当局と議論して決められます。
しかしこれは表のプロトコルになり、治験成功のために裏プロトコル(というとまずいので、指針的なもの)があります。
例えばある疾患で10-20点の重症度の人を組み入れるように基準を設けたとしましょう。
しかし10点の人と20点の人では、治験薬の効果が異なることがよくあります。
10点は治験薬が効きにくいため有意差が出しにくく、20点で有意差が出やすいとしたらどう思いますか?
治験を実施する我々としては20点に近い人を入れたくなるわけです。
だからなるべくそれに近い患者を組み入れるように「お願い」するわけです。
これが裏プロトコルです。
ならば初めから基準を15点~20点にすればいいのでは?
と思われる方もおられるかもしれません。
しかしそれは困るのです。
まず適応が限定される可能性があります。
15点が中等度、20点が重度だとすると、その基準だと適応が中等度以上に限定されてしまう可能性があります。
売り上げ的には大打撃です。
次に被験者の組み入れが難しくなります。
20点付近の患者さんが欲しくても、その付近の点数帯の患者さんは集まりにくく、治験を完了するには長い時間を必要とする可能性があります。
その間にライバル薬が上市されてしまうと大打撃です。
そうでなくとも特許期間は限られています。
1日でも早く治験を終わらせたいのです。
そんなわけで10-20点の基準という表のプロトコルの中で、なるべく有効性を出しやすい患者さんを集めるわけです。
ちなみにこういうことをするのは日本だけです。
海外はもっと雑に、でも大量の患者さんを治験に組み入れて、治験を成功させます。
日本ならではのコツというわけですね!
治験の下手な製薬会社はこのあたりがへたくそなのです。
うちは割と上手いほうだと思います(笑)
雑記
先日書いたリモートワークの記事ですが、はてなスターが表示されていない時間帯があったらしいです。
投稿直後は表示されていたのに、どうしたんでしょ?
いつも右上の通知のところに「1」と出るのを眺めるのを楽しみにしていたのに、
全然でない割にはアクセスだけされていて、おやー?と思っていましたが、はてなスターが表示されていなかったのかー!!
この記事はどうでしょうか?
私にとって「はてなスター」は結構大事な要素なので、ちゃんと表示されてほしいです!