ICI臨床試験の結果は日常臨床を反映するか?

Generalizability of immune checkpoint inhibitor trials to real-world patients with advanced non-small cell lung cancer.

Tang M et al.
Lung Cancer. 2022 Feb 3;166:40-48.
PMID:35152172.

Abs of abs.
ランダム化試験の結果から免疫チェックポイント阻害剤(ICI)は進行非小細胞肺癌の標準治療となっている。しかし臨床試験への適格基準は厳格で、参加者やアウトカムが実情を反映してしていない可能性がある。今回は主要な第Ⅲ相試験の実地臨床患者への一般化できるかを評価した。2017-2021年の間にEmbedding Research (and Evidence) in Cancer Healthcare (EnRICH) プログラムに登録された患者で主要な試験の適格基準を満たす患者の割合を評価した。その基準とはPS0-1、血液検査が正常、EGFR/ALK変異なし、除外すべき合併症(癌の既往、ステロイド使用を必要とする疾患、自己免疫疾患、HIV、B/C型肝炎、結核、間質性肺炎、臓器移植)のないことであった。基準をすべて満たした患者を試験適格例と定義し、ICIの投与状況と全生存期間(OS)を調べた。454例(年齢中央値71歳、女性42.1%)のうち、30%が試験適格例であった。ICIを投与されたのは半数以下(47.6%)で、試験適格例の患者ほどICIを受ける傾向があった(69.1% vs 38.4%, 調整オッズ比3.77[2.40-5.91] )。OS中央値は、1次治療としてICIを投与された患者で10.2カ月、2次治療として5.4カ月となった。PS≦2まで含むようにし、EGFR/ALK変異、ステロイド使用、自己免疫疾患、間質性肺炎、結核、臓器移植を除外するように変更すると、試験適格例が57.3%に増加した。進行非小細胞肺癌における代表的な第Ⅲ相ランダム化試験の一般化には限界がある。ICIを受けた実際のOSは、試験で報告されたよりも短い。新規のICIの臨床試験は、一般化を考えより広い適格基準を考慮すべきである。

感想
臨床試験と実地データの差は過去にも議論されています。調べるまでもなく臨床試験に参加できる人の方がベースの状態がよいため予後良好です。現在はメーカー主導の臨床試験、つまり薬剤を売るための試験しかありませんので良い結果を出さなくてはならない面があります。したがって真に臨床全体を反映する数字はリアルワールド研究でしか知ることはできません。今回の検討で適格とならない理由は、合併症(29.1%)、検査異常値(26.2%)、EGFR/ALK変異の存在(23.1%)でした。要するに3人に2人は非適格のため、試験結果の一般化はできないのではないかという主張です。そこで適格基準の改訂案として癌の既往や肝炎、PS2などを含めることとしています。特にPS2はあいまいで、実地でPS2としてきた人が実際は3ということもよくあります。著者らはこれらを含めた臨床試験を提唱していますが、私は疑問です。初回治療として試験適格例で13.1ヶ月、非適格例で8.8ヶ月と報告していますが、ある程度状態の悪い人は割り引いて考えなくてはならないのは当然でしょう。また予後に影響を与える背景がばらつくことで、たとえ層別化しても意図しない偏りができランダム化試験の前提が崩れることも懸念されます。ランダム化臨床試験の役割は「その治療だけ」がアウトカムに差を付けられるかどうかを証明することで、それを最小の労力で行わなくてはなりません。アウトカムを修飾する強い因子が入ることで、逆に結果がわかりにくくなります。どうしても予後不良因子をいれたければ、その集団に対する専用の臨床試験が必要です。昔PS2や高齢者、いわゆるpoor-riskに対する臨床試験が行われたことがありました。当たり前ですが見栄えのしない結果のため最近ではあまり見なくなりました。臨床試験はあくまでモデルケースであり、臨床試験の結果が目の前の集団に外挿できるかは、必ず「自分の目」で実地データを見直して考えることが必要です。