PACIFIC試験:欧州でのデュルバルマブの使用制限への反論

Position of a panel of international lung cancer experts on the approval decision for use of durvalumab in stage III non-small-cell lung cancer (NSCLC) by the Committee for Medicinal Products for Human Use (CHMP).

Peters S et al.
Ann Oncol. 2019 Feb 1;30(2):161-165.
PMID: 30624547

Abs of article
PACIFIC試験は、抗PD-L1抗体であるデュルバルマブを使用し、地固め療法の役割を評価した最初の第Ⅲ相試験である[Antonia SJ NEJM2017 PMID:28885881]。化学放射線療法後の1年間の免疫療法が無増生存期間(PFS)に前例のない利益をもたらし、ITT集団におけるプラセボと比較でハザード比0.52とほぼ半分になることが示された。 この恩恵は、PD-L1の状態に関係なく非扁平上皮癌および扁平上皮癌の両者、ならびにⅢA期およびⅢB期の両方で観察された。さらに2018年には中間解析で全生存期間の延長も報告された[Antonia SJ NEJM2018 PMID:30280658]。
この結果を受けて、米国FDA、カナダ、日本、オーストラリア、スイス、マレーシア、シンガポール、インドおよびアラブ首長国連邦は、切除不能stageⅢに対する化学放射線療法後の地固め療法として症例を選択せずデュルバルマブを承認した。
しかし意外なことに、欧州医薬品庁(EMA)は、デュルバルマブの使用をPD-L1発現する腫瘍を有する患者に制限することを決定した。PD-L1は本試験では25%をカットオフ値としていたが、1%をカットオフ値としPD-L1陰性例の小さいサブセットに対する予定外の事後解析を要求し、それに基づき判断を行った。ESMOは臨床的な利益の評価スケールをESMO-MCBS(Magnitude of Clinical Benefit Scale)として発表している。これによれば今回のデュルバルマブは最高スコアとなる。さらにMCBSのガイドラインでは、結果は統計的原則に基づいて、主目的ITT解析で評価し、追加の評価は、事前に予定したサブグループ解析だけに制限している。このような原則を知っていてEMAがPD-L1<1% に使用を限定するのは驚きである。私たちはこの方針に同意できない理由を以下のように考える。

1.この結論は、慣習的かつ適切とされる主要解析集団(ITT)に基づいていない。

2.この結論が予定されていない事後の探索的解析に基づいている。そしてその事後解析は要求されたものであり、しかも事前指定されたプロトコルと異なるカットオフ値(予定の25%の代わりに1%を使用)とし統計解釈の原則に反する。

3.PD-L1発現は動的で不均一なものである。これは、腫瘍そのものの違い以外に、生検サンプルの量と質、さらに取り扱いの影響を受ける。またPD-L1の評価には数多くの抗体、カットオフ値、スコアリング方法が使用されている。

4.PD-L1発現を治療前検体で解析されている。この治療法の仮説は、抗がん剤+放射線で腫瘍の微小環境の変化を誘発するため、より免疫療法に反応しやすくなるというものであった。従って化学放射線療法後の検体におけるPD-L1の評価がなされていない、そのため治療前の評価からの類推では正確性に欠く。

5.診断時の組織採取は必須でなかったため、生検検体は451人(63%)の患者だけが利用可能であった。そして148人の患者のみがPD-L1発現1%未満であった。生検検体が得られていないのが完全に無作為であるという保証がなく、バイアスが排除できない。

6.PD-L1による層別化が行われていないため、PD-L1サブグループ内の患者背景のバランスがとれているか保証されない。そのため他の予後因子からの起こり得る交絡を排除できない。

7.ITTプラセボ群と比較した場合、PD-L1陰性群内における対照群の過剰に良い成績が観察されている。これは非小細胞肺癌における予後因子、予後予測因子の不均衡によるものと推測される。また計画外の後ろ向き解析やサンプルサイズが小さいことによる可能性がある。

8.偽陰性結果が生じる可能性が高い。試験のデザインは、ITT集団におけるOSの利益が27%(ハザード比=0.73)となるよう設計されていた(検出力85%、両側α= 0.025)。PD-L1陰性サブグループにおけるOSの利益を検出するには、60のイベント観察だけでは不十分である。事実、このイベント数で、研究デザインであるα=0.025を使用すると、少なくともOS利益が57%(ハザード比=0.43)の場合のみ検出力が80%になる。これは妥当とは思われない高い目標である。

サブセット分析は通常、新しい仮説を生成するために使用される。これらの患者のデュルバルマブへのアクセスを否定する前に、PD-L1陰性患者における前向き検証を待つべきであろう。この決定が格差を生み出し、治療へのアクセスが異なることにより、社会的な悪影響が懸念される。

感想
PACIFIC試験のサブ解析でPD-L1<1%の集団について、PFSは良好であったものの全生存期間が治療群で下回ったことが話題となりました。私は全く偶然の産物と考えていますが、欧州ではこれを重視し適応から外しています。欧州医薬品庁(EMA)のホームページでは、”The use of Imfinzi is restricted to patients whose tumours produce PD-L1, since a clear benefit was only shown in this group of patients.” https://www.ema.europa.eu/en/medicines/human/EPAR/imfinziと言い切っています。どのような理屈でEMAが1%をカットオフ値とした解析を要求したのかは不明ですが、この議論はサブセット解析の問題点が集約されており、考える材料として最適です。私もこの記事の主張には全面的に賛成します。理由は本文で書きつくされていますが、最大の問題点は、規定にないサブセット解析から結論を導きだし、しかもそこではPD-L1のカットオフ値を変えていることです。サンプルサイズやP値の消費を考慮していない探索的解析で、偶然や検出力不足によって利益の認められない集団や、その逆があるのはむしろ当然で、それを理由に薬の適応から外していくのは科学的な態度とは言えません。またレトロスペクティブ研究によくあることですが、カットオフ値を様々に変えて解析し、有意となるところで2群に分けて報告するのは禁じ手です。
批判ばかりしましたが、(治療開始前の)PD-L1<1%でデュルバルマブの利益が少ないかもしれないという示唆は得られているわけで、今後の実地での症例集積により解明されることを期待したいと思います。