ゲノム情報を活用する臨床試験デザインと統計解析...
Transcript of ゲノム情報を活用する臨床試験デザインと統計解析...
はじめに
本発表は、「ゲノム等のバイオマーカー情報をもとに行う治験の共通方針※」の4章(発表者が執筆担当)の解説がメインです。※ H29年度AMED革新的がん医療実用化研究事業「ゲノム等のバイオマーカー情報に基づく希少がん・希少フラクション領域の臨床開発を促進するための基盤整備研究」が作成
詳細にご興味のある方は共通方針(公開予定)を参照下さい。
2
がん薬物療法の開発動向
ゲノム技術の進歩に伴い、治療効果予測に役立つマーカーが多数同定されている
がん細胞の増殖メカニズムに着目した薬剤開発が主流– 分子標的治療薬や免疫チェックポイント阻害薬の登場– この種の薬剤は特定の部分集団で高い治療効果が発揮されることが多い
4
ゲノム検査を伴う臨床試験の実施が標準的なアプローチとなった
治療効果予測に役立つマーカーとは?
単なる「予後」マーカー 「効果予測」マーカー
5
マーカー陰性
新薬群
標準治療群
新薬群
標準治療群
マーカー陽性
マーカー陰性
新薬群
標準治療群
新薬群
標準治療群
マーカー陽性
予後判別には役立つが群間差は予測できない 群間差が予測できる
例: EGFR阻害薬とEGFR遺伝子検査
6
Mok T, et al. N Engl J Med 2009.のFig2より抜粋
1st line advanced NSCLCEast Asia only
ランダム割付
gefitinibstandardtreatment
(標準治療) (試験治療)
608例 609例
IPASS試験
最近10年の代表的な開発事例– 肺がんに対するALK融合遺伝子検査とALK阻害薬
• crizotinib/alectinib/ceritinib/lorlatinib
– 大腸がんに対するRAS遺伝子検査と抗EGFR抗体薬• cetuximab/panitumumab• KRAS野生型からRAS野生型に適応が限定
– 乳がんに対するOncotype-DX assayと術後化学療法• 複数遺伝子異常から術後化学療法の再発予測スコアを算出• 低スコア・中スコアであれば化学療法を省略可能
8
Solomon BJ, et al. N Engl J Med 2014. / Peters S, et al. N Engl J Med 2017. / Douillard J, et al. N Engl J Med 2013. / Sparano JA, et al. N Engl J Med 2018.
マーカー情報を活用する臨床試験の特徴
(1) 医薬品とコンパニオン診断薬(CDx)の同時開発
(2) Biomarker credential に応じたデザイン・解析手法の選択– 効果予測マーカーとしての「確からしさ・エビデンスの強さ」
• M(+)に限定しないと治療効果が認められないのか?• 早期開発の段階で見極める必要がある
– 候補マーカーの取捨選択– M(+)の定義付け(カットオフ選択)
– 後期開発(検証的試験)の一般的な考え方• Strong credential → M(+)だけに効果を期待 : Enrichment design• Weak credential → M(-)にも効果を期待 :All comers design
9
Freidlin B and Korn EL. Nat Rev Clin Oncol 2013
近年のパラダイムシフト
遺伝子診断技術の飛躍的向上– NGS技術(遺伝子パネル検査)の普及– cfDNA測定技術の導入
医薬品開発コストの高騰を受け、開発の効率化に向けた議論が加速– Renovation of ICH E6/E8 GLs, 21st century cures act @U.S., CIN project @Japan– 議論されているテーマとして代表的なもの(抜粋)
• Master protocol• Use of real world data (e.g., patient registry)
10FDA work plan for 21st century cures act (June, 2017)https://www.fda.gov/RegulatoryInformation/LawsEnforcedbyFDA/SignificantAmendmentstotheFDCAct/21stCenturyCuresAct/default.htm
Domínguez-Vigil IG, et al. Oncotarget 2018. / Prasad V. JAMA Oncol 2018.
OUTLINEOUTLINE
11
がん薬物療法の変遷– バイオマーカー情報を活用する臨床試験の一般的な考え方
近年の動向を踏まえて議論されていること– マスタープロトコル– 疾患レジストリ等の利活用
カスタム遺伝子パネルが存在しなかったら・・・
非小細胞肺がんの例
• 対象集団を特定するまでCDxによる検査が複数回必要になる• プロジェクト単位でスクリーニング研究を立ち上げなければならない
遺伝子パネル普及による恩恵– 複数集団・複数薬剤を1つのプロジェクト内で評価可能となった
12
EGFR
osimertinibdacomitinibなど
ALK
alectiniblorlatinibなど
ROS1
crizotinibentrectinibなど
BRAF
dabrafenibtremetinib
RET
LOXO292BLU667
MET
crizotinibcapmatinib
PD-L1
pembrolizumabnivolumabなど
開発中
Master protocol
One overarching protocol designed to answer multiple questions:– Multiple treatments– Multiple diseases– Multiple subgroups defined by biomarkers
Three types of master protocol– Umbrella trial: multiple treatments assessed in multiple enriched sub-trials for one disease– Platform trial: sub-trials continually enter and exit– Basket trial: one treatment for multiple diseases with specific biomarker status
13
Answer more questions more efficiently and in less time.
Renfro LA and Mandrekar SJ. J Biopharm Stat 2017. / Renfro LA, et al. Cancer Letters 2017.
Umbrella trial
複数のサブ集団を単一試験で評価– カスタム遺伝子パネル検査の結果に応じてサブ試験に登録– 共通インフラによる恩恵
• 遺伝子検査のSOP、EDC、有害事象報告など
例: LUNG-MAP(SWOG-1400)– 扁平上皮非小細胞肺がんを対象– パネル検査: FoundationOne (approved in 2017)– 複数の製薬企業が参加
– サブ試験は通常のRCT/単群試験であり、デザイン・統計解析で特別な留意事項はない
– 重要なのはスピード!
14https://www.swog.org/sites/default/files/docs/2017-11/UpdateSlides_0622.pdf
Basket trial
特定の遺伝子異常を有する集団でがん種横断的に評価
個別がん種で開発する場合と比べて何がメリットか?– 共通の臨床試験インフラを用い、リソースを有効利用– 開発困難ながん種でも適応取得が期待できる
FDAドラフトガイダンスで述べられている特徴– 基本的には探索的な位置づけ– 奏効割合をエンドポイントとした単群試験が基本– なるべく試験途中で無益性を検討すべき
15
Heinrich MC, et al. Clin Cancer Res 2008.
https://www.fda.gov/downloads/Drugs/GuidanceComplianceRegulatoryInformation/Guidances/UCM621817.pdf
事例: BRAFV600E変異に対するvemurafenib(メラノーマ以外を登録)
– 大腸がんで治療効果を認めなかった理由• BRAFの上流/下流から増殖シグナルが伝わってしまう
– 現在、3剤併用療法の第III相試験(BEACON-CRC)が進行中
16
Hyman DM, et al. N Engl J Med 2015.
図: https://am.asco.org/sites/am.asco.org/files/styles/daily-news-infographic/public/Pathway.Braf_.Figure1.jpg?itok=9ytjWn2O
vemurafenib + cetuximabArm A - Triplet Therapy
Binimetinib + Encorafenib + Cetuximabn=205
Arm B - Doublet TherapyEncorafenib + Cetuximab
n=205
Arm C - Control ArmFOLFIRI + Cetuximab or irinotecan + Cetuximab
n=205
DISEASEPROGRESSION
Random
ization
DISEASEPROGRESSION
DISEASEPROGRESSION
Continued
follow-up
for evaluation of O
SPatient population• BRAF V600E
mutant• 1-2 prior
regimens in metastatic setting
n=615
Safety and tolerability will be assessed in patients receiving binimetinib, encorafenib and cetuximab for the treatment of BRAFV600E-mutant metastatic colorectal cancern=30
SAFETY LEAD-INRANDOMIZED PORTION
Tumor-agnostic approachによる迅速承認 @FDA
事例: MSI-H固形腫瘍に対するpembrolizumab– 2017年5月にFDAで迅速承認
• 複数試験のMSI-H症例149例を評価• 複数の市販後調査が要求されている
17https://www.accessdata.fda.gov/drugsatfda_docs/label/2018/125514s037lbl.pdf
事例2: TRK融合遺伝子陽性例に対するlarotrectinib– 2018年11月にFDAで迅速承認– 複数の市販後調査が要求されている
18
Drilon A, et al. N Engl J Med 2018.
探索的な単群試験のデザイン・統計解析
primary endpointは奏効割合
閾値と期待値を設定– 閾値:これ以上悪ければ無効と判断できる値– 期待値:十分に有効性が期待できる値
• この値に近ければ第III相試験がpositiveになると期待できる値
「奏効割合が閾値に等しい」という帰無仮説を検定
19
Basket trialのデザイン・統計解析
(1) 通常の単群試験と同じ評価– 完全に同一集団とみなす– 同じ閾値・期待値– バスケット単位で結果を評価
(2) がん種毎の評価– 似通った集団という特徴は無視– 別々の閾値・期待値– がん種毎に結果を評価
20
常に(1)の状況が想定されるとは限らない「似通った集団」という特徴を活かして(2)の評価ができないか?
Disease (R/N) ORRED.LH (6/14) 42.9%NSCLC (8/19) 42.1%ATC (2/7) 28.6%BD (1/8) 12.5%CRC.vc (1/26) 3.8%CRC.v (0/10) 0.0%
BRAF V600E試験の例• どのがん種も閾値は同じ(ORR=15%)• 似通ったグループを一纏めにして評価した
方が効率良く解析できる(つまり、有効性を主張しやすい)
ED.LH: ランゲルハンス細胞組織球症ATC: 未分化甲状腺がん, BD: 胆管がん
バスケット試験のデザイン・解析
バスケット試験の特徴– 効果が異質な集団が混ざっている– 一方で効果が似通った集団も存在する(ことが強く想定される)
シンプルなアプローチ・メタ解析のアプローチは特徴がうまく考慮できない
ベイズ流アプローチ– バスケット試験の特徴を活かした解析が可能– サンプルサイズや中間解析が柔軟に実施できるメリットがある
21
OUTLINEOUTLINE
22
がん薬物療法の変遷– バイオマーカー情報を活用する臨床試験の一般的な考え方
近年の動向を踏まえた臨床試験デザイン・統計解析– マスタープロトコル– 疾患レジストリ等の利活用
希少フラクションに対する臨床試験の課題
デザイン・解析手法– primary endpoint:奏効割合– 少数例の単群試験で評価する場面が多い
PMDA希少がん対策専門部会の提言 (2017)– 有効性・安全性の検証の度合いが相対的に小さい– 以下の制約のもとで試験を実施しなければならないことが原因
• 同時比較対照群の設置が困難• OS等のtrue endpointをprimaryに設定できない• 実現可能性に配慮した症例数の設定(有意水準および検出力を緩める等の対応が必要)
– 検証の度合いは低いが、限られた情報に基づく承認には一定のメリットがあるだろう
23https://www.pmda.go.jp/files/000223815.pdf
Review of rare cancer trial designs
Applicable designs of clinical trial that can change clinical practice
– Single-arm trials (i.e., use of robust external controls) rather than RCT
– Compromise of the statistical design (α error / power)• approach by the International Rare Cancer Initiative (IRCI): 10% / 80% rather than 5% / 90%
– pragmatic trials (in most cases, enrollment maximization)• international collaboration, broadening eligibility criteria (if logistic difficulties can be overcome)
– Maximize utility: “master protocol” (umbrella / basket / platform)• assessing several interventions (shared control or test treatments only)• assessing several analysis sets (defined by cancer types and/or molecular subtypes)• assessing both (e.g., I-SPY2 or other related trials)
– Bayesian adaptive designs• improvement of statistical efficiency with the use of informative prior (e.g., power prior)
and/or a hierarchical model considering the homogeneity across analysis population 24
Billingham L, Lancet Oncol 2016. / Bogaerts J, Eur J Cancer 2015.
25http://www.kantei.go.jp/jp/singi/kenkouiryou/kaihatsu/dai4/siryou5.pdfhttp://pari.u-tokyo.ac.jp/eng/event/smp150818_mori.pdf
Scheme of CIN
26
c
Projects involved
http://atdd-frm.umin.jp/2017/slide/2-3.pdfhttp://www.kantei.go.jp/jp/singi/kenkouiryou/kaihatsu/dai4/siryou5.pdf
レジストリデータを対照群で活用する状況とは?
観察研究である– 治験データ(『精密な』患者背景・投与・有効性データ)
• GCP準拠なので質の問題は最小化、必ず前向きにデータ収集される– レジストリデータ(『粗雑な』患者背景・投与・有効性データ)
• GCPベースのSDVやデータクリーニングは実施されない(質の低下)• (他院紹介・転院等で)一部の原データは特定不可能なケースが存在• 前向き・後向きにデータ収集される
得られる結果のイメージ
27
targeted therapy
non-targeted therapy
PFS, OS
targeted
ORR
non-targeted
※ 同じ治療ラインで比較する
観察研究データのデザイン・統計解析手法上の論点
データの信頼性– 観察研究では臨床試験と同様の品質管理が困難
• 「承認申請への活用」を目的としたとき、現状では統一ルールがない• 議論のたたき台として「基本的考え方」をAMED林班が作成• ICHでは、E8とE6の改訂で議論される予定
交絡調整– 単群試験・観察研究(特に介入や曝露の効果を推定することが主目的の疫学研究)では主たる問題(ランダム化比較試験では通常問題にならない)
28
観察研究で交絡調整する際の問題
有効性評価で関心のある治療効果とは?– ある集団が「薬Aで治療されたとき」と「標準治療で治療されたとき」の差– 観察研究では、交絡を調整しないと推定できない– 交絡調整法として汎用される手法
• マッチング、層別解析、サブグループ解析• 回帰モデルを用いた方法(いわゆる共分散分析)• 傾向スコア、操作変数法
交絡調整法の主な問題点(※ RCTでは問題にならない)– サポート問題・次元の問題– 欠測データの問題– サンプルサイズに関する制約
29
デザイン・統計解析に関する取組み @AMED林班
(1) 既存の提案手法– 統計的因果推論の手法(傾向スコア、操作変数法)– 既存IPDを活用する単標本検定に基づく推測– 情報のある事前分布を活用するベイズ流アプローチ– その他: Registry-based RCT, Zelen’s randomization, Threshold-crossing design
(2) 上記の活用事例30
主要な参考文献Yue, L. Q., Lu, N., & Xu, Y. (2014). Designing premarket observational comparative studies using existing data as controls: challenges and opportunities. Journal of biopharmaceutical statistics, 24(5), 994-1010.Dixon, D. O., & Simon, R. (1988). Sample size considerations for studies comparing survival curves using historical controls. Journal of clinical epidemiology, 41(12), 1209-1213.Ibrahim, J. G., Chen, M. H., Gwon, Y., & Chen, F. (2015). The power prior: theory and applications. Statistics in medicine, 34(28), 3724-3749.Lauer, M. S., & D'Agostino Sr, R. B. (2013). The randomized registry trial--the next disruptive technology in clinical research?. The New England journal of medicine, 369(17), 1579.Ellenberg, S. S. (1997). Informed consent: protection or obstacle? Some emerging issues. Controlled clinical trials, 18(6), 628-636.Eichler, H. G., Bloechl-Daum, B., Bauer, P., Bretz, F., Brown, J., Hampson, L. V., ... & Lumpkin, M. M. (2016). “Threshold-crossing”: A Useful Way to Establish the Counterfactual in Clinical Trials?. Clinical Pharmacology & Therapeutics, 100(6), 699-712.
SCRUM-Japan registry database
31
QC file
SCRUM-Japan Registry
Contract・Clinical data (STMD)
AMED Ohtsu groupIn development
GenomeData vcf., tsv. file
Laboratory
SCRUM-Japan Clinico-Genomic Database
Group share・Genomic data(vcf., tsv.)・Clinical data(non CDISC)
Already Built up
Clinical Data
DataCapture(EDC)
Hospitals
SDTMDataset
Data Center
Pharma
http://atdd-frm.umin.jp/2017/slide/2-3.pdf
Example: TRIUMPH trial (now recruiting)
32
HER2 amplified CRC screened in SCRUM-
Japan(HER2 ≥ 4 copies)
TRIUMPH study7 participating centers
Natural history data
(external control)
HER2 amplified CRC screened in SCRUM-
Japan(HER2 ≥ 4 copies)
13 non-participating centers
HER2IHC
HER2ISH
HER2 positive
Central laboeligible
ineligible
Natural history data
(internal control)
Investigational regimen
TRIUMPH study
SCRUM-Japan Registry
SCRUM-Japan GI-SCREEN
20 participatingcenters
Nationwide CancerGenome Screening
Registry
out of study for any reasons
Primary endpoint: ORR (threshold: 5%, expected: 30%)Sample size: 18 (one-sided α: 2.5%, power: 80%)When accrual is rapid, sample size will be increased to 25 (90% power)