ホーム> 政策について> 審議会・研究会等> 中央社会保険医療協議会費用対効果評価専門組織> R4.9 エムガルティ

 
 

2022年9月30日 中央社会保険医療協議会費用対効果評価専門組織 第6回議事録

○日時

令和4年9月30日(金)13:00~

 

○場所

オンライン開催

○出席者

田倉 智之委員長 斎藤 信也委員長代理 池田 俊也委員 木﨑 孝委員
新谷 歩委員 新保 卓郎委員 中山 健夫委員 野口 晴子委員
花井 十伍委員 飛田 英祐委員 米盛 勧委員
貴島 晴彦専門委員 高橋 祐二専門委員 福田 敬専門委員
国立保健医療科学院 保健医療経済評価研究センター 白岩上席主任研究官
<事務局>
中田医療技術評価推進室長 他
 

○議題

○エムガルティに係る総合的評価について

○議事

○費用対効果評価専門組織委員長
 次はエムガルティ皮下注について公的分析による再分析結果が提出されておりますので、公的分析及び企業からの意見聴取を行った上で、企業分析の内容及び公的分析による再分析結果の審査並びに費用対効果評価案の策定について先生方に御議論をいただきたいと思います。エムガルティ皮下注について企業から意見聴取をした後、御議論をいただきます。
 まずは事務局から説明をお願いいたします。
(事務局・国立保健医療科学院より説明)
○費用対効果評価専門組織委員長
 ありがとうございました。
 それでは、議論に先立ちまして、まず本製品に関わる公的分析の再分析結果に対する意見の聴取を行いますので、事務局は企業を入室させてください。
(意見陳述者入室)
○事務局
 事務局でございます。
 企業の皆様、準備が整いましたので、よろしくお願いいたします。
○費用対効果評価専門組織委員長
 私は費用対効果評価専門組織委員長です。
 早速ですが、10分以内でエムガルティ皮下注の総合評価について御説明をお願いいたします。続いて、質疑応答をさせていただきます。
 では、始めてください。
○意見陳述者
 意見陳述を始めさせていただきます。
 2枚目を御覧ください。企業の意見陳述の論点は、企業分析と公的分析のQOL値の測定法の違いについてでございます。これにより増分QALYの評価が10倍ほど変わってきておりますので、極めて重要な論点と認識しております。
 3枚目を御覧ください。QOL値の測定についてお話しするに当たり、まずは片頭痛の症状について御説明をいたします。片頭痛は発作性の疾患でして、重症の発作期には外出、受診が困難になるほどの症状がございます。一方で、発作間欠期には症状がないかあるいは少ないため、発作のない日にQOLを評価しても、その日その時点でのQOLが片頭痛の症状の影響を受けていないということになります。
 4枚目を御覧ください。片頭痛の症状に発作のある日とない日があるという点を踏まえ、EQ-5Dの調査票を見ますと、今日の健康状態を伺う調査票であることが分かります。よって、発作のない日にEQ-5Dを測定いたしましても、そのQOL値は片頭痛の症状の影響を受けていません。逆に、重度の発作のある日は外出、受診ができませんから、病院でEQ-5Dを測定することもできません。つまり、片頭痛患者さんの場合、EQ-5Dによる測定は片頭痛の症状の影響を受けていない日のデータばかりが集まることになり、真のQOLよりもよいQOLが観察されるという系統的バイアスが発生します。このことについては、科学院と見解が一致をしております。
 5枚目を御覧ください。QOL値を縦軸に、横軸に月間の片頭痛発作日数をプロットした図をお示しします。臨床試験で直接測定したデータが紫、当社の使用したマッピングした結果が緑でございます。紫のプロットは、片頭痛発作日数によらずほとんどが0.8あるいは1.0、すなわち完全な健康に近いQOLを示しております。一方、緑のプロットは、片頭痛日数が多くなるに従いQOL値も低下していることが確認できます。右下の表に月間片頭痛日数とMSQ、EQ-5Dの相関係数を示します。当社の用いたMSQがマイナス0.5程度とある程度の負の相関を示すのに対し、臨床試験で直接測定したEQ-5Dはマイナス0.2程度と、無視できるとされる相関しか示しておりません。
 6枚目を御覧ください。ここで両者のアプローチを整理しておきます。科学院は臨床試験で直接測定したEQ-5Dを使用いたしました。一方で、企業はMSQという疾患特異的尺度を用い、EQ-5Dへのマッピングを行いました。科学院のアプローチの根拠はガイドライン8.2に準拠するという点でございました。一方で、当社はガイドラインを尊重しつつもEQ-5Dへの系統的バイアスをより軽減する方法としてMSQを用いたマッピングを用いております。重要なポイントは、このマッピングで推定されたEQ-5Dは臨床試験で測定されたものではなく、ウェブ調査で測定したEQ-5Dであるという点でございます。なお、この両者のアプローチにより増分QALYに10倍近い差異がございます。本論点は極めて重要な内容であると認識しております。
 7枚目を御覧ください。企業のアプローチが適切であることの一つの根拠として、企業の用いているEQ-5Dがウェブ調査由来のものであることを挙げさせていただきます。片頭痛におけるEQ-5D評価の問題点は、片頭痛発作のため、外出ができない日には病院におけるQOL値測定もまた不可能であることでした。御自宅でも回答が可能なウェブ調査は、これを一部でも解決する可能性があります。
 8枚目を御覧ください。2つ目の根拠は、当社の用いたデータは例数が多いことです。科学院の用いた臨床試験のデータは170~280例程度で、特に片頭痛日数が多い患者様が少なく、ばらつきの多いQOLデータを扱うのに十分でない可能性があります。一方で、当社の用いた研究は例数が9,000例に近く、安定した推定が可能です。
 9枚目を御覧ください。3つ目の根拠として、当社の方法もガイドラインをおろそかにしたものではないという点でございます。分析ガイドラインの8.2.2には、選好に基づく尺度により測定したQOLのデータがない場合、マッピングを許容するとしております。臨床試験のデータの例数は月間の片頭痛日数ごとのEQ-5Dをそれぞれ推定するという観点からは相当に少ないため、当社は本件はこの規定によりマッピングも許容される状況と考えます。
 10枚目を御覧ください。海外の多くのHTA当局もMSQからのマッピングをベースケースとして採用している点も主張させていただきます。例えばNICEにおいては、まずErenumabの費用対効果評価において、MSQからのマッピングが妥当と認められ、その後、片頭痛の予防治療のQOL値評価にはマッピングが活用されてきております。
 11枚目を御覧ください。NICEのガイドラインも患者から直接測定されたEQ-5Dが「preferred」であり、それが使用不可能な場合のみマッピングが利用可能であるとしており、これは日本のガイドラインと同様の記載です。にもかかわらず、片頭痛予防薬の評価においてはマッピングが許容されたという点を強調しておきたいかと思います。よって、日本のガイドラインの文言に照らしても、マッピングは許容される状況であると考えます。
 12枚目を御覧ください。こちらにつきましては、○○先生より御説明をいただきたいかと思います。○○先生、お願いいたします。
○意見陳述者(専門家)
 どうも○○です。
 この12枚目の表で、横軸に月当たり片頭痛日数が、縦軸にQOL値が示されていて、この科学院で採用された回帰直線と企業さんが採用した回帰直線を比較しますと、我々はガルカネズマブを使って片頭痛の日数が下がった患者さんと慢性片頭痛の患者さんで頭痛日数の多い患者さんをたくさん診ているのですけれども、そういった経験からいうと、企業側の採用した回帰直線のほうがより妥当により患者さんのディスアビリティーをよく反映したラインになっているのではないかと思います。
 以上です。
○意見陳述者
 ありがとうございました。
 それでは、13枚目を御覧ください。増分QALYで科学院と企業の間で大きい集団ですと10倍程度の差がついてしまいました。片頭痛の疾病負担が患者様のQOLに大きな負荷を与えていること、片頭痛発作の発生頻度、また、本剤がそれを有意に軽減させることを鑑みますと、科学院の分析で得られた増分QALYはあまりに些少であり、臨床感覚との乖離が著しいと言わざるを得ません。
 14枚目を御覧ください。まとめでございます。本意見陳述では、科学院の御指摘の中で最もインパクトの高いQOL値測定について意見を述べました。
 最後に、○○先生より、EQ-5Dに関しコメントをいただきたいかと思います。○○先生、あと2分少々ございます。よろしくお願いいたします。
○意見陳述者(専門家)
 ○○でございます。よろしくお願いいたします。
 私はEuroQolというこのEQ-5Dを開発したところのメンバーもやっております。先週、このEuroQolのミーティングがありまして、こういう間欠的に発症する疾患においてどのようにEQ-5Dという尺度を使い得るかというテーマの発表もありましたので、その場で議論した結果とともに報告させていただきます。
 今日、これはもう本当にトゥデーを扱うというのは、コンセンサスが得られておりまして、そうすると、どうしても抜け落ちがちであると。なおかつひどいときには病院に行かないという系統的なバイアスが発生するようなもので、そのまま使うのは適切ではないというのはほかの疾患でも、例えばCOPDのような疾患でも指摘されておりまして、例えばこれを1日ではなくてこの1週間とか、この4週間とか、あるいは何回ぐらいありましたかというような少し改良したバージョンのほうがよく捕捉できるのではないかということが今回発表されておりました。実際にそれも示唆されております。
 このような間欠的な疾患について、マッピングとそのままとどちらが適切かということに関して議論をさせていただきまして、いわゆるディスクリミネーション、すなわち症状の軽重をきっちり分解できるかどうかが最も大事であるという意見を各研究者の方から得ております。その意味でも、開発元としてもそのまま常にEQ-5Dを使うのではなく、状況によってはマッピングその他は許容されるという考えであると、私自身、メンバーとして考えております。
 以上です。
○意見陳述者
 以上で企業の意見陳述を終わらせていただきます。御清聴ありがとうございました。
○費用対効果評価専門組織委員長
 それでは、委員の方から御意見、御質問はございますでしょうか。
 ○○委員、お願いします。
○○○委員
 御説明ありがとうございます。
 2点か3点か伺いたいのですが、一つは5枚目のスライドで示していただいたこの線の乖離のことなのですが、まず、緑のほうはマッピングのものでイギリスのタリフで、紫は日本のタリフという理解でいいですか。
○意見陳述者
 タリフにつきましては、御指摘のとおりだと思います。
○○○委員
 分かりました。そうなりますと、痛みがひどいとか、特に3Lの場合ですと、イギリスではかなりマイナスの値が痛みが強いと出てくる、日本はあまりマイナスにならないというので、タリフによって全く特に症状の重い方、特に痛みのドメインに関しては値が変わって出てくるので、これはそれを反映したもののように見えるのですが、その解釈は間違っていますか。
○意見陳述者 御指摘ありがとうございます。しかしながら、タリフの違いのみによってこの差が説明できるとは考えてはおりません。
○○○委員
 何%説明できますか。
○意見陳述者
 申し訳ございません。そちらについてはデータは持ち合わせておりません。
○○○委員
 では、この中の幾分かはタリフの違いで乖離が出てしまったということでしょうか。
○意見陳述者
 その割合があるとは考えます。
○○○委員
 分かりました。では、そのように説明していただくことも必要だと思います。これが1つ目。
 2つ目は、MSQからのマッピング、これはイギリスの値あるいはイギリスで開発されたマッピング関数なのでしょうか。そのように異なった国で、タリフも違う国で開発されたマッピング手法を使って、それを使うことを許容している国はあるのですか。例えばフランスなどはフランスで開発したマッピングの関数でないと駄目とか、人種も違う、全然文化も違う、特に日本とUK、タリフが全然違う、そういうところのマッピング関数を使って意思決定というのは問題があると思うのですが、それは多くの国が許容されていることなのでしょうか。特に10枚目を見ると、MSQをいろいろ使っているけれども、それは全くそういった状況の違う、環境の違うような、例えば日本でつくったマッピング関数はこれらの国で受け入れられるでしょうか。
○意見陳述者
 ありがとうございます。
 こちらにつきましては、○○先生、何か知見などがあればお話しいただきたいのですが、いかがでしょうか。
○意見陳述者(専門家)
 ありがとうございます。
 各国それぞれマッピング関数を使ったものを受け入れているところですけれども、必ずしも自国のマッピング関数でないと受け入れないということでは私はないと理解しております。
○○○委員
 質問は、日本でつくられたマッピング関数をこれらの国で受け入れると思いますか。
○意見陳述者(専門家)
 そちらに関して、単純に日本でつくられたMSQスコアをマッピングしたものを受け入れるか否かということと、ある意味で通常のEQ-5Dを使ったときにどれほど乖離が生ずるかということとバランスを取って考えるべきと私は思います。ですから、単純にその国が遠いから受容するしないという、例えば通常のEQ-5Dでも十分にQOLが捕捉できるようなものに関して非常に遠く離れたこの国のタリフを使うというのは、あるいはマッピング関数を使うというのは、これは誰も許容しないと思います。ただ、このような領域においてある程度間欠的に発症する領域において、通常の使い方が非常に厳しい状況にあると。そういうことであれば、マッピングの許容性もより増すと考えております。実際にこれまで様々な臨床研究でも、例えばタリフに関して言えば、各国それぞれのタリフを使わず、共通のUKのタリフを使った研究をするというのは国際共同治験などでも行われておりますし、EuroQolとしてもそういうことは実際には許容している状況にあります。ですから、一概に距離が離れているから使える使えないという議論ではなくて、これは疾患の状況、あるいはこの疾患の特性をEQ-5Dというスケールで十分に捕捉できるのかを総合的に考えてやるというのが、もちろん字面どおりにガイドラインを見たときにどうなっているかということよりも私は重要だと考えます。
○○○委員
 もう一点、EQ-5Dでは結局こういった片頭痛のように1日の中でも状態が変化するようなもので、どのポイントで計測しているかによってこの値は片頭痛の患者さんのQOLそのものをきちんと把握できていないのではないかというのは、実はこのEQ-5Dに限らず今までいろいろな測定の中でも問題視されているかと思うのですけれども、今回それを解決するためにMSQからEQ-5Dのマッピングを使ったということですが、そもそもEQ-5Dを使った値が信用ならないならばMSQからマッピングした値だって信用できないはずで、EQ-5Dの値そのものがこの疾患には向いていないわけですね。だから、マッピングを使うとより状況が改善するということが、感度がどうとかということは置いておいて、マッピングしたその先の値がそもそも実態を把握していない値だとすると、マッピングで解決できる部分は相当に限定的のようにも思うのですが、いかがでしょうか。
○意見陳述者
 ○○先生の御指摘されたEQ-5Dの測定に関しては、その日の健康状態を聞くものなので、発作が起きているとき起きていないときを切り分けることは難しく、発作があるときのQOLを測定することは難しいのではないかということだと思うのですけれども、これは臨床試験で取られたEQ-5Dと当社のMSQでの推定先であるところのウェブ調査のEQ-5D、どちらがその問題を解決するに近いのかというところになるかと思います。臨床試験でEQ-5Dを測定することは、それすなわち病院に患者様は行かれて、そこでEQ-5Dに記録しているということは間違いございませんので、そちらは少なくとも病院に行けているような状態であるという比較的よい状態と認識しておりますが、ウェブ調査でありましたら家におられても回答自体は可能であるというところでございますので、完全にバイアスが除去できるとは思えませんが、ある程度は家を出られない状態である患者さんのQOLを測定できないというバイアスを軽減できると考えております。
○○○委員
 むしろ重いときこそ答えられる、重いときの値を答えるというようなバイアスがかかるのではないかという懸念をしますが、つまり、ウェブ調査で測った値は1日の中でも悪いときの値が出てしまうのではないかと。例えば片頭痛は3時間ぐらいで治る方もいて、どうでしょう。何も症状がないときの値を答えるわけがないですね。ただ3時間だけ苦痛で残りの21時間は症状がないという、その症状がない時間のほうが長いかもしれないので、そういった重いときのほうが余計これは答えてしまうのではないかというバイアスを懸念しますが、これはどのようなときに答えるように患者さんに指示しているのですか。
○意見陳述者
 ありがとうございます。
 そちらにつきましては、もともとの研究が当社のものではございませんので、詳細のところまでは知り得ることはできませんけれども、特に指定をしていないのではないかとは考えます。一方で、EQ-5Dで聞く対象としては、現行のEQ-5Dにおきましては本日のということでございますので、逆に言いますと、今、この瞬間のということではなく本日のQOLを聞いているところになりますので、そこは逆に本日のと捉えてよろしいのではないでしょうか。
○○○委員
 そうすると、本日のというときは痛みがどうですかと聞いたら、それを平均して答える人はないというか、平均などできないので、一番つらいときを答えるのだろうと私は想像しますが、それは元の文献をよく読んでみたいと思います。ありがとうございました。
○費用対効果評価専門組織委員長
 その他の委員、いかがでしょうか。
 ○○委員、お願いします。
○○○委員
 ○○と申します。よろしくお願いします。
 こうした片頭痛という疾患の特性からして、今、病院に来られないからQOLが取れない、来たときに取っているのは頭痛のない非常にいい状態ので激しいバイアスがかかるとおっしゃいましたけれども、そういうことを自明の前提においてこの薬の効果を見るときに、例えばePROですか、自宅でも答えられるようなQOLとか、そういうものを開発から評価するところに考えようとは思われませんでしたか。
○意見陳述者
 御指摘をありがとうございます。
 我々の臨床研究のパッケージの中のフェーズ3に相当する研究は複数ございます。その中でEQ-5D測定したものは逆に1つしかないのです。ほかのものについてはMSQを取っております。当社といたしましては、一応EQ-5Dをヒト試験では取っておりますけれども、基本的には疾患特異的尺度であるMSQを測定すれば、あえてePROでEQ-5Dを取るようなことをせずとも足りるのではないかというところで開発戦略が立てられたのでないかと推測します。そう考えますと、逆に言いますと、我々は1試験でだけ取られたEQ-5Dをこの効用値としてHTAの文脈で使用されるのは、少し驚きを持っております。
○○○委員
 2点目です。ここはあくまでも費用対効果評価専門組織ですけれども、企業側も御存じのように、費用対効果評価専門組織も、薬価算定組織と連携を取りながら運営すべきだというお話もあるようなので、そちらのほうを少し伺います。このお薬は、薬価算定の段階では加算は認められていませんね。資料を拝見すると、加算を認めるほどの有効性がないような報告に見られるのですけれども、そのときに、御社は頭が痛い日数では効果があまり認められなかったけれども、QOLはよくなっているという御主張をなさっていたと思うのですが、その部分は不本意というか、QOL的なものがうまく評価されなかったというお考えでしょうか。
○意見陳述者
 薬価交渉につきましては私は全くタッチしておりませんで、薬価部門の長である○○からお話をさせていただくのが、○○さん、いけますか。
○意見陳述者
 臨床的な感覚のところを実際はどうなのかというのは、我々というよりかは○○先生にお伺いできればと思っているのですけれども、いかがでしょうか。
○意見陳述者(専門家)
 ○○です。
 先ほどから○○先生と○○先生が御指摘されているように、確かに片頭痛というのは慢性の病態ですので、EQ-5Dみたいにその日の状態だけに着目するのではなくて、もうちょっと長いスパンで見たQOL評価が重要ではないかと思います。PROみたいな形でつくられたのが先ほど来言われているMSQと呼ばれるもので、これは日本で行われたガルカネズマブの研究、CGAN試験ではきちんとMSQのスコアが取られていて、「Journal of pain research」というジャーナルに載っていて、注射して1か月目の段階からスコアが改善して、6か月間のダブルブラインドの時期ずっとそんな状態が維持されているというデータが出ております。また、日常臨床では、MSQ以外にHIT-6という頭痛が生活に与えるインパクトを評価するクエスチョネアがあるのですけれども、私は日常的に使っているのですが、片頭痛の日数の改善とともにHIT-6の値も改善することがほぼパラレルに見られることが分かっていますし、そのスコアの落ち方とか患者さんの印象から考えると、かなりの改善効果が得られるという印象です。また、片頭痛の日数だけがプライマリーエンドポイントとして臨床試験では評価されたのですけれども、片頭痛の日数が下がると一回一回の片頭痛の強度や持続時間も減少していく傾向があるので、日数の減少とともに一個一個の片頭痛発作の重症度も下がっていくことで患者さんのQOLが改善することが、日常臨床ではよく経験されます。
 以上です。
○○○委員
 臨床の先生のお話を聞けて、参考になりました。ありがとうございます。
 最後ですが、御説明の資料の23枚目に、増分QALYとして、CADTHのものが出ていて、右側に科学院と企業の数字があるのですが、CADTHは科学院に近いような数字に見えるのですけれども、いかがでしょうか。
○意見陳述者
 御指摘ありがとうございます。
 こちらはよく見ていただきますと、分析期間が5年となっております。我々のエムガルティの日本におる分析においては25年が分析期間になっておりますので、だから5倍になるのですという話ではないのは理解していますが、スケール感が違うというところを見ていただきたいなと思います。
○○○委員
 ありがとうございました。
 以上です。
○費用対効果評価専門組織委員長
 では、○○委員、お願いします。
○○○委員
 本当に企業もいろいろ難しい問題で御苦労されているなということをすごく感じさせていただきました。このマッピングの手法がどれくらい確立しているのか、マッピングの方法自体がいま一つ分からなくて、この2011年の「Cephalalgia」の8,700例を用いてどのようにされたのか、概要が分かれば少しお教えいただければと思います。また、それ以外のマッピングの方法はどれくらい妥当性が議論されているかということも教えていただければと思います。
○意見陳述者
 ありがとうございます。
 当社の使用いたしましたマッピングのアルゴリズムにつきましては、ウェブ調査を行いまして9,000名に近い方に御回答いただいておりまして、EQ-5DとMSQという疾患特異的尺度を同時に測定しております。あわせて月当たりの片頭痛日数も取っておるのですけれども、今回マッピングをしたのはEQ-5DとMSQの値を用いて換算のプロットをつくっているようなイメージでございます。つまり、同じ日に取られたEQ-5DとMSQの散布図を描きまして、それに回帰直線を引くようなイメージです。そうしますと、MSQのみを測定したときでもEQ-5Dが仮に測定されていた場合どのくらいの値を取るのかを予測する式ができますので、そちらをもってマッピングの式とするということでございます。そちらのソースの9,000例近いデータにつきましては、6か国の方からデータを収集しておりまして、ウェブ調査であったということでございます。
 マッピングがどの程度受け入れられているかという御質問もあったかと思いますけれども、そちらは10枚目のスライドにお示ししておりますとおり、まず、基本分析に使用されているものにつきましては、A型ボツリヌス毒素は分析の時代背景が古いので何とも言えないのですけれども、少なくとも最近の抗CGRP抗体の費用対効果において、この表にお示ししている範囲で詳細が分かる範囲であれば全てMSQからのマッピングが行われていて受け入れられている認識でございまして、マッピングに関する論文も数多く出版されておりますので、そちらにつきましてはある程度確立されておって、使用も視野に入ってくるものではないかと思っております。国内のHTAのガイドラインにおきましてもマッピングということは触れられておりますので、状況に応じて使用が可能なものであるという認識は持っております。
○○○委員
 ありがとうございます。
 シンプルな回帰分析ということであれば、例えば説明率がどれくらいなのかということはどうですか。
○意見陳述者
 そちらについて、統計担当が把握しているかな。○○さん、それは「Gillard et al.」に記載はありましたでしょうか。
○意見陳述者
 そこには恐らくは載っていないですけれども、私たちの付録のスライド20にジラードの方法を使ってマッピングしたときの説明変数、どのぐらい説明できるかという決定係数は載っていまして、一番下のほうを見ていただくと、企業で採用した方法では29.5~37.4%説明できるということがありまして、もしEQ-5Dだけ使うと6.7~10.4%しかできないということで、そういう意味では企業が使ったマッピング方法のほうが説明能力は高いということは言えるかと思います。
 以上です。
○○○委員
 いろいろ難しいですけれども、こういった背景は分かりました。ありがとうございました。
○費用対効果評価専門組織委員長
 その他の委員、いかがでしょうか。
 先に○○委員、お願いいたします。
○○○委員
 1点、先ほどの議論にあった、月当たりの片頭痛の日数とQOLの回帰直線についてお聞きしたいのですが、今回検討された臨床試験のプライマリーエンドポイントが月当たりの片頭痛日数なので、横軸にそれを取ることの理解はできます。ただ、先ほど臨床の先生も説明や企業スライドの前半にも本当に痛くて動けないというような頭痛もあれば程度の軽い発作もあるとのことなので、その程度や重症度によってもQOL値はすごく変わってくるものなのではないのかと思いますが、それでも月当たりの片頭痛の日数だけでQOLの回帰をすることの妥当性について、企業側の考えを教えてください。
○意見陳述者
 ○○先生、ありがとうございます。
 おっしゃるとおりで、日数だけでの回帰になっております。これはまずは実現可能性という観点から、臨床試験でのプライマリーなエンドポイントが月当たりの片頭痛日数であるということでございますが、もし片頭痛の1回当たりの患者さんの負担が一つ一つ軽減しているということが本当にあれば、それは取りこぼしてしまっていることにはなるかもしれませんが、もしエムガルティがそれを軽減するというのであれば、それは取りこぼしているのでもったいないかと思います。
 一方で、この件については臨床の感覚から○○先生からも一言いただいたほうがよろしいかと思いますので、○○先生からお言葉をいただいてもよろしいでしょうか。
○意見陳述者(専門家)
 ○○です。
 ○○先生が御指摘されたように、1か月当たりの片頭痛日数だけでは不十分ではないかという御指摘なのですけれども、非常に大切な点だと思います。ただ、国際頭痛学会の片頭痛の予防療法、予防治療薬のプライマリーエンドポイント、推奨される推定エンドポイントとしては、1か月当たりの片頭痛日数のベースラインからの変化が一番適切だと定められているので、多くの臨床研究ではそれが使われているのですけれども、実はほかのお薬でFremanezumabを対照にしたお薬で、慢性片頭痛の患者さん、非常に1か月当たりの片頭痛日数が高い患者さんを対象にした臨床研究では、片頭痛が起きていた時間などといった単位での評価もなされていて、違う抗体薬ではあるのですけれども、Fremanezumabを使うことで時間帯でも減少して有意差が示されたという経緯がありますので、もうちょっと細かく時間の単位で取っても有意差ははっきり出るのだと思います。
○○○委員
 ありがとうございます。
 確かに日数だけでなかなか説明できない、ただ、臨床試験では国際的に認められているエンドポイントの一つということで解析されていたことは理解できます。
 もう一点よろしいですか。片頭痛に対する痛みに対する感受性というか、その許容度みたいなものに国内外に差はあるものなのでしょうか。国際共同試験として実施、評価されているので、極端に大きな民族的要因の違いはないとは思われますが、痛みに対する国内外での許容される感覚の違いがあるのかについて少しお伺いしたいのですけれども、いかがでしょうか。
○意見陳述者
 こちらも臨床の先生、○○先生からのお言葉をいただくのがよろしいかと思います。よろしくお願いします。
○意見陳述者(専門家)
 確かにこのMSQでも、MIDAS、HIT-6、いずれのPROで評価すると、どうしても日本人の場合はスコアが少し低めに出ることが知られています。これは日本人が痛みに対して結構忍従するというか、我慢強い性格だということが反映されているのではないかと思います。
 あと、目の色なども結構関係があって、日本人の場合は虹彩が黒いということで、片頭痛は結構光過敏があるのですけれども、光過敏のつらさはコーカシアンの方のほうがアジアンの方に比べて強く出る。日本人は結構目が黒いということで、光過敏が欧米の方に比べて比較的弱いというところも、少し片頭痛の発作に対する耐性にも関わっているのかと考えられています。
○○○委員
 その辺りの感覚を伺えるとすごく助かりました。ありがとうございます。
○費用対効果評価専門組織委員長
 では、○○委員、お待たせしました。どうぞお願いします。
○○○委員
 ○○です。
 ここで対象になっている反復性の片頭痛や慢性の片頭痛の患者さんのイメージが湧かないので、もう少し教えていただければと思っています。片頭痛といいますと相当強い頭痛で患者さんにとってはつらいのかなと思うのですけれども、慢性の片頭痛ですと、そういう片頭痛が1か月のうちに20日ぐらいあるということかと思うのですが、そうすると、患者さんにとってそれはもう寝たきりになるぐらいの状況になってしまうのか、あるいは治療薬を使いながら今日は痛いなぐらいで何とか普通に日常生活が送れるようなものなのか、その辺の病気のイメージ、少し教えていただければと思います。
○意見陳述者(専門家)
 ありがとうございます。
 反復性片頭痛と慢性片頭痛に分けられるのですけれども、線引きは1か月当たり15日以上頭痛がある状態が常態化している場合は慢性、それ以外は反復性ということで線引きしているのですけれども、反復性の場合は一回一回の発作がかなりはっきりしていて、発作がなくなると間欠期には結構楽になる感じなのですけれども、慢性片頭痛の患者さんですと何らかの痛みが残るような感じが常態化してしまって、そこに強い発作が加わる、重畳するような形になる。慢性片頭痛の患者さんのほうが一般に非常に支障度が高いので、ひどい方は寝たきりになっている方もいるのですけれども、意外と痛みに慣れてしまって、これが当たり前だと考えてしまって、強い発作のときだけ薬を飲んで耐え忍んでいるとか、中には慢性の片頭痛なのだけれども、仕事に行かなければいけないので毎日OTCの鎮痛薬を飲んで仕事に行っている、だから、その場合は薬剤の使用過多による頭痛も重畳して状態が実は薬によって悪くなっているのだという患者さん、結構様々です。でも、一般には慢性片頭痛の患者さんのほうが生活支障度は高いということになります。
○○○委員
 ありがとうございます。
○費用対効果評価専門組織委員長
 その他、委員、いかがでしょうか。大体御質問は出尽くしましたでしょうか。
 では、最後に私から1点改めての整理のためにお聞きしたいのですけれども、先ほど痛みに関しての議論が随分ございましたが、バックペインやがん疼痛でもそうですし、先ほど臨床の先生もおっしゃっていましたが、海外の方に比べると日本人は比較的痛みに対する忍容性が高くて、こういったQOL、EQ-5Dのデータを取っていくと、日本は比較的よい数字が出てきて、差分の分析をすると伸び代がないので効果が小さくなってしまう傾向などが多々あるようです。今回MSQについてもそういったところについて配慮がなされているかどうかというところで、私も専門外なのですけれども、皆様方でお使いになった論文ですと、MSQのRR、RP、EFという3つの指標が56から67ぐらいなのですが、最近、2022年に出たメガスタディーの結果では、日本人ですと3つの指標が77から81ぐらいということで、10ポイント以上開きがあるようなのですが、この辺り、少し日本の臨床や日本人の特性を踏まえて、例えばマッピングするにおいても補正みたいなものを議論されたことがあるのかどうかとか、実際にこういったものを使って補正ができるのかについてコメントをいただきたいと思うのですが、いかがでしょうか。
○意見陳述者
 ありがとうございます。
 補正という観点、とても科学的には興味深いところでございますが、本当に申し訳ないです。この分析に許された限られた時間の中でそこまで議論することは難しかったかと思います。あと、科学院の使われている臨床試験のデータもまた国内、日本人の試験ではございませんので、国際共同試験でございますので、それぞれのデータに関しましては、むしろ日本人のほうが極めて少ないデータであるというところがございますので、なかなかそういったところの調整は技術的あるいはデータの分量的に難しかったのではないかと思います。
○費用対効果評価専門組織委員長
 先ほど企業様も指摘されていたとおり、日本のEQ-5Dは皆様方の分析よりも少し高めに出ているという話は、そもそも日本人の集団の特性として痛みの要素を中心に効果が上のほうに出ているので、もしかすると、ある一定の範囲で科学院が分析した内容は日本人の特性をより反映している可能性もあるのではないかと思って見てはいたのですけれども、この辺の解釈についてはいかがでしょうか。
 お願いします。
○意見陳述者(専門家)
 例えば先ほど○○先生のところでも説明可能性という話がありましたが、5枚目のスライドを御覧いただいたときに、そのままの値だとどうしても1.0に張りついてしまう部分はあります。これは仮にタリフとしてどういう値を使ったとしても国を問わずに起こってしまうことであって、ある程度UKのタリフと日本のタリフということを考えなくても、そのまま使うと全部1、1点満点と答えてしまう人が少なからずいると。その問題点は何らかの方法で解決すべきであると。あるいは、それをそのまま受け入れるわけにはいかないのではないかということで、先ほど申し上げたような研究がなされていると理解しております。ですから、例えば海外のタリフをベースにしたマッピングを使うこと、これ自体は研究上のリミテーションになります。
 しかし、マッピング関数が海外のものしかないということが、もともとこの片頭痛領域で言われている、どこの国のタリフをどのように使おうが、どの国のバージョンを使おうが、今日のQOLを聞くという形が系統的なバイアスを生んでしまうという欠点については、それがある意味で両方のどちらの欠点が大きいかという話になってしまうものであって、一方に欠点があることが他方を無批判に採用していいということにはならないと考えております。強いて言えば、日本人の痛みに対するいわゆる我慢強さということを、もしかするとこれも場合によっては質問票自体でキャプチャーし切れない限界と取ることも私はできるかと思いますので、我慢強いということで痛みに関する点数が低いということをそのまま受け入れていいのかということは、こうした痛み領域の評価の中全体で場合によっては考えないといけないことなのではないかと自分自身は考えております。
 どうあれ、私はこの正解は基本的には科学院案と企業案の間にあると思っています。ただ、現状の日本のHTAの在り方では間というところに回答を持っていくことはできないと。ただ、どちらにも傷があって、一方の傷が大きいからもう一方は無謬であるというような結論は少なくとも本来は出せない。ただ、判断上出さざるを得ないということはあるかもしれませんが、最後のは私の単なるコメントですけれども、どちらにもかなり大きな限界点があって、それはQOLの問題、質問票の問題、さらにマッピングの問題、これは全て考えないといけない問題だと考えています。
○費用対効果評価専門組織委員長
 ありがとうございました。
 私の御質問の意図は、天井効果の話は天井効果の話として、また別のテクニカルな議論がありますが、その天井効果の話を踏まえても、日本人のQOLの測定において我慢強さというか痛みに対する忍容性が高いということはいろいろな研究や領域でも出ていますので、今回、MSQ、EQ-5Dの傾向に関しては、一定の理解ができるのではないかということについて御意見をいただこうかと思ったところであります。企業様、改めてコメントは追加でございますか。なければこれで終了させていただきます。
○意見陳述者
 特に追加させていただくことはございません。
 ○費用対効果評価専門組織委員長
 よろしいでしょうか。
 その他の委員の先生方、いかがでしょうか。少し時間が長引きましたけれども、重要なテーマでありますので遠慮なく御質問いただければと思いますが、よろしいでしょうか。
 ○○先生、お願いいたします。
○○○委員
 先ほどから日本とイギリスのマッピングで使われたデータの違いというところで、換算される、マッピングされるときに線形回帰をされて、そこで当てはめられたということをお聞きしましたので、技術的な面から考えると、日本で同じ解析をしたときとイギリスで同じ解析をしたときに、傾き自体が違うのかというところは重要なポイントだと思うのですけれども、日本人が取るべき範囲が狭いというところは、全体に切片、平行移動ですね。傾きがそのまま平行移動をするだけですので、その場合は群間比較したときは相殺されるものなので、傾きさえ同じような傾きで推計ができていれば、イギリスのデータを使ったマッピングも日本人集団でうまくいくことも可能性としては高いと思います。ですから、一概に国が違うから使えないというところは統計的に見ても飛躍し過ぎるのかなというところで、企業さんにお伺いしたいのは、MSQとEQ-5Dで線形回帰をかけられたこの傾き自体が国のデータによって違うというエビデンスはありますでしょうか。
○意見陳述者
 ○○さんからももし補足があれば発言いただきたいのですけれども、誠に恐れ入りますが、基本的に我々はこのMSQからEQ-5Dというものの回帰のパラメータを論文から取ってきておりまして、生のデータは当社は保有しておりませんので、そちらを直接対応させることは困難であるかと思います。一方で「Gillard et al.」、論文から持ってきた際のEQ-5Dの特性と日本人のEQ-5Dの特性の差はもちろん引き継ぐのかなというところは感じてはおります。そこに関しては可能性としては限界である可能性はございます。
 ○○さん、何かありますか。
○意見陳述者
 補足させていただきます。ジラードのデータを使って私たちの臨床試験のデータを当てはめるときは、私たちのマッピングの方法で出てきたスロープはかなりよく傾いていて、それに対してもし科学院の方法を使うとほとんど傾きはないと言えるぐらい、無視できる程度ぐらいで、差が本当に平坦のような感じになっていてフラットになる感じだから、そういう意味ではあまり動いていない、説明できないぐらいのレベルと言えるかと思います。
○費用対効果評価専門組織委員長
 ありがとうございます。
 お願いします。
○○○委員
 恐らく今のはスライド5ページのスロープのことを言われていて、横軸が日数で2つのEQ-5DとMSQを相関させたものだと思うのですが、私がお伺いしているのは、EQ-5DとMSQを相関させた回帰直線をマッピングに使われたということをお聞きしましたので、その解析を仮に日本にデータでやった場合に、切片が移動するのは私は統計的に問題ないと思っていますので、傾き自体が変わるような国民の特性があるのかをお聞きしました。データがないということなので、それで理解をしました。
○費用対効果評価専門組織委員長
 では、その他の先生、いかがですか。よろしいでしょうか。
 それでは、これで質疑応答を終了いたします。企業の方は御退室ください。どうもお疲れさまでした。
(意見陳述者退室)
○事務局
 事務局でございます。
 企業の方の退室が確認できましたので、どうぞよろしくお願いいたします。
○費用対効果評価専門組織委員長
 闊達な御意見、御質問をありがとうございました。
 企業からの意見聴取を行いましたが、科学院さん、今までの意見を踏まえて改めて追加の御説明はございますでしょうか。
○国立保健医療科学院
 ありがとうございます。
 科学院から企業資料に対してコメントさせていただきたいと思います。
 4ページ目ですけれども、ここにありますように、想起期間の問題はEQ-5Dが当日の健康状態を尋ねる尺度であるため、例えば当日元気になっていれば前日あるいは前々日等に起こった片頭痛がQOLとして考慮されないという点について、我々科学院としては言及しているところです。しかし、重症患者が来院できないという問題は、想起期間とは別の臨床試験上のデザインの問題であり、想起期間の問題とは関係がないと考えます。重症の場合、規定のビジットで来院できず回答を回収できないという問題が生じるのは、企業側が活用したMSQも同様であり、その場合、マッピングを用いても問題の解決にはならないものと考えています。
 5ページ目です。先ほど来議論になっているところですけれども、科学院としてはEQ-5Dに企業側の説明にもありましたように想起期間の問題あるいは感度の問題があることは御指摘のとおりだと考えています。しかし、一方で、マッピングという手法はその解決にはならないのだという立場であります。繰り返しになりますが、マッピングした場合、実測値とマッピングによる予測値は一致していないといけません。ですから、例えばEQ-5Dに天井効果があるならば、MSQからのマッピングにも天井効果があることを予測されないといけないわけです。ですから、MSQからEQ-5Dにマッピングされたもののほうが感度が高いあるいは長期の想起期間を想定しているということは、論理的におかしいということになるわけです。感度のよいMSQから感度の悪いEQ-5Dの値を予測するというのが、この場合のマッピングにほかなりません。むしろこのように予測値と実測値、これが乖離しているということは、マッピング式が十分に機能していないことを示しているのではないかと我々は考えています。
 7ページ目ですけれども、この点、企業側の主張が明確に理解できていないところなのですが、マッピングにより用いられたMSQも先ほど申し上げたように対面により測定されたものでありまして、ウェブ調査云々というのはあくまでマッピング式を作成するために用いられたものだと認識しています。これで得られたスコア、マッピングによって得られたスコアをウェブ調査によって測定されたものと同等であると考えるのは問題ではないかと考えています。科学院としては、企業の主張するようなウェブ調査のメリットは認められないと考えています。
 8ページ目、こちらは企業側の意図が不明確ですけれども、マッピング式の作成方法と臨床試験のEQ-5Dデータを並べて比較するというのは分からなくて、右側のマッピング式は予測式を作成するための研究であり、例数が多く必要なのは当然なのではないかと思っています。
 9ページ目、この点については、治験で取得されたEQ-5Dデータが存在する上に、得られる値がイギリスでのEQ-5Dスコアである、実測値とマッピング値の乖離があるなどの課題に対して、マッピング式の適切性、これを説明しておらず、ガイドラインの例外事項として取り扱うのは難しいのではないかと考えています。
 10ページ目ですけれども、この表にありますように、確かに全てMSQを用いているのですが、海外においては積極的にこれらの指標が受け入れられているわけではないと考えています。例えばオーストラリアにおいてはEQ-5Dのデータが企業から提出されなかったため検討できなかった、あるいはカナダではマッピング手法を不適切なものであると議論したものや、どちらにせよ費用対効果が悪いために再分析を実施しなかった等の記載があるものがあります。また、SMCやTLV、この辺りでは効果が同等との仮定の下で費用最小化分析を実施したため、効用値のデータについての議論が全く重要でなかったというところもあります。海外においても様々な事情の下で評価が行われているものであり、単純にマッピングの手法が受け入れられているわけではないものと推測されます。
 11ページ目ですけれども、イギリスのガイドラインの記載はそのとおりで、製造販売業者が主張するような理由からMSQが用いられたというところもあるのでしょうけれども、マッピング式、こちらがイギリスのスコアに換算するものであるということは大きかったのではないかと考えております。先ほど○○先生から御指摘がありましたけれども、我々としてはこの切片のみならず傾きも変わってくるものと、EQ-5Dのタリフが異なることによって傾きも異なってくるものと認識しています。
 12ページ目ですけれども、科学院としてはEQ-5Dに想起期間と感度の問題があることは御指摘のとおりだと考えています。一方で、マッピングという手法はその解決にはならないという立場です。加えて、このような乖離が生じるような原因となったマッピング式の適切性について議論がなされていない状況で、なかなか受け入れ難いものであると考えています。また、図から読み取れば、月当たり片頭痛日数が0あるいは1回程度であってもマッピングしたスコアは0.8を下回っていて、EQ-5Dのスコアと大きく乖離しているところです。EQ-5Dにイベントに関連する感度の問題があろうとも、片頭痛が起きていない状況ではスコアが乖離するというのはおかしく、MSQ群では過剰な評価が行われている可能性も否定できないと考えます。
 13ページ目、増分QALYの大小についてですが、これについては臨床的なものも含めて様々な見解があることは承知していますが、公的分析としては、原則として企業側の分析手法に従って分析したものになります。適切なQOLの値を入力することによりQALYの算出方法がおかしく、算出値がおかしくなるということであれば、それは企業側の分析手法に課題があるものだと認識していて、その価値が十分に証明されなかった、そういうことではないかと考えています。
 以上です。
○費用対効果評価専門組織委員長
 ありがとうございました。
 それでは、当該品目について御議論をお願いします。なお、御議論に当たっては、企業分析結果と公的分析の再分析結果のどちらがより科学的により確からしいかを相対的に評価することを踏まえて御議論を進めていただきたいと思います。いかがでしょうか。
 ○○委員、お願いします。
○○○委員
 要するに、マッピング手法を許容するかどうかという点で一番気になるのは、イギリスのNICEで使っているということですが、見た限りだと、とても昔のときの分析でMSQからのマッピングを使っていて、NICEの場合には同効品では基本同じ分析手法を使って、評価結果が相対的に横並びで比較できるような形である意味で整合を取ることはよく行われているので、これも昔の分析はMSQでやって、それを今回の薬剤も同様の手法でということで引きずってきているのかという理解をしたのですが、もしもっと詳しい方がいたらそれについては教えていただきたいと思います。
 マッピングを使うことの最大のメリットは、EQ-5Dは感度が悪いので、もしもMSQとEQ-5Dが完全にマッピングで相関が100%だとしたら、ちょっとした健康状態の変化をMSQでは拾えて、それをEQ-5Dに100%換算できれば、それを使うのは非常に理にかなっていると思うのですが、企業からの話を聞いても、あとはいろいろなマッピングの文献を読んでみても、いろいろ御議論があったように、痛みに対する完全な健康が1、死亡を0としたときに、痛みに対しての日本の価値観といいますか、一般の方の評価というのは、イギリスやカナダやその他の国とは全然違う。それはEQ-5Dではなくてほかの尺度で測ったときにも、少なくとも健康を1、死亡を0としたときに幾つになりますかという評点は諸外国と全然違うので、外国でつくったマッピング関数を使って日本で分析をしてQALYを計算しICERを出すというのは、間違った意思決定につながるのではないかと個人的には考えています。
 前半のNICEでMSQを使っていることについての理由ですね。私の見解がもし間違っているようであれば、それは御指摘いただきたいと思います。
○費用対効果評価専門組織委員長
 ありがとうございます。
 その他の委員、いかがでしょうか。
 話の整理の観点から、先生方と目線合わせなのですけれども、組織の運営としてはガイドラインを前提に議論させていただいていますので、科学院さんからも御指摘、御説明があったとおり、資料の17ページにあるとおり、ガイドラインにある理念に基づいて基本的な整理を行うとしたら実測値のあるEQ-5D-5Lだと思いますけれども、日本人のデータを活用するというのがまずは議論のスタートなのかと思うのです。ただ、企業さんの御指摘されているとおり、EQ-5Dがこの疾患に対して感度がいいのかどうか、もしくは測定方法自体としてしっかりとした病態を取っているかどうかについて、一定の限界があるのではないかという御指摘があって、今まで先生方と御議論してきたのかと思うのですが、この辺りから少し整理をしていきたいと思います。
 その観点で見たときに、今回科学院様はEQ-5Dで分析をされていらっしゃるのですけれども、科学院様の今回出てきたQALYが小数点以下2桁、コンマ2桁でかなり小さい数字なのですが、臨床的な追加的な有用性があると言っている中においてかなり小さいQALYというか効果の話が出てくると、そこと少し矛盾してしまう可能性がないかと思うのですが、この辺りはいかがでしょうか。そもそも臨床的な意味があるかどうかというぐらいのQALYの数字になってしまうと、前提とされている追加的な有用性との乖離が出てしまう可能性があるのですが、ここは何か科学院さんから解釈はございますでしょうか。なおかつ、他の指標では、臨床の先生方もおっしゃっていましたが、お薬としての有用性が実感としてあるという話でMSQなどでも数字は出てきておりますので、その辺りの整合性を気にしての御質問ですが、いかがでしょうか。
○国立保健医療科学院
 ありがとうございます。
 我々としては先ほど御説明したように企業側のモデルを使って分析をして結果を出したところで、この臨床的な解釈については専門の先生方にぜひ聞いていただきたいのですけれども、我々としては最善の分析をしたのではないかと考えているところです。
○費用対効果評価専門組織委員長
 ありがとうございます。
 では、○○先生と○○先生からコメントをいただけますでしょうか。
○○○委員
 この御意見などを伺っていますと、痛みに対する感受性というか、痛みに対するQOLへの影響はかなり諸外国と違うのかとは思います。それをどれぐらい換算できるかというのは難しいですけれども、そこが一番違うのではないかと思いました。ただ、毎日というのと今日のというのでそれほど違うかというと、そこはあまりないのではないかという印象もあります。効果はある薬ですけれども、その辺の患者さんの印象というか、実際にその日のことでもそんなには痛い日をイメージしていないわけでもない気はするとは思います。この換算の仕方というので、ある程度それも全く直線ではない、幅があると思いますので、幅やその辺をどのように扱うかというところも少し問題ではないかと思いました。
 以上です。
○費用対効果評価専門組織委員長
 ありがとうございます。
 ○○先生、いかがでしょうか。
○○○委員
 片頭痛診療に携わり、かつ自分も片頭痛患者である立場から申し上げさせていただきます。
 私の今日のEQ-5Dの値は1.0だと思います。2日前に頭痛があって、そのときに測ったら0.5とか0.3になるのかと思います。ですから、結局当日のその日の状態で見てしまうと、こういう発作性の疾患は全く反映されない可能性があると思います。ですから、そこがQALYの値が非常に低いところになってしまっているのかと思いますので、EQ-5Dも発作当日に測れば恐らく低い値が出るのだと思います。片頭痛を経験された方は分かると思いますけれども、非常につらいです。頭が爆発するような感じがしますし、薬を飲んで治ってくる間はずっと横になっています。動けないです。ただ、その日に測れば当然低い値は出ると思いますけれども、元気なときに測れば何も問題がないですね。全く問題ないとその日は答えてしまうと思うのです。ですから、そこに非常に大きな限界があり、患者さんのつらさが真に反映されていないことは、一つ明記すべきことかと思います。
 以上です。
○費用対効果評価専門組織委員長
 貴重な御意見をありがとうございました。
 今のお二人の先生方の御意見を踏まえながら、その他の先生方、いかがでしょうか。コメントもしくは御質問みたいなものがございましたらと思いますが、いかがでしょうか。
 EQ-5Dが今回のケースでは少し課題があるというようなお話はある程度共通認識として皆さんお持ちだと思うのですけれどもいかがでしょうか。
○費用対効果評価専門組織委員長
 ○○委員、どうぞお願いします。
○○○委員
 私も本当にこの点がすごく重要で、もしかして日本とイギリスの違いよりも大きな点かと懸念しているところです。あくまでもガイドラインに従ってというところは理解するのですけれども、ガイドラインであればほかのデータがなければ使用可能と。ほかのデータは質が悪くてもEQ-5Dが存在すれば使ってはいけないのかという、ドグマ的な読み方をするとそのように取れなくもない。本質のところを考えると、妥当性の確認をされたEQ-5Dが存在しなければマッピングも使用可というところに本当はするべきではないかというところで、本疾患に対して本当にEQ-5Dを使っていいかどうかというところを慎重に議論するべきではないかと考えております。
 以上です。
○費用対効果評価専門組織委員長
 ありがとうございます。
 この件に関して、その他の先生方からコメントはございますか。よろしいですか。
 改めて、先ほどの私の御質問、今の○○先生のお話も含めて、科学院さんから何かコメントがあればお願いしたいと思いますが、いかがでしょうか。
○国立保健医療科学院
 ありがとうございます。
 ○○先生、皆さん御指摘のように、EQ-5Dに測定上の課題があることは我々もそのように認識していまして、より良い尺度があればと思うところなのですが、しかし、MSQから予測されるものもEQ-5Dの値なわけです。ですから、そこはマッピングしても問題が何も解決していない形で、この緑の線と紫の線、これが乖離していること自体がおかしいというか、うまくEQ-5Dのマッピングが機能していない、説明し切れていないことの証左なのではないかと考えているところです。ですから、EQ-5Dの値を使うか、マッピングしたEQ-5Dの値を使うか、これは本来は同じ値であるべきで、これが乖離していることが今回のマッピング式の課題を示しているのではないかと考えています。
 以上です。
○費用対効果評価専門組織委員長
 ありがとうございます。
 いかがでしょうか。今までのこの御議論を踏まえて、先生方、御意見はございますでしょうか。
 どうぞ。
○○○委員
 ○○です。
 スライドの5ページですね。緑の線と紫の線が乖離しているというところは、恐らく臨床試験ですので、ヘルシーワーカーエフェクトというか、状態のいい人しか外出できないので、そちらのバイアスがEQ-5Dではより深く反映しているということではないかと思うのです。ですから、それがウェブ調査であれば家にいても答えられるので、ヘルシーワーカーエフェクトという具合のいい人しか研究に入れないというところの効果は少しはましになると思います。ただ、本当に片頭痛のある人はコンピューターの前にも座れないと思いますので、実際はもっと相関的には強いものが出るのではないかと思いますので、臨床試験のデータがEQ-5DとMSQで一致していないからといってマッピングが機能していないというのは異なるものかと思います。
 以上です。
○費用対効果評価専門組織委員長
 先に科学院からお願いします。
○国立保健医療科学院
 科学院から○○先生の御発言に対して少し御説明したいと思うのですけれども、この場合、MSQも来院してビジットで取っているということで、決してウェブ調査で取っているわけではないということです。ウェブ調査で取っているのはあくまでマッピング式を作成するための調査、これにおいてMSQとEQ-5Dを同時に取っているということでありまして、今回の分析において用いられるMSQあるいはEQ-5Dは、共に臨床試験における対面で調査されているという認識です。
 以上です。
○○○委員
 ですから、外出できない方が臨床試験で対面調査に来られないと。その場合のバイアスはEQ-5Dのほうが強く反映する、当日のことを聞いていますので、強く反映する結果、ああいうことが起こっているのではないかというところでも説明はつかないわけではありませんので、ですから、そこが一致しないからというところは私としては違うのではないかと思っているところです。
○費用対効果評価専門組織委員長
 ○○委員、お待たせしました。お願いします。
○○○委員
  その点について、科学院さんはEQ-5Dの実測値とMSQからマッピングしたものが完全に一致しなければいけないとお考えのようなのですが、そもそも○○先生もおっしゃっているように、その日の状態を聞くEQ-5Dと過去1か月間の状態を聞くもので完全にマッピングしたから一致しなければいけないというのは、どういう考えの下で説明されているのか。そもそも聞いているものが違うものをマッピングしたから完全に一致することのほうが逆におかしいのではないかと個人的に思いますが、そこの説明をもう少し詳しくしていただけると助かるのですが、いかがでしょうか。
○費用対効果評価専門組織委員長
 科学院さん、いかがでしょうか。
○国立保健医療科学院
 ありがとうございます。
 先生のおっしゃるとおり、聞いているものが全然違う尺度同士をマッピングしているわけですけれども、もし聞いているものが全然違うもの同士をマッピングしようとしているのであれば、それはマッピングすること自体が不適切だということになるのではないかと思っております。あくまで1か月の健康状態から当日の健康状態を予測できるという前提があるからこそマッピングがされているわけでして、もしそこの前提が成り立たないのであれば、そもそもマッピングをしてはいけないのではないかと我々は考えています。
○費用対効果評価専門組織委員長
 では、私から稚拙な御質問なのですけれども、このマッピング自体は簡単に言えば直線回帰みたいなことを行っていて、回帰式というのは正直なところ一致性を議論するというよりは、補正をしながら相互の説明変数や説明能力が最も上がるところを見つけるような面もあるのかと思っているので、そういった意味では完全一致というよりは、相互に違っているところを補正し合ってある一定の合理的な説明を探していると思っていました。ここは統計の先生方も含めて何かコメントはございますでしょうか。一致している必要はないのではないかと個人的には思っていたのですが。
○○○委員
 回帰を使っているのであれば、最小二乗法で直線を描いているだけなので、当然個々のデータのばらつきの影響で完全に一致することはあり得ない。本当にMSQとEQ-5Dの相関が1とかマイナス1とかになるものであれば完全に一致するのでしょうけれども、基本的にそうではないので、かなりばらつきは含まれている上での話だと思うので、完全に一致しないといけないという話は理解しづらいというところが感想です。
○費用対効果評価専門組織委員長
 また私のほうで追加させていただくと、非常に乱暴な解釈をすれば、結局、海外の評価機関もEQ-5Dの感度などで説明し切れないものをMSQなども考慮してでどうにか予測とか補正をし、総合的に評価をしたのだろうとは思っているのですけれども、そういう扱いでマッピングというツールを考えていくことはできるかできないかというものについて、科学院さん、いかがですか。そこはなかなか難しいお話なのでしょうか。解釈としてですけれども。
○国立保健医療科学院
 そうですね。海外でも苦労されていろいろな考えの下でやられているのではないかと思うのですけれども、公的分析の立場として科学的に見たときに、このマッピングというものに大きな課題があって、これを用いて意思決定するのはどうなのだろうと考えたところであります。
○費用対効果評価専門組織委員長
 ありがとうございます。
 その他の先生方、いかがでしょうか。
 ○○委員、お願いいたします。
○○○委員
 本当に私は費用対効果のほうはまだ日も浅くて教えていただきたいのですけれども、今回マッピングというところが問題であるのでしたら、そもそもEQ-5Dを片頭痛に使うこと自体の妥当性はどうなのでしょうか。MSQを使っては駄目な理由についていかがでしょうか。
○費用対効果評価専門組織委員長
 今の○○委員のお話は私なりには また私のほうで追加させていただくと、非常に乱暴な解釈をすれば、結局、海外の評価機関もEQ-5Dの感度などで説明し切れないものをMSQなども考慮してでどうにか予測とか補正をし、総合的に評価をしたのだろうとは思っているのですけれども、そういう扱いでマッピングというツールを考えていくことはできるかできないかというものについて、科学院さん、いかがですか。そこはなかなか難しいお話なのでしょうか。解釈としてですけれども。
○国立保健医療科学院
 ありがとうございます。
 EQ-5Dを共通の尺度として用いるということは、プリファレンスベースト尺度、選好に基づく尺度というのは先ほど御説明させていただきましたけれども、いろいろなものが開発されているのですが、用いる尺度によって測定値が変わってきてしまうという問題がありますので、評価の公平性だとか統一性のようなものを考えると、一つ基準となる尺度を決めて、それで運用していくというのが非常に重要なのではないかと考えています。
 御説明が足りなかったのかもしれないですけれども、なぜEQ-5Dやプリファレンスベーストの尺度でないといけないかといいますと、このEQ-5Dとのスコアリングは、一般の人たちの価値観というか、どれぐらい健康が望ましいかというような考えが反映されているものでないとQALYに換算できないというのが一般的な教科書的な解釈でありまして、例えばSF-36などでも点数は出るのですけれども、それをQALY計算に使うことはできないと。例えば1点と2点の間が全て等しいわけではなくて、人々の考え方や捉え方、価値観によっては、この1点のところが0.5になったり2点になったりするという調査を行った上でスコアに換算しているところですので、単純にMSQの値を当てはめるわけにはいかないというところかと思っているのです。
○費用対効果評価専門組織委員長
 ○○委員、どうぞ。
○○○委員
 医学の専門家の先生にお聞きしたいのですけれども、EQ-5Dでやられた公的分析の結果とMSQをベースにした企業分析の結果で治療間の比較をされたときに、実際に効果的にはどちら寄りのものを現場では実感されておりますか。
○費用対効果評価専門組織委員長
 ○○先生、いかがでしょうか。
○○○委員
 もともとの値がどのぐらいの人に投与しているかはかなり大きいのではないかと思うのです。現状、私もすごく片頭痛を診ているわけではないのですけれども、もともとトリプタンが効くというのがあって、その飲む回数が多い、効かないときもあると。それを押しなべて回数が減るとか改善させるという位置づけのお薬だと思うのです。だから、○○先生に聞きたいのですけれども、もともとの自分の健康状態が0.5という人がいて、それが0.8とか、0.2上がるとしたらそういうことですね。そこまで上がるかというとそういう印象はないという、もともとが働いている人が大部分で、僕が軽い患者さんを診ているかも分からないのですけれども、痛いので時々早く帰るとかという人が僕が診ている片頭痛の人なので、もともと0.9とかそれぐらいの人がという印象はあります。だから、そこまで上がるかというとそうではなくて、この間ぐらいのところが落としどころかとは率直には思います。
○費用対効果評価専門組織委員長
 ○○先生、いかがでしょうか。
○○○委員
 もともと運動機能などに障害を与える疾患ではないので、痛いのを我慢して無理をして動けば吐きながらでもできますし、私も外来終了後、痛いなと思いながら診療して吐いたこともありますけれども、そういうものですので、ADLにどのくらい影響を与えるかというと、死ぬ気でやれば動けるというものではあると思います。
 一方で、ガルカネズマブの臨床的な効果に関しては、これは頭痛学会の専門医の人たちの複数の人の印象だと思いますけれども、これまでの予防薬とは全く違う印象を持っていまして、実際は例えば月に8回だった人が4回になるとか、そういう治験の結果ですけれども、8回が4回になるというと週2回が週1回になるのですね。これはかなり大きな変化で、QOLという意味では無視できない変化があるのではないかとは考えていいと思います。
 以上です。
○費用対効果評価専門組織委員長
 ○○委員、いかがでしょうか。大丈夫でしょうか。
○○○委員
 ありがとうございました。
 本当に統計学的な議論も重要だと思うのですけれども、実際の専門家の先生が肌で感じられているところが本質に近いところなのかと思いまして、御質問させていただきました。
○費用対効果評価専門組織委員長
 その他の先生方、いかがでしょうか。
 ○○委員、お願いします。
○○○委員
 マッピングの手法は、先ほども議論があったようにいろいろな健康を測る物差しがある中で、死亡が0、完全な健康が1という物差しに換算しなければいけないときには使わざるを得ないので全部否定することはできないわけですが、この片頭痛や痛みに関連するQOLは、少なくともイギリス人と日本人では死亡を0と置いたときの、例えばとても痛いときにはイギリスの方だとかなり低い点数をつける方もたくさんいたりするのですが、日本は実際に測定してみるとそうではなかったりするので、今回マッピングの手法に課題があるかもしれませんが、それ以上に企業のもので出てきた値はイギリス人のQOLの値を今回出してしまっているので、これを採用して意思決定するというのは、薬の価値がゆがんだ評価になるのではないかという懸念を持っております。
 もう一つ、治験のときにEQ-5Dを測った値はもしかしたら状態のいい方を取っていって高く出ているのではないかという企業の主張もありますし、そのとおりだと思いますが、一方で、ウェブ調査のときは、先ほども発言しましたが、今日1日の中で健康状態のいいときのことを想像して答えることは多分なくて、本当につらくて、寝込んでいて、それで少し回復してウェブ調査というときには、その瞬間のとてもよかったときではなくて、過去を思い出して一番悪いときのことをお答えになるとか、この質問票の特性から考えて、そういう逆のバイアスもかかる可能性があるので、いずれにしてもこれはちょうど企業側の研究者の人も言っていましたけれども、本当の答えは企業と科学院の間にあると思いますが、だったらこの薬剤を過大評価しないほうを採用するのが、通常の保守的な意思決定になるのではないかと思っております。
 以上です。
○費用対効果評価専門組織委員長
 ありがとうございます。
 その他の先生、いかがでしょうか。
 ○○先生にお伺いしたいのですけれども、海外の評価機関はいろいろな制約要件の中でマッピングでもある程度複数の効果を考慮しながら採点をされていると推察はしているのですが、日本人の特性や日本の臨床実態のデータをもう少し持ってきて補正しながら、先ほど先生がいみじくもおっしゃったとおり、企業分析と公的分析の間の比較的コンセンサスを得られやすいというか実態を反映したような分析の数字をもう少し落とし込んで議論することは方法論として可能かどうか、先生、どうでしょうか。
○○○委員
 それは要するに、マッピング式を本来つくり直す必要があるのですが。
○費用対効果評価専門組織委員長
 やっぱりそうですかね。
○○○委員
 イギリスのものをそのまま持ってきてこの数字というのは、本来企業に説明責任があると思います。今回のものを何か補正できる余地はないかどうかというと、例えばイギリスのいわゆる換算式、タリフと、日本の換算式のお互いの関係を見て、このイギリスのマッピング式を仮に日本のタリフに置き換えたらどうなると。企業にもタリフの違いでこの直線に差が出ているのではないですかと言ったら、そこはちゃんと答えられませんでしたけれども、その部分を補正することは技術的には可能かと思います。つまり、イギリスのマッピング式を仮に日本のタリフにしたとしたらどうなるかということをやってみるのは、技術的にはあり得るかと思います。ただ、個票というか、先ほどのマッピングの論文は集計された値であって元の値がないのと、この読み方が、元の論文を読むとAdjusted R-squaredが0.25とか、Episodic migraineについてはそういう値かな。あまり説明率がよくないようにも見えるので、これをこれ以上追求して何か実りのある結果が出るかどうかは分かりませんけれども、やるとすればそういうタリフ間の違いの補正は可能かもしれません。
○費用対効果評価専門組織委員長
 ありがとうございます。
 ○○委員、どうぞお願いします。
○○○委員
 本当に難しい問題なのだと考えるのですけれども、これは今後また同じようなものが当然出てきますね。今まであまり出てこなかったのが不思議なくらいで、また今後こういった発作止め系のものは出てくるのではないかと。そのときに今後の議論として、先ほど○○先生が今のEQ-5Dにどれだけこだわるのかともおっしゃっていましたけれども、例えば1日ではなくて日本はこれを4週間にしてしまう。基本的にはEQ-5Dは慢性疾患を評価するような枠組みのような気がするのです。ですから、日本流の間を取るようなタイムスパンも、マッピングもずれているかもしれませんけれども、タイムスパンを考えることも今後はありかと思いました。
○費用対効果評価専門組織委員長
 ありがとうございます。
 今回議論されているMSQ自体も、国内のデータを見ると海外のデータよりも10ポイントぐらい違っているという論文が出ていますので、個票がなくてもそういったベースラインの数字を少し議論しながら補正ができたらいいのかなと思ったりもしていたのですが、全体を通してのお話を含めて、科学院さんのほうで今のような議論はいかがですか。具現性などを含めてコメントがあればいただきたいと思います。
○国立保健医療科学院
 今すぐ御回答できないのですけれども、補正という点はなかなか難しい部分もあるのかと思ったりしているのですが。
○費用対効果評価専門組織委員長
 分かりました。
 さりとて、少し臨床実態から乖離しているのは気になるところですが、○○委員、お願いいたします。
○○○委員
 企業のスライドの5ページの図にマッピングした緑の直線がありますね。あそこのベースラインの高さが紫とずれているというところが問題になるのであれば、緑の線の切片を平行移動するような変換を行うことは可能かと思われます。平衡移動するというのが日本のタリフと英国タリフの違いという解釈の仕方ができればよいのですが、0日のところでのQOL値をそろえるような変換を行うと、ちょうど両者の2つの直線の中間ぐらいの評価ができるような尺度がつくれるのではないかと思われます。ただ、それが本当に妥当なのかどうなのかというのは検討の余地はあると思いますが、そういう考え方も一つありなのではないかというコメントだけです。
○費用対効果評価専門組織委員長
 ありがとうございます。
 その他、いかがでしょうか。御意見などはございますでしょうか。
 今までの先生方の御議論、少し私なりに解釈をまとめさせていただきますと、いずれにせよガイドラインから議論をスタートしないといけないので、国内で実測されたEQ-5Dのデータがあるのであればそれをまず採用する議論をしなければいけないのですが、一方で、先生方からコメントがありましたとおり、そのEQ-5Dの感度及び測定方法等で実態として今回の薬の有効性、いわゆる価値を本当に拾っているかどうかという御議論もあったのかと思います。ただ、一方で、海外のツールを使ったマッピングについては、科学院さんもおっしゃるとおり技術的な課題を持っているということですので、そのまま受け入れるわけにもいかないというところで、この両者のアプローチの間でより日本の実態を説明する結果を探ることができないかどうかを、少し最後のほうで御議論いただいたというところであります。幾つか統計的な、単純に言えば回帰分析をしているところのy切片や傾きのあたりを他のデータで少し補正をするという話も含めてですが、これが現実的にできるかどうかも含めて、もう少し議論しないといけないのかと思っているのですが、先生方、今のような話の流れでいかがですか。よろしいですか。
 ということは、結局これについてはもう少し議論を進めなければいけない、それも技術的な議論に落とし込まないといけないので、追加分析という形で科学院さんに御検討いただく形で進めていきたいと思うのですけれども、先生方、いかがでしょうか。科学院さんからもこの件に関して、コメントがあればぜひいただきたいと思います。よろしいでしょうか。
○国立保健医療科学院
 保健医療科学院でございます。御議論をどうもありがとうございます。
 追加で検討することは必要であればやらせていただきますが、委員長におっしゃっていただいたとおり、基本的には分析ガイドラインですね。公平に判断をしていくためにいろいろな費用対効果の分析手法がある中でQALYを使うとか、QOL評価は基本的にこうやりましょうというのを統一的にやらないと公平な評価を保てないとは考えておりますので、我々としてはガイドラインに準拠する形を基本に考えたいと思います。
 その場合に、例えばマッピングなどを使ったものを使うのであれば、マッピングが妥当であること、適切にされていることはちゃんと説明しなくてはいけないと我々は企業にも求めておりますので、そこが我々としても説明できない方法を取るのは、自分たちでガイドラインに準拠しない方法を取ることになりますので、そこはどのぐらい対応できるかを含めて検討させていただくということでよろしければ対応させていただきたいと思いますが、いかがでしょうか。
○費用対効果評価専門組織委員長
何かの結果を出すというよりは、まずは一回検討していただかないといけないのだろうというところと、幾つかのサーベイも追加でしていただく必要もあるのではないかと思っておりますので、それを一度また組織に御報告いただいて、もしできそうであれば、ある程度結果もお示ししていただくと良いのではないかと思っています。
 いずれにせよ、これは今、説明というお話がございましたけれども、対外的にこの費用対効果、このお薬についてきちんとした議論をしたということを説明しないといけないというところに関して、説明できないような部分がありますので、そこを埋めるために関係者で少し工夫をしていきたいと思っていますので、科学院さんに一旦ボールを投げさせていただきますけれども、検討のため、追加分析という形で御議論いただきたいと思います。
 今のような話でよろしければ、この品目についてはこのような形でまとめさせていただきたいと思いますが、よろしいでしょうか。
(首肯する委員あり)
○費用対効果評価専門組織委員長
 それでは、○○委員と○○委員におかれまして、議決の間、一時御退席をお願いいたします。
 事務局さん、よろしくお願いいたします。
(○○委員、○○委員退室)
○事務局
 事務局でございます。
 ○○委員、○○委員の退席が確認できましたので、よろしくお願いいたします。
○費用対効果評価専門組織委員長
 それでは、先生方の御意見を参考に、エムガルティ皮下注に関する費用対効果については追加分析を行うという形で、公的分析による追加分析を行っていただくために、幾つかのMSQからのマッピングの検討、あとは海外の評価機関におけるMSQからのマッピング手法が採用されている理由について、調べて御報告をいただく形にさせていただければと思いますがよろしいでしょうか。
(首肯する委員あり)
○費用対効果評価専門組織委員長
 御同意をいただきましたので、そのように進めさせていただきます。それでは、事務局は○○委員、○○委員に入室いただいてください。
○事務局
 事務局でございます。
 少々お待ちくださいませ。
(○○委員、○○委員入室)
○事務局
 事務局でございます。
 お二方の入室が確認できましたので、よろしくお願いいたします。

 

(了)
<照会先>

厚生労働省保険局医療課企画法令第2係

代表: 03-5253-1111(内線)3140

ホーム> 政策について> 審議会・研究会等> 中央社会保険医療協議会費用対効果評価専門組織> R4.9 エムガルティ

ページの先頭へ戻る