添付一覧
○次世代医療機器評価指標の公表について
(令和元年5月23日)
(薬生機審発0523第2号)
(各都道府県衛生主管部(局)長あて厚生労働省医薬・生活衛生局医療機器審査管理課長通知)
(公印省略)
厚生労働省では、医療ニーズが高く実用可能性のある次世代医療機器について、審査時に用いる技術評価指標等をあらかじめ作成し、公表することにより、製品開発の効率化及び承認審査の迅速化を図る目的で、評価指標を検討してきたところです。
今般、マイクロ流体チップを利用した診断装置(別紙1)、生体由来材料を利用した新規機能を有する医療機器(別紙2)、血流シミュレーションソフトウェア(別紙3)、人工知能技術を利用した医用画像診断支援システム(別紙4)、ホウ素中性子捕捉療法用加速器型中性子照射装置システム(別紙5)の評価を行うに当たって必要と考えられる資料、評価のポイント等を評価指標としてとりまとめましたので、下記に留意の上、製造販売承認申請に当たって参考とするよう、貴管内関係業者に対して周知いただきますよう御配慮願います。
なお、本通知の写しを独立行政法人医薬品医療機器総合機構理事長、一般社団法人日本医療機器産業連合会会長、一般社団法人米国医療機器・IVD工業会会長及び欧州ビジネス協会医療機器委員会委員長宛て送付することを申し添えます。
記
1.評価指標とは、承認申請資料の収集やその審査の迅速化等の観点から、製品の評価において着目すべき事項(評価項目)を示すものである。評価指標は、法的な基準という位置付けではなく、技術開発の著しい次世代医療機器を対象として現時点で考えられる評価項目を示したものであり、製品の特性に応じて、評価指標に示すもの以外の評価が必要である場合や評価指標に示す評価項目のうち適用しなくてもよい項目があり得ることに留意すること。
2.個々の製品の承認申請に当たって必要な資料・データを収集する際は、評価指標に示す事項についてあらかじめ検討するほか、可能な限り早期に独立行政法人医薬品医療機器総合機構の対面助言を活用することが望ましいこと。
別紙1
マイクロ流体チップを利用した診断装置に関する評価指標
1.はじめに
近年、体液中の微量成分(細胞、タンパク質、核酸等)を対象とした微量診断装置のほか、質量分析器を利用した診断法や非侵襲下に血糖値を測定する装置等、様々な機器・技術の開発が活発に進められている。中でも、マイクロ流体チップは技術革新が著しく、様々なバイオマーカの測定への応用が期待されている。マイクロ流体チップは、最新技術の結集であり、ガラス又はプラスチック等のチップ上に作製した数μm~数百μm幅程度の流路中でクロマトグラフィや電気泳動等の原理に基づいて、微量検体の分析を行なうものである。また、マイクロ流体チップに検体の前処理、分離、検知等の要素を機能的に配置することにより、小型且つ簡便に病態を診断するシステムの構築が可能となる。
マイクロ流体チップを利用した診断装置は、分析所要時間の短縮、感度・検出限界の向上、検体量が微量であることによる測定時の患者の負担の軽減、Point Of Care Testing(POCT)への利用等の利点があり、がんをはじめとした重篤疾患の早期発見等に繋がることが期待される。このような背景を踏まえて、当該装置について、科学的根拠を基盤にした品質、有効性及び安全性の評価を適正かつ迅速に進めることを目的として、本評価指標を作成した。
2.本評価指標の対象
本評価指標は、マイクロリットルあるいはミリグラム程度以下の微量検体(血液、尿、唾液、涙液、呼気等)中に存在する特定のタンパク質やマイクロRNA等の診断マーカを測定するために、高機能なマイクロ流体操作を用いる診断装置を対象とする。
本評価指標は、「DNAチップを用いた遺伝子型判定用診断薬に関する評価指標(平成20年4月4日付け薬食機発第0404002号厚生労働省医薬食品局審査管理課医療機器審査管理室長通知別添2)」及び「RNAプロファイリングに基づく診断装置の評価指標(平成24年11月20日付け薬食機発第1120第5号厚生労働省医薬食品局審査管理課医療機器審査管理室長通知別添2)」を参考に、特に、マイクロ流体チップを用いることによる固有の事項を主眼とした。
対象となる診断装置は、原則としてマイクロ流体チップと分析装置を組み合わせたもの、若しくは両者一体型のものとなる。なお、診断装置から得られる情報の臨床的意義については、個別の事例毎に臨床データをもとに検証することになる。
3.評価指標の位置づけ
本評価指標は、技術開発が著しい機器を対象とするものであることを勘案し、現時点で重要と考えられる事項を示したものである。今後の技術革新や知見の集積等を踏まえて改訂されるものであり、承認申請内容に対して拘束力を持つものではない。本評価指標が対象とする製品の評価にあたっては、個別の製品の特性を十分理解した上で、科学的な合理性を背景にして、柔軟に対応する必要がある。なお、本評価指標のほか、国内外の関連ガイドラインを参考にすることも考慮すべきである。
4.評価にあたって留意すべき事項
(1) 品目の概要に関する事項
1) 臨床的意義
分析対象とするバイオマーカの定量分析から得られる医療情報の有用性が既に論文・学会の診断基準等により科学的に実証されている場合は、それらを引用し評価すること。新規マーカについては、診断における寄与度や臨床的意義等について個別に説明すること。また、海外での臨床性能試験を用いて有用性を説明する場合は、日本人への外挿性や本邦の医療環境等を踏まえて、日本人集団でも同一の有用性があることを考察すること。
当該品目による早期発見、患者層別化等による、予後やQOLの改善等の患者の利益があれば記載すること。
2) 対象とする被検者の範囲
対象とする被検者を明確に規定すること。バイオマーカの定量分析によって得られる医療情報の意義と治療への利用法について、添付資料の中で具体的に記載・説明すること。
3) 使用環境
① 使用目的・状況の明記(病院検査部における患者検体検査、ベッドサイドにおける患者検体検査、医師の指導下における一般使用者の使用等)
② 使用者の条件の明記(医師、看護師、臨床検査技師等、医療技術資格の必要性)
4) 測定装置及び測定原理
定量する手法の原理を詳細に示すこと。測定に用いる専用装置がある場合は、その測定原理を示すとともに測定原理が記載された論文、特許等の文献があれば引用し、必要な実測データの他、分析装置とマイクロ流体チップの仕様に関する資料を添付すること。既存の測定機器を用いる場合には、使用可能な機種を特定するとともに、その資料を添付すること。いずれの場合も、測定装置の分析学的な性能(正確性、感度、特異度、再現性等)を示すデータを提出すること。
5) 検体の種類
検体としては、血液(全血、血漿、血清)、尿、唾液、涙液、髄液、穿刺液、呼気等が挙げられるが、使用する検体が測定対象物質の測定に妥当である科学的根拠を示すこと。
6) 検体の採取量・方法・部位
検体の採取量は、機器の仕様を基に適切な量を設定すること。また、患者への負担を考慮し、可能な限り痛みや苦痛を軽減できる採取方法及び部位を選択することが望ましい。検体が血液の場合、微量採血をする身体の部位による測定値の違いを考慮する必要があるため、定量可能範囲(特に定量下限値)に留意して採取部位依存性評価を行うこと。また、溶血による測定値への影響についても評価を行うこと。
7) 検体の保存方法
検体採取、前処理後、全ての段階のサンプルにおいて、保管法及び輸送法を検討し、適切な保存条件を設定すること。
8) 前処理
検体の希釈条件に関する検討を行い、検体種類に応じた測定への影響が最も少ない妥当な希釈方法を設定すること。また、検出感度及び濃度域を考慮して、検体の適切な希釈倍率を設定すること。希釈以外の前処理を必要とする場合、例えば検体に血漿、血清を用いる場合には、その前処理が測定結果に及ぼす影響を検討し、必要な対策を講じること。また、ヘパリン等の抗凝固剤による前処理等、その他の前処理が測定に及ぼす影響に関しても検討すること。
9) アッセイ条件
反応条件(温度、時間、緩衝液の組成等)の概略(アッセイのプロトコル及び標準手順を含む。)を記載し、非特異反応が生じる可能性も説明すること。
10) 医療機器プログラム
装置に搭載されるプログラム構成(ユーザー操作部分、機器制御部分、解析部分、データ管理等)及びその機構について示すこと。ユーザーの操作ミスや機器に異常が発生した場合の対応策についても必要であれば示すこと。なお、プログラムの設計、管理等は、JIS T 2304への適合について考慮されていること。
分析結果を得るためのアルゴリズムとその構築方法の詳細について、用いたデータセットを含めて説明すること。
(2) 仕様及び安定性に関する事項
1) 仕様
品目の仕様、設置環境等を明確に示すこと。
2) 品質管理の方法
装置の構造に即した反応原理を明確にした上で、測定対象物質を特異的に測定できることを標準物質測定及び実検体を用いた添加回収試験等にて説明すること。また、標準物質の表示値の分析化学的根拠と精度管理の方法について明確に説明すること。
3) 分析的妥当性
標準物質を段階的に希釈し、定量的に測定できる範囲を明確にするとともに、低濃度域については検出限界を示すこと。また、その定量範囲における低濃度域、中濃度域、高濃度域の少なくとも3濃度の試料を用いた同時再現性を示し、誤差の程度を規定すること。測定値に影響を及ぼす干渉物質とその濃度について、測定反応及び検出原理に及ぼす影響をそれぞれ定量的に説明すること。すでに対象物質が測定可能な装置が存在する場合は、その装置によって得られた測定結果との相関性について説明するとともに、回帰式の傾きが大きく異なる場合、あるいは切片を生じる場合はその原因と考えられる可能性について示すこと。
4) 測定装置の較正
検量線作成が必要な場合は、検量線が直線である場合は0濃度(陰性)較正試料と値付けされた較正試料によって2点較正する方法を、検量線が曲線の場合は、0濃度(陰性)較正試料を含む様々な濃度の複数較正試料により、曲線に近似可能な検量線を作成する方法を説明すること。また、マイクロ流体チップのロット毎に較正内容が装置に組み込まれる場合は、その内容と根拠について説明すること。また、対照検体によって較正の妥当性を検証する方法を示すこと。
5) データの標準化
マイクロ流体チップのロット毎に較正が必要な場合は、使用者に通知する等確実にロット毎に較正が行われるようにすること。また、測定毎にマイクロ流体チップのロットが異なる場合、ロット毎の較正結果を記録する等、ロット混在時の管理ができるようにすること。対照試料の供給等、精度管理に必要な仕組みについて示すこと。また、標準物質や標準測定法を使用した真値に対するトレーサビリティ体系の構築について説明するとともに、評価部門を設けて特定の評価基準によるロット管理で標準化を可能とすること。測定対象が既存の検査項目として確立されている場合は、トレーサビリティ体系が構築されている既存測定系で得られたデータとの相関を明示すること。
6) 安定性
マイクロ流体チップの有効期限及び保存条件を設定し、その妥当性を説明すること。製造販売時にはマイクロ流体チップのロットを必ず表示すること。
7) 試薬
マイクロ流体チップ以外に、検体の前処理を含めて別途試薬を使用する場合は、その規格を明示すること。
(3) 性能に関する事項
分析にあたっては、採取した微量検体を数μm~数百μm幅程度の流路で構成されるマイクロ流体チップに導入して、チップの中で前処理等、様々な分析操作を行う。従って、性能評価においては、従来の分析法における一般的な分析性能評価項目に加えて、チップの構造等に由来する微量検体特有の性能評価項目が生じる。特に、マイクロ流体チップは加工、流体制御、検出、温度制御等、様々な技術が用いられるため、これらの技術要素に応じて評価項目を整理する必要がある。
1) 微量検体特有の性能評価項目 マイクロ流体チップを利用した微量診断装置は、分析学的妥当性評価において確認される測定誤差を臨床上許容できる範囲に収める必要がある。以下の事項を参考として、期待する性能について評価すること。
(ア) チップ加工部
a) 加工精度
マイクロスケールの微細加工ではサイズ誤差が生じやすい。マイクロ加工したチップのマイクロ流路やチャンバー等、サイズの許容誤差範囲を示し、作製したチップが許容誤差範囲内であることを確認すること。基板を接合する場合は、基板接合後の寸法について検討すること。
b) 表面処理
微小流路や反応容器といった微小空間では比表面積が非常に大きく、非特異吸着防止や表面を利用した分子捕捉等のために表面処理が必要な場合が多い。このため、表面処理の目的、均一性や安定性を示す指標(評価方法を含む)とその許容誤差範囲について説明するとともに、実際のチップで測定を行った結果が許容誤差範囲内に収まっていることを示すこと。
c) 機能性分子の活性
バイオマーカの分析には分子認識能を持ったDNAやタンパク質等の機能性分子(試薬)をチップ内に事前に固定して用いることが多い。しかし、固定された機能性分子は活性変化を受けやすいため、その活性の安定性を示す指標(評価方法を含む)とその許容誤差範囲について説明するとともに、許容誤差範囲内に収まっていることを示すこと。
(イ) 流体制御部
a) 流量・圧力制御
微小空間では超微小流量となり、流量や圧力等の誤差が生じ易いため、チップ内における流量・圧力等の許容誤差範囲を示すとともに、許容誤差範囲内に収まっていることを示すこと。
b) 検体注入量
外部空間からチップに一定量の微量検体を導入する場合、体積が微量であるために誤差が生じ易いことから、検体注入方法、注入可能な容量範囲及び至適容量を示すこと。また、容量の許容誤差範囲を示すとともに、許容誤差範囲内に収まっていることを示すこと。特に呼気等の気体を扱う場合は、圧力、湿度等による体積変動も考慮すること。
c) キャリーオーバー
微小空間では外部空間とチップの接続部等にデッドボリュームが生じ易い。また、非特異吸着も大きく、従来の測定法と比較してキャリーオーバーの影響が大きくなるため、キャリーオーバーの許容範囲を示すとともに、許容範囲内に収まっていることを示すこと。
(ウ) 検出部
a) 位置合わせ
検出に際しては微小空間の中でそのまま検出できることが望ましいが、微小空間ゆえに検出位置がずれ、測定誤差を生じ易いため、検出位置の位置合わせ方法とその許容誤差範囲を示すこと。また、許容誤差範囲内に収まっていることを示すこと。
b) 基板材料の影響
チップを構成する基板には様々な材料(ガラス、樹脂等)が用いられる。マイクロ流体チップでは流路サイズよりも基板の厚みの方が桁違いに大きく、基板の構成材料や不均一性、表面粗さ等が検出精度に影響を与える場合があるため、基板材料の検出精度に対する影響を評価するとともに、これらの許容範囲を示すこと。また、許容範囲内に収まっていることを示すこと。
(エ) 温度制御部
測定時に必要な温度が設定可能な制御域を有し、その温度をマイクロ流路内において許容可能な誤差内で安定して保持できることを示すこと。あるいは、外部温度による影響を内部補正可能な機構を備えていることを示すこと。
2) 一般的な分析性能評価項目
(ア) 再現性・頑健性
適切な濃度の複数のサンプルを使用した繰り返し測定を行うとともに、各種測定条件を適切な範囲内で変動させて測定を行い、微量検体測定での再現性及び頑健性について検証すること。その際、繰り返し回数、使用検体、条件範囲等に関する妥当性を示すこと。
(イ) 正確性
国際標準品等を使用した試験を行い、臨床的に意義のある範囲内で得られた測定値の妥当性(正確性)を示し、臨床上許容可能であることを説明すること。
(ウ) 添加回収試験
標準検体に濃度既知のマーカを添加して、添加量が測定値に正しく反映されていることを確認すること。また、標準検体の標準としての妥当性も示すこと。
(エ) 検出性能(LOD/LOQ)
測定対象とするバイオマーカの臨床的意義のある濃度域を設定すること。また、その濃度域において、十分な検出性能を有することを確認するため、その検出限界濃度及び定量限界濃度を判定すること。
(オ) 希釈直線性
試料を段階的に希釈し、試料の希釈倍率と測定値が比例関係にあることを確認すること。
(カ) ダイナミックレンジ
対象とするバイオマーカの測定において、様々な濃度について試験を行い、定量可能な濃度範囲を示すこと。
(キ) 共存物質の影響
対象とする物質の測定時に抗原抗体反応や基質の酵素反応等を妨害する可能性のある物質(血液中のヘモグロビン、ビリルビン、脂質等や患者が服用している薬等)の影響について、予め評価し、必要に応じて注意喚起すること。
(ク) 相関性
同一検体を用いて、従来法による測定値とマイクロ流体チップによる測定値の比較を行い、その相関性を確認すること。
3) マイクロRNAを分析する際に特に要求される項目
(ア) 相同マイクロRNAの選択的検出
マイクロRNAには、一塩基のみ異なる配列を持つような、高い相同性を有するRNAが存在するため、類似のマイクロRNAの中から標的マイクロRNAを選択的に検出できるか確認すること。
(イ) 定量性
マイクロRNAは非常に微量かつ不安定であり、生体試料からの抽出・精製工程におけるばらつきの影響を受け易いため、マイクロRNAの抽出・精製工程の精度を確認すること。抽出・精製・検出を同一チップ上で行う一体型マイクロ流体チップの場合は特に留意すること。
(ウ) 前駆体及び成熟型マイクロRNAの区別
マイクロRNAは細胞内で前駆体と成熟型が存在するが、成熟型のみが生物学的活性を有する。両者を区別して扱う場合が多いことから、前駆体マイクロRNAと成熟型マイクロRNAを選択的に測定できるか確認すること。
*配列解析をマイクロアレイで行う場合には、マイクロアレイチップの性能評価方法(「DNAチップを用いた遺伝子型判定用診断薬に関する評価指標」及び「RNAプロファイリングに基づく診断装置の評価指標」)に準ずる。
4) 細胞診断装置特有の性能評価項目
細胞は周知のとおり、多くの種類が存在し、それぞれの細胞が有する性質(大きさ、形態、接着性等)や機能(発現タンパク質、産生タンパク質等)も非常に多様性に富んでいる。そのため、細胞を対象にした分析・診断においては、体液(血液、尿等)や核酸(DNA、RNA等)等の試料に対して考慮した評価項目に加え、細胞特有の性能評価を考慮した最適な条件や分析方法を備えていることが要求される。
(ア) 細胞(検体)に対する要求項目
a) 細胞サイズ(大きさ)
多くの種類の細胞が存在し、それぞれの細胞が有するサイズは多様性に富んでいる。更に、同一の細胞種においても、個々の細胞サイズは均一ではなく、一定の分布を有していることから、測定可能な細胞サイズ範囲を確認して示すこと。
b) 接着性細胞と非接着性細胞の違い
細胞は接着性細胞と非接着性細胞に分類され、接着性の違いによりマイクロ流路やチャンバー内での挙動が大きく変化することが予想される。特に生細胞を測定対象にする場合には、接着性の違いが測定に及ぼす影響を評価すること。
c) 臨床検体由来細胞による影響評価
患者由来の細胞は、疾患や投与された抗がん剤等の薬剤等によって、健常人の細胞とは大きく異なる性質を有する場合が多いことから、患者由来の細胞を用いて評価し、その臨床的な有効性、有用性を実証すること。
d) 前処理
マイクロ流体チップに細胞を導入する前に前処理が必要な場合は、前処理による測定に対する影響を正確に評価すること。また、影響がある場合は、その影響を排除可能な機構やアルゴリズムを備えていること。
e) 後処理
マイクロ流体チップに細胞を導入した後に後処理(蛍光染色等)が必要な場合は、後処理による測定に対する影響を評価すること。また、影響がある場合は、その影響を排除可能な機構やアルゴリズムを備えていること。
(イ) 測定精度に対する要求項目
a) 送液に用いる溶媒による影響
マイクロ流体チップに細胞を導入するには送液を要する。しかし、送液に用いる溶媒の種類によって細胞がマイクロ流体チップやチャンバー内にて示す挙動に変化が生じ、測定値に影響を及ぼすことが想定されることから、それらの種類の違いによる影響を確認し、測定に利用できる溶媒を明示すること。
b) 検出法と必要な検体量(細胞数)
測定結果に定量性を含む場合、一定量の血液を検体とする場合等、測定される細胞数の違いにより、測定結果に違いが生じる可能性があることから、測定に必要な細胞数を確認すると同時に、設定根拠を明示すること。
血中循環がん細胞等の希少細胞を高感度に検出、測定する場合には、検出可能な最低細胞数を検証し、明記すること。
c) 臨床検体による影響評価
患者由来の体液中に含まれる細胞を測定対象とする場合、体液(血清、尿等)を検体としてマイクロ流体チップ内に導入することが想定される。その際、患者由来の体液に含まれ得る特有の分子や物質(投与薬剤、ウィルス、細菌等)の影響を評価すること。
d) 測定環境
生きた細胞を継時的に評価する場合やマイクロ流体チップ・チャンバー内において細胞培養工程を含むような場合においては、測定環境(培養液、CO2濃度、振動等)が測定結果に大きく影響を及ぼすことが想定されることから、測定環境を明示すること。
(4) 臨床性能に関する事項
診断装置を使用して得られる情報の臨床的有用性を示す臨床性能試験の成績をデータとともに明確に説明すること。
被験者に関する情報(年齢、性別、人種等)と被験者の疾患に関する情報(重篤度、発症率、治療法等)、検体に関する情報を詳細に記載すること。
類似の承認済み診断装置がある場合には、それとの同等性、相関性及び相違点を示すデータを添付すること。記載にあたっては、特に以下の事項に留意すること。
1) 被験者集団の妥当性
臨床性能試験で対象とした患者集団の妥当性を検証すること。偏りのある患者集団を用いた場合は、臨床性能試験の評価に与える影響を説明すること。
2) 検体
原則として2施設以上で150以上の検体(正常範囲の検体も含む)を用いた臨床試験成績を提示すること(「体外診断用医薬品の製造販売承認申請に際し留意すべき事項について」平成26年11月21日付薬食機参発1121第16号厚生労働省大臣官房参事官(医療機器・再生医療等製品担当)通知)。
ただし、検体数の確保が難しい希少疾患を対象とする場合や予後予測等を目的とする検査であって、予後(臨床試験の最終結果)を得るのに長時間を要する場合等において、統計学的有意性を示すことができれば、150以上の検体数でなくとも許容できる場合がある。予備試験の成績等を用いて、診断装置が導き出す医療情報において区分される集団間の有意差を生物統計学的に示すことができる検体数を予め求めることができる場合は、臨床性能試験を開始する前に統計学的解析手法を確定させるため、その妥当性について総合機構の対面助言を利用することが望ましい。
なお、過去に集めた検体、バンクに保存されていた検体、市販の検体を用いた後向きの臨床性能試験であっても、診断装置が導き出す情報を現在又は将来に適用できる場合には、評価資料として使用できる。ただし、試料及び試料中の測定対象物質の安定性に関する情報を示すこと。特に、保存検体を使用する場合には、当該検体の保存期間と保存条件における安定性を示す必要がある。さらに、それらの検体の過去における臨床病理評価を用いる場合は、それが現行の医療における評価と同等であることを示すこと。検体は複数の医療機関からの収集を原則とするが、一機関のみで測定を行う場合には、偏り等が懸念されるため、その理由と妥当性を説明すること。
3) 海外で行われた臨床性能試験成績の扱い
適切に計画された海外での臨床性能試験の成績を評価に活用しても良い。ただし、日本人でのデータと差が無いことを示すことが必要である。
4) 医療情報の提示
装置が導き出す医療情報(早期発見、予後予測、治療効果予測、再発転移予測等)を具体的に記載し、その情報と臨床病理所見や患者の追跡情報の相関を明確に記載すること。
5) 倫理面の配慮
各施設の治験審査委員会で承認されていることを示し、インフォームドコンセントについて記載すること。同一又は一部の試料を用いた研究が論文として発表されていれば、参考資料として添付すること。
(5) リスクに関する事項
操作過程において、人為的及び機械的ミス、非特異反応等が発生する要因に関して分析し、必要に応じて添付文書にて注意喚起を行う等の対策を講じること。誤った判定結果が得られた場合に起こり得る診断、治療上のリスクについて、文献等を使って評価すること。判定結果を別の手法を用いて個別に確認するための方法について、積極的に提示すること。
不具合が発生すると、ばらつきの原因となり、重大な装置トラブルに発展する可能性がある構成要素に関しては、予めリスク分析を行うとともに、不具合発生を検出・防止するための適切な機能を備える等、適切な対策を施していることを示すこと。具体的な構成要素の例としては以下のものが挙げられる。
・送液部
・導入部(オートサンプラー等)
・反応部(カラム、微小流路、恒温装置等)
・検出部
・装置部(プログラムを含む)
また、装置及び試薬等の管理に関し、以下のことを使用者に通知する旨添付文書等に記載すること。
1) 装置較正
一定期間毎に標準物質による装置の性能評価を実施し、適切な測定結果が得られない場合は、メーカーによる点検を実施し、装置の調整を行うこと。
2) 日常管理・保守点検
洗浄機構の詰まりや汚れ、液漏れを防ぐために十分かつ妥当な洗浄・保守方法及び対象部位を示すこと。または、そのための機能を装置に装備しておくこと。消耗部品に関しては、適切な耐用期間を設定すると同時に、定期交換を行うこと。交換後にはバリデーションを行い、通常時に期待される性能との同等性を確認すること。また、必要に応じて、外部精度管理の方法に関する情報を提供すること。
3) 分析法バリデーション
一定期間毎に陰性対照及び陽性対照となる標準物質あるいは管理物質を用いてバリデーションを行い、測定結果の信頼性を担保すること。検出部、測定条件等を変更した場合にも、適切なバリデーションを実施すること。バリデーションにおいては、適切な理論(統計学的手法、FUMI理論等)を基に許容可能な標準物資の測定誤差範囲を設定し、その範囲を逸脱した場合は洗浄や部品交換等、トラブルシューティングも参照して必要な措置を行うこと。
4) トラブルシューティング
不具合が発生するとバラツキの原因となり、放置すると重大な装置トラブルに発展する可能性がある機構を以下に示す。
・反応部(チップ)
・試薬/検体を正確・精密に分注する分注機構
・検体と試薬を均一にする撹拌機能
・検出機構
機構毎にトラブルの発生する要因を整理してトラブルシューティングとして取りまとめ、トラブル発生時の解決手段を文書化しておくこと。
(6) データの保存と医療情報の表示方法に関する事項
得られた医療情報に加え、検体採取や前処理を含めた分析プロトコル及び測定結果の生データを保存し、検証を可能とすること。早期発見、予後予測、治療効果予測、再発転移予測等、装置が導き出す医療情報の開示方法については、予め添付文書等でその形式と臨床的意義に関する説明を明記すること。また、測定の全工程が良好に進んだかどうかの判定項目を示すとともに、医療情報の根拠となるデータ(対象バイオマーカの定量値等)を可能な限り開示すること。
別紙2
生体由来材料を利用した新規機能を有する医療機器に関する評価指標
1.はじめに
生体由来材料は、乾燥豚皮、コラーゲン、ゼラチン等すでに医療機器の材料として用いられてきたが、昨今、従来と比較してより優れた創傷治癒促進効果あるいは組織再構築等の性能を有する生体由来材料及びそれを利用した医療機器の開発が報告されている。ヒトあるいはウシ、ブタ等の異種動物の組織を脱細胞化、凍結乾燥等のプロセスにより加工した材料は、そのまま、あるいは更なる加工を経て、組織の修復・機能回復を目的とする医療機器への応用が期待されている。一方で、既存の生体由来材料を従来と異なる形で加工し、組織再構築能等の新規機能を付与した医療機器の開発も報告されている。これらの生体由来材料の医療応用については、国の定めた原料基準はあるものの、個々の分野で開発されている製品分野毎の承認審査に役立つ評価指標については、まだ具体的に定められていない。欧米においても、現在は我が国と同様に規格・評価指標が不明確であることから、今後の国際的貢献も視野に入れ、本邦の承認審査のための知見の集約及び基本的な考え方の方針を明確にすることが望ましい。
国内外のこのような状況を踏まえ、革新的な医療機器の基盤材料となることが期待されている生体由来材料の評価についての考え方を明確にするとともに、それらを材料とする医療機器の安全性、有効性を適切に評価し、迅速に承認することを目的とした評価基準の策定が求められる。このため、今後開発されることが予想される生体由来材料を利用した新規機能を有する医療機器を対象とした新たな評価指標を作成した。
2.本評価指標の対象
本評価指標は、脱細胞化、凍結乾燥等のプロセスにより内在する生細胞を全て除去、又は死滅させた組織を材料として利用、あるいはヒト・動物の組織から抽出・精製したタンパク質等を新規手法により再構築することにより、既存製品と比較して高機能な創傷治癒促進効果あるいは組織再構築等の性能を付与し、損傷した生体組織の機能回復や疾病治癒を目的として製造された医療機器全般を対象とする。また、現時点で本評価指標が対象とする医療機器は、主に、上記目的を達成するため、自己組織に置換され、生体内で分解・吸収されることを意図したものとする。あくまでも医療機器を対象とするものであるため、生きた細胞を有した状態で生体組織を使用する移植用組織や再生医療等製品に相当するものは本指標の対象とはしない。しかしながら、再生医療等製品の原材料として用いる生体由来材料の評価において本評価指標の適用が可能な場合、その適用を妨げるものではない。
3.本評価指標の位置付け
本評価指標は、近年技術革新の著しい生体由来材料を利用した新規機能を有する医療機器を対象とするものであることを勘案し、その評価にあたり現時点で必要と思われる事項を示したものである。よって、今後の技術革新や知見の集積等を踏まえ改訂が必要なものであり、承認申請内容等に関して拘束力を有するものではない。
生体由来材料を利用した医療機器の評価に関しては、個別の製造方法及び製品特性を十分に理解した上で、科学的な合理性を持って、柔軟に対応することが必要であり、また、本評価指標以外に現存する国内外の関連ガイドライン等を参考にすることも考慮すべきである。
4.評価にあたって留意すべき点について
(1) 総論
本評価指標の対象となる生体由来材料を利用した医療機器は、以下の3例に大別される。
1.原料である生体組織等における一定の形態を保持したまま、加工等により生細胞を除去、又は死滅させて利用した医療機器
2.生体内外で人工材料や細胞等を利用して、目的とする生体組織等の一定の形態に再構築し、加工等により生細胞を除去、又は死滅させて利用した医療機器
3.組織から必要なタンパク質や多糖等を抽出・精製し、それを単独、あるいは他の材料と複合して再構成物とする医療機器
各々のケースで製造プロセスが全く異なるために、そのプロセスに起因した個別に留意すべき項目も存在するが、本項では主としてこれらに共通して評価、留意すべき項目を列挙する。
(2) 基本的事項
① 開発の経緯、品目の仕様、当該品目及び必要に応じ、類似品の国内外での使用状況(販売数量や不具合報告例を含む)、設計開発と原理、目標とされる使用方法等を明確に示すこと。
② 以下の事項を参考として、製品の概要を明確にすること。
ア) 使用目的又は効果
適応となる疾患、臨床上の必要性、期待する効果
イ) 形状、構造及び原理
外観形状、構造(構成品の組合せ方法、空隙率、層構造等)、原理、機能等
ウ) 材料の由来(原材料)
基本的には「生物由来原料基準」(平成15年厚生労働省告示第210号)1を遵守して生体由来材料を利用することになるが、その際、病原体による感染の可能性及び一定の品質を維持するために以下の点を考慮し、必要な原材料規格を原材料欄に記載すること。
・ 原材料として用いられる組織、細胞外マトリックス、抽出タンパク質等の起源及び由来(ヒト由来細胞・組織、ヒト由来成分(自己、同種)、動物由来細胞・組織、動物由来成分の区別及びその選択理由)
・ 入手方法及び経路
・ 採取部位及び採取方法の妥当性
原材料としての生体由来組織を採取するにあたっては、その採取部位の選定基準、採取方法を示し、これらが科学的及び倫理的に適切に選択されたものであることを明らかにすること。採取方法については、用いられる器具、微生物汚染防止、取り違え防止やクロスコンタミネーション防止のための方策等を具体的に示すこと。
・ ヒト細胞組織や動物細胞組織採取時のドナースクリーニングの内容(適切なウインドウピリオドを設定した上での感染性評価や適切な規格を利用した感染性評価の有無を含む)等、選択基準及び適格性
・ トレーサビリティ(記録の整備、保管の具体的方策)
その他、最終製品が生体由来組織以外の材料と複合化したものとなる場合は、その材料に関しても上記項目に留意し、それらの知見を明らかにすること。
また、組織から抽出・精製したタンパク質や多糖等を医療機器の原材料とする場合には以下の点についても留意すること。
・ 抗原性
・ 発熱性
エ) 製造方法
生体由来材料の場合、その採取対象(自己、同種、あるいは異種)及び部位等により考えられるリスクが異なるだけでなく、その特性も異なっているため、それぞれを考慮した適切な製造方法であることを示すこと。
工程の製造条件によって製品の使用目的、性能等が影響を受ける場合においては製造条件の記載を行うこと。
現時点で想定される具体的な記載項目例を以下に示すが、製品の特性に応じた記載項目の選択、追加が必要となることに留意すること。
・ 受け入れ検査
画像1 (18KB)
各種記録の保管
画像2 (18KB)
組織採取の工程のSOPの適切性
画像3 (18KB)
ドナーの病歴、健康状態の確認方法
・ ロットの規定、構成、取り違え防止策
・ 製造工程(生細胞の除去、又は死滅方法を含む)
・ 製造に使用した薬品・添加剤成分の種類及び配合量等とその残留量及び影響
・ 製造工程における微生物学的モニタリング(細菌、真菌、ウイルス等)
・ ウイルス等、感染性物質の不活化/除去処理と、当該処理方法に関する妥当性及び評価(組織構造が保持された状態でウイルス不活化/除去処理を行う場合は、組織深部におけるウイルス不活化/除去に関する評価を含む)
・ 保存方法(滅菌容器、温度、湿度)と保存期間
オ) 滅菌
無菌性保証水準(SAL)を担保するためのバリデーションを行う場合には、「滅菌バリデーション基準の制定について」(平成29年2月15日付け薬生監麻発0215第13号厚生労働省医薬・生活衛生局監視指導・麻薬対策課長通知)等を参考にすること。
適用した滅菌処理による最終製品の物理的、化学的特性への影響を評価すること。
エチレンオキサイド滅菌を行う品目の場合は、滅菌後に残留するエチレンオキサイド及びエチレンクロロヒドリンに関する試験を実施すること。
──────────
1 当該基準の関連通知である「生物由来原料基準の運用について」(平成26年10月2日付薬食審査発1002第1号・薬食機参発1002第5号)等も参照すること。その他の参考になる通知として、「ヒト又は動物由来成分を原料として製造される医薬品等の品質及び安全性確保について」(平成12年12月26日付医薬発第1314号)の別添1「細胞・組織利用医薬品等の取扱い及び使用に関する基本的考え方」がある。
③ 性能及び安全性評価においては、品目ごとの力学的負荷や期待する性能を考慮して必要な項目を設定し、当該項目に対する非臨床試験の成績等も踏まえて適切な規格値を設定すること。力学的負荷及び期待する性能の判断基準としては「製品の特性」、「適用部位」、「使用方法」を考慮し、製品の設計仕様に基づき適切な規格値を設定すること。なお、生体由来材料を用いる場合は、材料由来のバラツキを考慮した上で臨床上許容可能な規格値を設定することが望ましい。生体由来材料からなる医療機器、特に脱細胞化組織を利用した医療機器の場合には、当該組織内に残存する生細胞、あるいは細胞残渣の有無がその安全性に影響することが考えられるため、科学的根拠に基づいて、安全性を担保する上で適切な処理方法と残存生細胞等の有無を検討すること。
(3) 非臨床試験
製品の有効性及び安全性を裏付ける試験等は、従来の医療機器に共通して求められる各種評価項目のほか、本評価指標が対象とする生体由来材料を使用した医療機器特有の項目について特に留意して実施する必要がある。なお、承認前例のない原材料を用いている場合や製造工程に新規性のある場合は、原則として当該原材料の物理的、化学的特性、生物学的安全性、安定性及び耐久性について、評価を実施する必要がある。特に、脱細胞化組織や羊膜等の組織を加工して使用する医療機器においては、生体本来の組織構造を兼備しているという、人工的に合成・製造する手法では成し得ないと考えられる特徴を有していることから、その適切な評価は重要である。
以下に、一般的に留意すべき点を示すが、補完可能な評価により省略できる場合がある。
① 物理的、化学的特性
当該製品の製造工程が原材料に対し、物理的、化学的特性に影響を与える場合は、その工程を経た最終製品についてその形状、構造、使用部位、目的に応じた適切な試験を選択してその影響を評価する必要がある。なお、本評価指標の対象は最終製品が自己組織に置換され生体内で分解・吸収されることを意図したものであるため、可能な限り、その分解・吸収挙動等について評価すること。
現時点で想定される具体的な評価方法例を以下に示す。
ア) 化学構造、含有成分、pI、FT―IR等の化学的特性に係る情報
イ) 溶出物、分解生成物、分解特性
ウ) 架橋処理を行っている場合には、架橋度、架橋材などの不純物の残量や生成される副産物の種類や特性等の情報
エ) 外観、表面特性、気孔率、吸水性
特に、脱細胞化組織の場合には、個々の脱細胞化プロセス(界面活性剤による洗浄、凍結融解による細胞破壊、及び高張液/低張液処理等)によって、細胞成分の除去のみならず、組織構造を構成しているコラーゲン、エラスチン等の細胞外マトリックス成分の除去及び組織構造の変化を伴うものが多い。これらの変化が最終製品の物理的、化学的特性に影響を及ぼす場合もあるため、可能な場合には期待される特性を保持しているかについて、これらの点を留意した評価が必要である。
② 生物学的安全性
「医療機器の製造販売承認申請等に必要な生物学的安全性評価の基本的考え方について」(平成24年3月1日付け薬食機発0301第20号厚生労働省医薬食品局審査管理課医療機器審査管理室長通知)を参考に、JIS T0993-1又はISO 10993-1に準拠して評価すること。
③ 機械的安全性
対象とする医療機器の形状、構造、使用部位、目的に応じて、ワーストケースを設定し、以下に例示した項目についてその初期強度、分解・吸収に伴う経時的強度変化等を評価すること。なお、製品の特性に応じて評価項目を選択、追加する必要があることに留意すること。
ア) 引張り強度,剛性等の生体力学的特性
イ) 圧縮強度,剛性等の生体力学的特性
ウ) 引き裂き強度等
④ 安定性及び耐久性
本評価指標が対象とする生体由来材料を原材料とする医療機器は、人工材料からなる医療機器と比較して、安定性や耐久性に劣っていることが想定されることから、それらを考慮して以下の点を評価すること。
ア) 力学的、生物学的及び形態学的に求められる条件を適切に規定すると共に、それらを評価して機器として求められる性能を担保できる有効期間を設定するとともに、その期間にあっては性能が維持できること。
イ) 無菌性が担保できること。
⑤ 性能評価
本評価指標が対象とする生体由来材料を利用した医療機器の性能は、製品が、適用される組織に力学的、生物学的及び形態学的に適合することによって発揮されると考えられるため、力学的、生物学的及び形態学的に求められる条件を示すと共に、それらを評価して医療機器として求められる性能を有することを示すこと。特に、本評価指標の対象となる医療機器は、主に、自己組織に置換され、生体内で分解・吸収されることを意図したものであるため、可能であれば自己組織への置換を評価するための経時的データを示すこと。
⑥ 動物試験
患者への力学的適合性、生物学的適合性又はその他の性能等の評価において動物試験(in vivo試験)を実施する場合は、以下の点を参考に適切な評価を行うこと。
ア) 試験動物
・ 動物の種類とヒトへの外挿性(解剖学的、生理学的特徴等)
・ 動物への手技と臨床における手技との比較考察
イ) 試験プロトコル
・ 評価項目、評価基準、評価方法、評価期間及び評価者
・ 比較対象(既存の治療に対する同等性、優位性の評価)
・ 計測データ(生理学的及び機械的データ等)
・ 例数の設定とその妥当性
・ 解析における統計学的手法の妥当性
ウ) 評価にあたって考慮すべき点
・ 治療状況(治療目標の達成度)
・ 品質、有効性及び安全性に影響を及ぼす細胞浸潤の程度、経過及びその細胞の種類
・ 組織構造変化
・ 力学的特性変化
・ 免疫学的反応の有無(異物反応や炎症等)
・ 適用部位における腫瘍形成の有無
・ 製品の性能に係る設計仕様の満足度及び改善点
・ 生体に対する有害事象の程度及び頻度
・ 動物実験で確認する項目に関わる機器不具合
(4) 臨床試験
① 治験の要否
対象となる医療機器の使用目的、性能、構造等が既存の医療機器と明らかに異なる場合については、原則として臨床試験の試験成績に関する資料の提出が必要である。また、医療機器の臨床的な有効性及び安全性が性能試験等の非臨床試験成績又は既存の文献等のみによって評価できる場合には臨床試験(治験)の実施を省略できる可能性がある。治験は、医療機器の臨床試験の実施の基準に関する省令(平成17年3月23日厚生労働省令第36号:医療機器GCP省令)を遵守して行う。
② 試験デザイン
試験デザインは、治験機器の臨床的位置づけ、非臨床試験の成績及び試験の目的を踏まえて、適切に計画される必要がある。基本的には、既存治療等を対照としたランダム化比較試験が望ましいと思われるが、妥当なヒストリカルコントロールが既に存在する場合は、それとの比較が受け入れられる可能性がある。その際は、患者背景、時代背景その他を踏まえて、本邦での有効性及び安全性を評価するに当たって、比較が適切であるか判断できる必要があり、試験開始までに当該データを踏まえて試験の達成基準を適切に設定しておくことが必要である。また、自己組織化が想定される機器においては、適用部位によっては組織学的評価が困難であるため、画像解析や臨床学的(血液)データ等による適切な評価プロトコルを構築しておくこと。なお、治験機器として、同種組織、あるいは異種組織を使用する機器の場合は、治療対象、倫理性及び組織由来感染症のリスクを考慮して検討すること。
評価項目によっては、術者の習熟度、技量等により大きく影響を受けることが考えられる。個々の術者の習熟度のばらつき等による機器の評価への影響を防ぐため、推奨される手術手技を明示し、特殊な手技の場合には一定のトレーニングを経た術者により治験を行う等の配慮が必要であることにも留意すること。
③ 症例数
臨床試験の目的や主要評価項目等を踏まえ、科学的根拠に基づき、当該医療機器の有効性、安全性の評価に適切な症例数とする。希少疾病用医療機器等、適応疾患の症例自体が少ない等の事情がある場合には、事情を勘案して妥当な治験計画を立て、評価可能で実施可能な症例数を検討すること。なお、比較対照をおく場合にあたっては、統計学的な根拠を基に症例数を設定する必要があることに留意すること。また、信頼できる海外データを承認申請の添付資料として使用できることがあるが、それのみで臨床評価を行うことができるかどうかについては十分に検討すること。
④ 評価期間
適応疾患、治療を受けた時期の疾患進行度や特徴等に応じて適切な時期に評価を行うこと。
⑤ 有効性評価
基本的には、治療直後の急性期成功率及び治療後一定期間経過後の治療効果が既存の機器と比較して優越性若しくは非劣性であることを示すが、機器の特徴によっては、この限りではなく、各機器のリスクベネフィットバランスを勘案した総合的な評価が望まれる。
生体由来材料製品の有効性評価において検討すべきと考えられる項目は、その適応等に応じて科学的に妥当な評価項目を適宜選択、検討する必要がある。従来の医療機器との比較が可能な場合には、従来の評価方法に準じた評価、指標を用いることが可能と考えられる。一方、従来の医療機器との比較が困難な場合には、科学的根拠を基にその妥当性等を示した上で、新たに有効性を評価するための方法、指標を用いる必要がある。評価項目の選択、検討にあたっては、必要に応じて医薬品医療機器総合機構の相談制度を利用することが推奨される。
⑥ 安全性評価
治験機器の安全性は、開発コンセプトも踏まえて、適切な評価項目が設定される必要がある。機器自体に破損等が起こる「不具合」のみではなく、機器を使用した際に機器の破損等によらず生じた「有害事象」も評価する必要がある。以下の事項に留意して治験の計画を立案すべきである。
ア) 有害事象
有害事象とは、「治験機器との因果関係の有無に関わらず、当該治験機器の使用時に、被験者、使用者その他の者に生じたすべての好ましくない又は意図しない疾病又は障害並びにその徴候(臨床検査値の異常を含む。)」をいう(ただし、被験者以外の者に生じたものについては、治験機器の使用による影響と疑われるものに限る)。対象となる手術内容によって発生する有害事象の内容やその発生頻度は異なるが、発現頻度及び重篤度を評価し、発生した有害事象が機器固有の問題に起因するものであるか、術者の手技によるものであるか等の考察をする必要がある。
イ) 不具合
被験機器の不具合については、発現内容、頻度、重篤度等を評価する。不具合に対して講じられた安全対策等については、その妥当性も含めて説明する必要がある。
生体由来材料製品の安全性評価において検討すべきと考えられる項目例を以下に示す。なお、これらは現時点で想定される項目を示したものであり、その適応等に応じて科学的に妥当な評価項目を適宜選択、検討する必要がある。
・ 術後の発熱、出血、膿瘍形成の有無
・ 炎症(3ヶ月程度の観察期間)
・ 感染
・ 腫瘍形成
・ 再建後の破断
・ 画像、血液データ、臨床症状に基づく有害事象の有無等
別紙3
血流シミュレーションソフトウェアに関する評価指標
1.はじめに
計算機及び計算技術の発展と共に数値流体計算が汎用の計算機で簡便に行えるようになり、血流シミュレーションも一部の工学研究者が使用するばかりでなく、医療従事者も使用するようになってきた。血流シミュレーションは、血行動態に関する医学的情報を提供するものであり、今後、様々な形で臨床応用が期待される技術である。
本邦においては、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律の改正が施行され、疾病の治療、診断、予防を目的に使用される医療機器プログラムが医療機器の範囲に含められた。医療機器プログラムに該当する血流シミュレーションソフトウェアについては、臨床上必要な性能を確保するために、評価の考え方、評価方法等の整理が求められている。
本邦のみならず米国や欧州においても、医療機器としての血流シミュレーションの精度や妥当性について、公的な指針や指標は存在しない。以上から、本評価指標においては、製造販売業者による申請の準備、並びに医薬品医療機器総合機構による審査の迅速化に寄与することを目的として、血流シミュレーションソフトウェアの品質・有効性・安全性に関する必要事項及び承認申請に際し留意すべき事項を定めた。
2.本評価指標の対象
本評価指標では、対象とする血流シミュレーションソフトウェアを、「医療機器プログラムに該当するものであって、かつ、医用画像データを使用して血管又は心臓の内腔形状を仮想的に構築し、その情報に従って物理学的法則に基づく方程式を解くことによって、血管又は心臓内の血液の流れを計算・提示し、臨床診断及び治療につながる情報を提供するもの」と定義する。また、付帯する人為的な作業を含めた工程も本評価指標の対象とする。
医用画像データとしては、超音波、CT、MRI、血管造影等が挙げられる。物理学的法則とは、一般的に流れの支配方程式として認識される連続の式及びNavier-Stokes方程式であり、Boltzmann方程式等それらの派生式を含む。血管及び心臓内の血流の提示には、流線やコンター図等の可視化技術の他、血流に係る物理情報を数値的に提供するものも含まれる。血流シミュレーションソフトウェアの使用目的は、病態の診断、治療法の決定、治療デバイスの決定、治療効果の予測等である。計測データに基づいて血流を可視化する方法として、ドップラ法、PC―MRI、perfusion CT等造影剤の流動を追跡する方法等があるが、流れの支配方程式を解かずに、血流情報を提供する範囲においては、本評価指標で定義する血流シミュレーションソフトウェアには含めない。但し、医療機器に該当すると考えられる場合には、本評価指標の利用可能な部分の活用について使用を妨げるものではない。
医療機器プログラムの関連文書として、「プログラムの医療機器への該当性に関する基本的な考え方について」(平成26年11月14日付け薬食監麻発1114第5号厚生労働省医薬食品局監視指導・麻薬対策課長通知)、「医療機器プログラムの取扱いについて」(平成26年11月21日付け薬食機参発1121第33号、薬食安発1121第1号、薬食監麻発1121第29号厚生労働省大臣官房参事官(医療機器・再生医療等製品審査管理担当)、厚生労働省医薬食品局安全対策課長、厚生労働省医薬食品局監視指導・麻薬対策課長連名通知)、「医療機器プログラムの承認申請に関するガイダンスの公表について」(平成28年3月31日付け厚生労働省医薬・生活衛生局医療機器・再生医療等製品担当参事官室事務連絡)等の関連通知等を参考にすること。
医療機器への該当性、クラス分類の判断については、「プログラムの医療機器への該当性に関する基本的な考え方について」等を参照して検討し、必要に応じて厚生労働省医薬・生活衛生局医療機器審査管理課に相談すること。
3.評価指標の位置づけ
本評価指標は、技術開発の著しい機器を対象とするものであることを勘案し、現時点で必要と思われる事項を示したものである。今後の技術革新や知見の集積等を踏まえて改訂されるものであり、承認申請内容等に対して拘束力を持つものではない。本評価指標が対象とする製品の評価にあたっては、個別の製品の特性や使用される臨床現場の状況を十分に理解した上で、科学的な合理性を背景にして、柔軟に対応する必要がある。なお、本評価指標の他、国内外のその他の関連ガイドライン等を参考にすることも考慮すべきである。
4.評価にあたって留意すべき事項
血流シミュレーションソフトウェアは、通常の医療機器とは異なり、物理的、化学的特性及び形状等で性能を担保することが難しいため、性能に影響する要素、効果の確認できる範囲や限界等を予め規定すること。診断に関する情報等を導き出すための理論及びアルゴリズム注1をそれぞれで明確にし、その妥当性を評価すること。以下、評価にあたって留意すべき事項を例示する。すべての項目について、必ず評価が必要とは限らないが、評価が不要と判断した場合は、その妥当性を科学的根拠により説明する必要がある。
(1) 品目の概要に関する事項
1) 臨床的意義
診断、診断支援、治療計画支援といった使用目的や、適用患者、疾病の種類及び重症度、使用する治療のフェーズといった対象範囲を明確に定義し、その臨床的意義を明らかにすること。提供する情報の妥当性及び臨床成績との関係について根拠をもって明確に示すこと。一方、その臨床的意義が確立された情報を提供し、既承認の医療機器に比して新たな機能が付与されない範囲のものについては、数値の同等性評価等で検証が可能な場合もある。効果の妥当性に関しては、既存の製品・方法との違いを踏まえ、リスク・ベネフィットのバランスに基づいて総合的に判断すること。
2) データの入出力と処理工程
医用画像データの入力から血流指標の出力に至るまでの一連の流れ及び流れを構成する各工程の内容を詳らかにすること。また、各工程における基本原理及びアルゴリズムをそれぞれ示すこと。工程は可能な限り詳述すること。
申請が想定される血流シミュレーションソフトウェアは、血管または心臓の内腔形状構築と血流計算の二つの工程に大別されると考えられる。
内腔形状構築の工程として、入力される医用画像データのフォーマット適合性及び画像の品質を判断する工程、画像から内腔形状を抽出する工程、抽出された内腔の表面を平滑化する工程、内腔形状を修正する工程、医用画像データの画質が不十分である場合に対処する工程等が挙げられる。データの入出力として、内腔形状構築に使用する入力データのフォーマットを明らかにすること。画像から内腔形状を抽出する工程や抽出された内腔の表面を平滑化する工程等において、閾値等のパラメータ設定が必要な場合は、その設定原理、理由、学術的背景を記述すること。内腔形状の修正を許す場合は、修正方法や処理工程を示すこと。外部からの形状データ入力を許す場合は、入力される内腔形状データのフォーマット適合性及び品質を判断する方法を含めること。
血流計算の工程は、主に、内腔形状の計算格子分割、血液物性設定、境界条件設定、流体計算、血流指標の出力又は結果の可視化によって構成される。内腔形状の計算格子分割においては、使用する計算格子の種類及び処理工程を示すこと。血液物性の設定においては、使用する密度、粘度等の物性値の一覧を示すこと。密度については、圧縮性流体とするか非圧縮性流体とするかの取り扱い方法も示すこと。粘度については、ニュートン流体とするか非ニュートン流体とするかの取り扱い方法を記した上で、非ニュートン流体とする場合は、使用するモデルを示すこと。境界条件は、解析対象の入口、壁面、出口の領域毎に、その設定法を詳述すること。Windkesselモデル等の低次元血流モデルと組み合わせて境界条件を設定する場合には、流体計算部分との連成方法について示すこと。流体計算法においては、支配方程式の定式化法のみでなく、空間離散化法、層流モデルか乱流モデルかといった流体モデル、行列方程式解法、収束判定法を記述すること。また、非定常解法の場合は、時間進行法やCFL条件に対する対処法を示すこと。計算が収束しない場合の処理法も示すこと。結果として出力する血流指標については、その計算法を示すこと。結果の可視化に際して、壁面せん断応力や流線等、結果の演算が必要な場合は、その演算方法を示すこと。
工程中、データベースを参照する場合においては、そのデータベースの出典等を明らかにすること。また、工程の一部において医用画像解析ソフト、数値流体解析ソフト、可視化ソフト等汎用のソフトウェアを流用する場合は、ソフトウェアのバージョンを明記すると共に、申請する血流シミュレーションソフトウェアにおける使用方法について詳細に記述すること。
3) 使用方法
血流シミュレーションソフトウェアの解析結果は、その性能の他、使用する医用画像データの質や解析時の処理条件等に影響されるため、医用画像データの取得から診断等の結果が得られるまでの、入力データの標準化、ユーザの介在、プラットフォームや使用環境の要件等を含む全工程を記載すること。
4) 適応範囲
対象疾患に加え、患者の状態を含めて、製品が効果を発揮できる範囲(適応範囲)を明記すること。
5) 解析装置の仕様
使用するPCに必要な仕様を明らかにすること。その際、共存するその他のソフトウェア等との干渉についても評価すること。
6) トレーニング計画や取扱い資格制度の必要性とその内容(品質維持)
ユーザの介在を完全に排除することが困難な血流シミュレーションソフトウェアにおいては、適切なユーザによって使用されない場合や、ユーザの介在があるために十分な性能が発揮できない場合が考えられる。従って、ユーザの要件を考慮した上で臨床上十分な性能が確保できることを評価することが望ましい。また、ユーザの教育は目的を明確にし、習熟度及び達成度について評価することが望ましい。例えば、セグメンテーションにおいてユーザが介在し、技術レベルを一定水準以上に維持する必要がある場合、適切なセグメンテーションが可能となるように、ユーザを対象とした教育システムを構築し、評価、認定による運用等が想定される。
(2) 品質と安全性に関する考え方注2
血流シミュレーションソフトウェアでは、入力画像の品質、血管等の内腔形状の構築、血流計算アルゴリズムの各品質が計算される血流指標に影響を及ぼすため、各工程の品質評価が必要となる。品質が担保されていない血流シミュレーションソフトウェアによる解析結果は、誤った医学的指標値を提示することにつながり、安全性に影響を及ぼすことから、製品が自動で実行する工程において解析精度を維持できない事象が発生した場合には、適切に解析フローを停止すること及び使用者へ解析フローが停止したことを表示することができるアルゴリズムを含むことに加え、以下に留意して品質評価を行うこと。
1) 入力画像の品質
解析のために入力する医用画像データに求められる仕様及び品質について明らかにすること。仕様については、撮影用装置の要件、解像度、推奨する撮像条件等が考えられる。また、品質に影響を与える因子として、造影効果、石灰化の程度、撮像時のアーチファクト等が考えられる。要求品質に満たない画像が入力された場合の、ソフトウェア及びユーザの対応について記載すること。ソフトウェアの対応であれば、例えば、計算が先に進まないような対策が考えられる。ユーザの画像品質に対する判断能力を涵養するような教育システムを構築する等の対策を開発側が整える場合、教育システムの質を確認すること。
2) 形状の構築
セグメンテーション方法、解析領域の設定法、形状の平滑化法、端面処理法等、医用画像データから数値流体計算に使用する血管形状の構築方法について詳述すること。形状の構築において、ユーザの介在を許可する場合は、介在によって血管形状を計算に不適切な程大幅に変更できないような仕組み等を用意すること。セグメンテーション及び平滑化については、デジタルファントムあるいは物理的ファントムを用いた試験を通じて、形状の再現精度を示すこと。解析領域の設定法及び端面処理法については、形状の再現精度ではなく、血流シミュレーションを行った際の解の不確かさの観点から、その妥当性を確認すること。
3) 計算格子生成
血流シミュレーション結果の格子依存性がないように、計算格子が生成されることを確認すること。特に、壁面せん断応力やそれに関連するような値を出力する場合、計算格子の質が結果に大きく影響するため、計算格子の生成法とその影響を十分に確認すると共に、性能が担保できないような格子生成が行われた場合の対応策を明示すること。
4) 血液の物性値の設定注3
血液の密度及び粘度等の物性値について、その妥当性を説明すること。非ニュートン流体として設定する場合には、流体モデル及びパラメータ値の妥当性を説明すること。ユーザが血液の物性値を設定できるような機能を備える場合、異常値が入力された際の対応方法を示すこと。物性値については、血流シミュレーションを行った際の解の不確かさの観点から、その妥当性を確認すること。
5) 境界条件
流体を解析する対象領域の境界部における流れの条件(境界条件)を示すこと。領域の境界は、入口、出口、壁面(血管内腔面との境界)に分類される。それぞれにおける条件及びその設定方法について具体的に記述すること。境界条件設定の一例として、入口に流速条件、壁面に滑りなし条件に基づくゼロ速度条件、出口にトラクションフリー境界条件(参照圧力固定値)がある。流速条件を課す場合には、一様流速など空間的な速度分布に関する条件についても記述する必要がある。ユーザが境界条件を決定できる場合、決定指針を示すとともに、異常値が入力された際の対応方法を示すこと。境界条件については、生体内で生じうる範囲内において、流量や境界面での速度プロファイル等の不確定因子について、血流シミュレーションを行った際の解の不確かさの観点から、その妥当性を確認すること。
6) 数値流体計算
必要に応じて、ユーザが計算条件(例えば、離散化手法、行列計算法、収束判定方法(収束判定値を含む))を選択できる場合、それらが数値流体計算の結果に与える影響について確認すること。数値流体計算としての精度確認であれば、理論解及び工学的に広く行われているin vitro試験(backstep流等)と比較し、数値流体計算結果の品質を確認すること。
表 数値流体計算の精度確認法
メリット |
デメリット |
|
理論解 |
・正確 |
・ポアズイユ流、クエット流、ウォーマズリ流等、単純な流れしかデータがない ・生体内とは状況が異なる |
in vitro試験 (生体外模擬回路による実験) |
・比較的複雑な形状を扱える ・流量等の条件が調整しやすい ・物性値は血液に近いものが使える |
・形状が必ずしも設計値通りではない ・計測値に誤差がある ・境界における流速分布等が分からない場合がある ・非ニュートン性等、血液の物性値を完全に模擬することはできない ・血管や周囲組織の弾性等を考慮することは難しい |
in vivo実験試験 (生体内の血流計測) |
・生体での計測値が得られる |
・生理学的変動を避けられない ・血管形状測定に誤差が生じる ・速度計測誤差が大きい ・計測できる部位が限定される ・境界条件を完全に把握することはできない ・物性値の計測が困難 |
7) 血流計算結果の提供方法
数値流体計算の結果が正しく出力されているか確認すること。結果をベクトル、カラーコンター等により可視化して出力する場合、正しく可視化できているか確認すること。数値流体計算の結果から二次的な物理量を算出する際には、計算方法及び計算精度を確認すること。
(3) 性能に関する事項
血流シミュレーションソフトウェアでは、血管等の内腔形状構築工程と血流計算アルゴリズム全体で算出される医学的指標の性能を評価する必要がある。以下に示す項目を参考として必要な評価を実施し、血流シミュレーションソフトウェアが適切な性能を有していることを確認すること。なお、補間可能な評価により省略できる場合がある。
1) 非臨床試験
①ソフトウェアの動作確認
基本的な入出力が正しく行われるかを確認する。例えば、血管形状構築の工程では、定められたフォーマットの医用画像データを正しく読み込めるかを確認する。また、入力や解析過程、解析結果において異常値が検出された場合の対応の妥当性を評価すること。
計算結果が臨床上使用されるパラメータで示されている場合、そのパラメータが正しく計算されているか評価すること。また、解析が適切に行われなかった場合、その結果を利用できないように対策されているか確認すること。
②モデルを用いた評価
非臨床における評価試験は、あらかじめ正解あるいはそれに準ずるものを想定し、血管や心臓等の形状構築工程、数値流体計算アルゴリズム全体で算出される医学的指標の妥当性を評価する。例えば、血管形状構築の工程の場合、in vitro試験系においてあらかじめ形状が定義された模擬血管を臨床で使用することを想定している医用画像診断装置で取得し、模擬血管の実寸とプログラム上で構築された模擬血管の形状を比較することで、血管形状構築の工程の精度を評価し、この差異が血流シミュレーションソフトウェアで計算される医学的指標値に及ぼす影響を評価することが考えられる。
また、血流シミュレーションでは、拍動流等の血流、拍動や呼吸による血管壁の変形等に関して多くの仮定やモデル化をして計算しており、計算アルゴリズムの品質評価とは別に、医学的指標を提示する医療機器として妥当な性能を有しているかを評価する必要がある。例えば、臨床使用環境、対象となる病態等を模擬したin vitro試験での計測値と血流シミュレーションソフトウェアでの計算値を比較し、性能を評価することが考えらえる。
2) 臨床試験
血流シミュレーションソフトウェアの示す結果の臨床的な有効性及び安全性が性能試験、動物試験等の非臨床試験成績又は既存の文献等のみでは評価できない場合に臨床試験(治験)の実施が必要となり、臨床試験成績に関する資料の提出が求められる。その使用目的、手術手技、性能、構造等が既存の医療機器と明らかに異なる場合については、原則として臨床試験の試験成績に関する資料の提出が必要である。(参考:「医療機器に関する臨床試験データの必要な範囲等について」(平成20年8月4日付け薬食機発0804001号厚生労働省医薬食品局審査管理課医療機器審査管理室長通知))臨床試験で評価すべき内容については、個々の医療機器の特性、既存の医療機器との同等性、非臨床試験の試験成績等により総合的に判断されることから、治験プロトコルについては、医薬品医療機器総合機構の対面助言等の相談を利用することを推奨する。
5.その他の留意すべき事項
(1) 適正使用指針
必要性に応じて関連する学会と連携し、適正使用指針を事前に定める等、対策を講じること。指針においては、既知のエビデンスに基づいた対象、運用方法等を記載すること。
(2) 使用データ及び計算条件の保存
データの保管方法、保管期間及びデータの破棄方法を明示すること。解析が再現可能な状態を確保するため、血液の密度や粘度の数値等を含む計算条件、血管形状のモデルや計算格子、解析結果等を必要な期間保存する教育又はソフトウェア上での管理等の仕組みや対策を講ずること。
(3) 個人情報の保護対策
計算結果及びそれに連結された個人情報の流出対策を実施すること。オフサイトで解析を行う場合は、データ送受信及び保管にも留意すると共に、匿名化処理したデータのみを使用することが望ましい。
(4) サイバーセキュリティ対策
必要なサイバーセキュリティ対策を行うこと。
(5) ソフトウェアの管理
適切なバージョン管理を行うこと。オンサイト利用のソフトウェアの場合は、ユーザが設定すべき項目以外、変更できない仕様にすること。
(6) 改定・改良した場合の取り扱いについて
ソフトウェアを変更する場合は、変更の度合いにより変更手続きが必要な場合がある。必要な手続きについては、申請者自身で判断するのではなく、審査における現行での判断状況を確認するためにも、医薬品医療機器総合機構の相談制度を利用することを推奨する。
注1
アルゴリズムとは、血流解析シミュレーションソフトウェアにおける処理手順や数式を含む計算手順のことをいう。
注2
血流シミュレーションの品質と安全性を考える上では、精度と不確かさの2点を確認しておくことが必要である。精度とは、真値(正解)に対してのずれを言う。例えば、10kgであると分かっている物体があるとする。この質量をある測定器で測った時、測定値が9.8kgであったする。このときの真値10kgと9.8kgの差を精度と呼ぶ。一方、不確かさは、その解がもつ値のぶれ幅のことである。血流シミュレーションにおいて、多くの場合、患者個人の血液の粘度は不明である。この場合、生理学的データに基づいて、標準的な値を入れることになるが、標準値にも幅がある。標準の幅の中で、値をふった際に得られる解の振れ幅が不確かさに該当する。血流シミュレーションにおいて、精度や不確かさに影響を与える因子は多くあり、それらは非線形的な相互作用によって影響を及ぼす。従って、それらの影響を個々に評価しても、必ずしも最終的な品質や安全性の評価につながらない場合があることに留意すること。
注3
血液の密度は1,000~1,100kg/m3程度とされる。また、血液をニュートン流体とみなした場合、壁面上でのせん断速度が十分に大きい流れでは、粘度を0.003~0.006Pa・s程度に設定することが多い。せん断速度が十分に大きいとは、研究者によって認識に差があるが、せん断速度が20s-1~200s-1以上のことをいう。せん断速度がこれよりも小さい場合には、非ニュートン性を考慮する必要がある。
別紙4
人工知能技術を利用した医用画像診断支援システムに関する評価指標
[1.はじめに]
コンピュータ診断支援(Computer-Aided Diagnosis:以下CAD)とは、X線画像に代表される放射線画像をはじめとする医用画像に対して、コンピュータで定量的に解析された結果を「第2の意見」として利用する「医師による診断の支援」である。
当該診断支援を行う医療機器に関しては、「次世代医療機器評価指標の公表について」(平成23年12月7日付け薬食機発1207第1号厚生労働省医薬食品局審査管理課医療機器審査管理室長通知)別添3「コンピュータ診断支援装置に関する評価指標」にて公表しているところであるが、近年の計算機技術の著しい発展により実用化が可能となった学習データのさらなる追加(市販後学習)等により市販後に性能が変化する人工知能技術を利用した診断支援装置については述べられてない。また、人工知能技術の中でも、近年着目されている深層学習では、最終結果を導き出すアルゴリズムがブラックボックス化している点が特徴であると同時に、市販後学習等による性能変化の内容も基本的にはアウトプットでしか評価できないこと等から、その評価や運用に当たって従来にない新たな課題が生じることが指摘されている。当該診断支援装置を用いた際、学習データに含まれていなかったタイプの事例に対する性能をどのように評価するのか(又はそのような事例にどのように対応するのか)、学習データの真正性や偏り等を考慮してどのように学習の品質確保を行うのか、さらに、市販後の性能変化に対する評価方法等に関して、従来とは異なる新しい視点も考慮する必要がある。
このような状況に鑑み、本評価指標は、上記通知も踏まえて、人工知能技術を利用した医用画像診断支援システムの有効性と安全性を評価する際の問題点や留意すべき点について、現時点での考え方をまとめたものである。
[2.用語の定義・説明]
本評価指標における用語の定義等は以下のとおりである。
(1) 医用画像診断支援システム
臨床現場において、医師が様々な画像撮影装置を用いて画像診断(読影)を行う際に参考となる情報を提供するシステム又はソフトウェアであり、CADeやCADxの機能を持つ。支援の方式としては使用者(医用画像診断支援システムを実際に臨床現場で使用する医師等)に対する支援形式に応じ、first reader、second reader、concurrent reader等が存在する。
1) CADe(Computer-Aided Detection)
画像上で病変の疑いのある部位をコンピュータが自動検出し、その位置をマーキングする機能を有する単体ソフトウェア又は当該ソフトウェアが組み込まれている装置。コンピュータにより医用画像データのみ又は医用画像データと検査データの両方を処理し、病変又は異常値の検出を支援する。
2) CADx(Computer-Aided Diagnosis)
病変の疑いのある部位の検出に加え、病変候補に関する良悪性鑑別や疾病の進行度等の定量的なデータを数値やグラフ等として出力する機能を有する単体ソフトウェア又は当該ソフトウェアが組み込まれている装置。診断結果の候補やリスク評価に関する情報等の提供等により診断支援を行うものを含む。
注) CADeとCADxの定義は前出の通知より一部修正の上、引用
(2) 人工知能
人の高度な知能によって行われている推論、学習等を模倣するコンピュータシステム又はソフトウェア。本評価指標においては、特に、臨床で使用を開始した後、追加データによる機械学習(例えば、深層学習等)により、その性能が変化する機能(市販後学習機能)を有するものを対象とする。
(3) 機械学習
人工知能技術の一分野として大きく発展した技術であり、人間が行っている学習等の機能をコンピュータ(ソフトウェア)で実現するための手法。アルゴリズムはさまざまであり、判別分析法等の古典的手法から、決定木、ニューラルネットワーク、サポートベクターマシン等、多数の方法が提案されている。代表的な応用としてはクラス分類や回帰があるが、これらはCADの目的と一致していることから、多くのCADシステム開発時に利用されてきている。
(4) 深層学習
機械学習の一つであり、最近特に注目されている学習方法。多層化したニューラルネットワークを大量のデータを用いて学習させることに特徴がある。ニューラルネットワークには、階層型ネットワークのような確定的モデルと、ボルツマンマシンのような確率的モデルがある。学習アルゴリズムには、教師あり、教師なし、半教師学習以外に強化学習等もある。
2006年のHintonらの研究に始まり、囲碁の世界王者を倒したAlphaGoや、各種コンペティションにおいて上位を占めたソフトウェアで使用され、当時の常識を塗り替えるほど突出した成績を示したことから盛んに研究されている。性能の飛躍的向上の一つの理由は、多層のネットワークを学習可能とする新しい技術の登場である。また、深層ニューラルネットワークの学習のための大量のデータと並列分散計算環境の整備も理由のひとつである。
(5) 転移学習
20年以上も前から認識されている機械学習の一分野であり、「新規タスクの効果的な仮説を効率的に見つけ出すために、一つ以上の別のタスクで学習された知識を得て、それを適用する問題」とされている。
近年、深層学習でも盛んに転移学習が用いられるようになったが、その具体的な利用例として以下が挙げられる。
1) 大規模なデータセットで学習させたニューラルネットワークを特徴抽出器として利用し、得られた特徴を別のタスクへ転用する。例えば、一般の自然画像で学習済みのニューラルネットワークに医用画像を入力し、中間層の出力を特徴量としてその医用画像の認識・診断支援等に利用する場合が考えられる。
2) 別の目的で学習済みのニューラルネットワークを用意し、異なるタスクの学習データを用いて再学習させる。例えば,CT像の認識・診断支援を目的とする場合、1)に例示した自然画像で学習済みのニューラルネットワークにCT像と教師データを与えて再学習させる場合が考えられる。この場合には、一からニューラルネットワークを学習させる場合と比べて、少数のCT像と教師データで性能の高いニューラルネットワークが得られることが報告されている。
[3.本評価指標の対象]
本評価指標は、医用画像診断支援システムのうち、人工知能技術を利用して様々な画像撮影装置で得られた臨床画像から、
・ 疾患名まで特定せず、病変の疑いがある部位のみ検出する(いわゆるCADe)
・ 病変の疑いがある部位の検出に加え、疾患名の候補を提示する(いわゆるCADx)
・ 疾患名の候補の提示に加え、それらの重み付け(順位づけ)まで行う(同上)
等の機能を有するシステム全て(CADe、CADx等、以降「支援システム等」と記述する。)を対象とする。
対象とする支援システム等は、人工知能技術の利用の形態や学習アルゴリズムの種類にかかわらず、機械学習等による市販後学習等に伴い診断支援性能が変化することを意図したものとする。なお、対象はあくまで診断を行う医師を支援するシステムであり、仮にシステムが想定外の挙動、誤動作をした場合に、使用者側でそれを検知できることが基本要件となる。
人工知能技術を利用した支援システムのうち、製造販売業者が、市販後学習により生じる性能変化に伴う品質管理を行うことが難しいもの、例えば、使用者が市販後学習させることにより施設ごとに異なる性能変化が生じ得るものに関しては、解決すべき事項が数多く存在することから、本評価指標における検討の対象とすることは困難である。しかしながら、人工知能技術の著しい発展に伴い、これらの支援システム等が近い将来開発される可能性に鑑み、それらの品質、安全性及び有効性を確保するための基本的な考え方を別添に取りまとめた。
なお、開発する支援システム等が本評価指標に該当するか判断し難い場合は、必要に応じ厚生労働省医薬・生活衛生局医療機器審査管理課に相談すること。
[4.本評価指標の位置付け]
近年、支援システム等の開発では、深層学習のようにデータから自動で学習をする機械学習の利用が主流になっている。特に、大量のデータを継続的に収集する仕組みが整備され、学習に用いるコンピュータの性能が飛躍的に向上したことにより、短期間で繰り返し学習をすることが可能となった。また、臨床で得られたデータや支援システム等の結果を自動的に収集し、市販後学習データとして人工知能に与えて性能を変化させることも技術的には実現可能となった。そのため、臨床で使用しながらその性能が段階的又は連続的に変化する支援システム等の実現が期待されている注)。
本評価指標は、対象とする支援システム等において、現時点で考えられ得る問題点、留意すべき事項を示したものであるが、今後の更なる技術革新や知見の集積等を踏まえ改訂が必要なものであり、承認申請内容等に関して拘束力を有するものではない。
支援システム等の評価に関しては、個別の人工知能構築方法、使用目的及び製品特性を十分に理解した上で、科学的な合理性をもって、柔軟に対応することが必要である。なお、本評価指標以外に前出の「コンピュータ診断支援装置に関する評価指標」及び現存する国内外の関連ガイドライン等、例えば、平成28年3月31日付け厚生労働省医薬・生活衛生局医療機器・再生医療等製品担当参事官室事務連絡「医療機器プログラムの承認申請に関するガイダンスの公表について」別添「医療機器プログラムの承認申請に関するガイダンス」等を参考にすることも考慮すべきである。
注) 深層学習の市販後学習の対象には、ネットワークの結線(結合)の重み以外に、ネットワークのハイパーパラメータ(層数、特徴マップ数、畳み込みのフィルタサイズ、ユニット数等)も考えられる。これらのハイパーパラメータも含めた学習とは、例えば、パラメータの組み合わせごとに教師データとネットワークの出力間の誤差(損失)を最小化する学習を網羅的に行い、それらの中から誤差最小のハイパーパラメータを選択すること等が挙げられる。ただし、変更されたハイパーパラメータによって、承認の軽微な変更にあたるか、一部変更承認を要するものかを検討する必要があるため、当該変更の実施については、事前に独立行政法人医薬品医療機器総合機構と相談することを推奨する。
[5.支援システム等で想定される主な課題と解決の方向性]
(1) ブラックボックスとしての性質
機械学習、特に深層学習は、その特性上、ニューラルネットワークによる判断の過程がブラックボックスであり、アウトプットの判断根拠を明確に示すことが困難な場合がある。このため、通常の医療機器ではその性能確保のために示すことが求められる「動作原理」の明示が困難となる。そのため、承認審査においては、診断アルゴリズムを詳細に精査するというよりは、一般的な医療機器プログラムの評価と同様、そのインプットに対して所要のアウトプットが得られているかを確認することに重点を置き、その性能を評価することが適当と考えられる。
また、動作原理及びアルゴリズムの詳細を記述することが困難であるため、性能の確認が行われた事例以外(例えば、開発時の学習データセットに含まれていなかった希少事例)での挙動等が想定しにくいことも考えられる。このようなリスクに鑑み、機械学習、特に深層学習を利用した支援システム等においては、その性能を確保するために、使用方法及び目的に応じて、製造販売業者が対象疾患の検出率、偽陽性率、偽陰性率、検出に要する時間等、性能に係る値を適切に規定し、その性能が常に担保されていることを示すことが必要となる(6(3)項を参照)。
支援システム等が想定外の挙動を示した場合に、使用者に対して当該挙動を通知する仕組みも必要となる。例えば、想定外の挙動が判断可能な使用者のみに使用を許可する等で使用者側に一定の要件を求める、又は臨床での使用状況を逐次フィードバックすることで、製造販売業者側が性能検証可能となる仕組みを構築する等、支援システム等の目的に応じた適切な方策を用意することが望ましい(6(4)項を参照)。
想定外の挙動、誤判定等を完全に無くすことは極めて難しいが、そのような情報を収集し、対策を講じることができるような運用方法もあらかじめ考慮しておく必要がある。
(2) 性能変化
支援システム等においては、人工知能技術を利用することで市販後学習による診断アルゴリズムの変化を受けてその性能が向上することが期待される反面、学習の内容等によっては意図しない性能変化が生じ、当初規定していた性能を下回る可能性も否定できない。このような利点とリスクとを勘案し、支援システム等には、継続的な性能検証によるほか、学習用データの要件や学習のプロセス等を規定し、学習の品質を確保するための対応策が求められることになる。
1) 継続的な性能の検証方法
臨床使用に伴って市販後学習が行われ、性能が連続的又は相当程度高い頻度で変化する場合には、支援システム等の品質、安全性及び有効性を確保する上で、性能が変化するたびに検証する必要がある。特にその内容、プロセス管理に加え、変化した性能の検証及びその管理が重要となる。このことを踏まえ、あらかじめ市販後に生じ得る性能変化水準を臨床上許容される範囲かつ統計学的な妥当性に基づいた範囲で目的に応じて規定しておくこと等とともに、その機器に適用可能な検証方法、変化した性能が規定された範囲を逸脱した際の対策等を定めておくことが求められる(6(3)、6(4)項を参照)。また、検証に使用したデータについては、入手元を明らかにした上でその使用根拠や妥当性を示すことが求められる(6(2)2)項を参照)。
2) 性能変化に伴う品質確保
人工知能の性能向上には、その人工知能の学習方式に適した市販後学習が必須であることから、その学習方式を明確にした上で、使用した市販後学習データの詳細を示すことが求められる(6(2)2)項を参照)。
支援システム等においては、まず、一定量蓄積した臨床データを市販後学習データとして使用することで性能の変化を段階的に行う場合が考えられるが、その場合には、基本的にその性能変化のための学習及び性能検証は製造販売業者が実施することとなり、市販前に求められる要件と同様に性能変化後の品質を確保することが求められる(6(3)1)項を参照)。
一方、市販後学習により性能が連続的又は相当程度高い頻度で変化する機器の場合、製造販売業者の意図に反してその性能が低下し、臨床上許容される水準を下回る可能性がある。このような問題を防ぐために、原則、使用者はネットワークを介して支援システム等と接続する等、人工知能は製造販売業者が管理した上で、当該支援システム等の目的及びリスクを勘案した検証方法や対策を講じることが求められる(6(3)2)②項を参照)。
性能が変化した支援システム等の品質確保に係る作業は製造販売業者が実施することとするが、品質確保の目的で、使用者による市販後学習機能を有さない、誤使用や適応外使用を防止するため使用者を対象としたトレーニングを実施する、性能が下限以下となった場合の対策を使用者側の端末にも施す等、その支援システム等のリスクに応じて必要な追加対策を施すことが望ましい(6(4)項を参照)。
3) 薬事上の手続きにおける考え方
一般的には支援システム等の性能を向上させた結果、臨床上の有効性が向上する等製品の品質、有効性または安全性に影響を及ぼす場合、薬事上の手続きが必要になる場合があるが、その要求範囲は性能変化の内容及びその変化に伴うリスクを勘案した設定が必要となる。
性能向上に係るバージョンアップが新規製品となる、又はその適用に費用が発生する可能性があることから、その性能変化は対象となり得る販売後の製品全てに適用されず、同じ製品であってもバージョンの異なるものが市場に存在することになる可能性も考えられる。このような、人工知能の流通体系の特殊性を考慮しながら、バージョンアップに関するフォローアップ体制や薬事上の効率的な手続きについても検討が必要になる。
(3) 責任の所在
人工知能を利用した医療機器においては、その使用に伴う責任の所在が曖昧になることについての懸念が議論されている。特に、支援システム等においては、その目的が「診断支援」であるにもかかわらず、医師が最終診断まで委ねてしまう危険性を含んでいる。よって、支援システムの保守、設計・仕様上の不具合や故障等のトラブル対応においては、通常の医療機器と同様、製造販売業者が責任を負うことは変わらないが、支援システム等の使用目的、使用方法等を使用者に対して明らかにし、使用者に対するトレーニング等を実施する等、適正使用のために必要な方策を検討し、実施の実効性を担保する必要がある(6(4)項を参照)。なお、平成30年12月19日付け医政医発1219第1号厚生労働省医政局医事課長通知「人工知能(AI)を用いた診断、治療等の支援を行うプログラムの利用と医師法第17条の規定との関係について」において、当該プログラムを利用して診断、治療を行う主体は医師であり、医師がその最終的な判断の責任を負うことが示されていることも留意されたい。
[6.評価に際して留意すべき事項]
(1) 基本的考え方
本評価指標で対象とする支援システム等は、その特性上、通常の医療機器と異なり、原理(実装する検出・診断アルゴリズム等)や設計仕様等のみで性能を確保することが難しいことから、性能に影響する要素、効果を確認できる範囲や限界等を規定する必要がある。当該要求事項を達成するためには、医学的かつ統計学的に妥当な方法で、それらを規定し、支援システム等の性能を検証することが求められる。なお、支援システム等自体の品質、安全性及び有効性を確保するために必要となる評価は、原則として前出の「コンピュータ診断支援装置に関する評価指標」を参考に、目的に応じた性能水準を設定の上、実施することになる。
上述した内容を考慮した上で、現時点の科学水準を基に、本評価指標の対象となる支援システム等の評価において特に留意すべき点を示す。
(2) 品目の検出・診断の原理、学習、情報セキュリティ等に関する基本的事項
1) 検出・診断の原理(アルゴリズム)
具体的にその記述が可能な検出・診断アルゴリズムにおいては、従前通り、そのアルゴリズムとプログラム概要を示すことが求められる。深層学習のように処理工程がブラックボックス化する原理を用い、承認申請時に検出・診断アルゴリズムを示すことが困難な場合には、設計開発時の検出・診断用ネットワーク構造とプログラム概要を示す必要がある。なお、技術の進展等によりブラックボックス化したネットワーク構造等の振る舞いが説明できるようになった場合には、可能な限りその情報を示すことが求められる。
2) 学習
本評価指標が対象とする支援システム等は、適切な学習データを使用した人工知能の学習によりその目的を達成するために必要となる性能を有することが求められる。よって、対象とする支援システム等の機構や規定された性能等に応じて、以下の項目例を参考にして必要な項目について内容を明確に示し、またそれらを使用した根拠及び妥当性を示す必要がある。
・ 学習アルゴリズムとプログラム概要
(教師あり、半教師あり、強化学習、自己学習、その他等を明確にすること)
・ データ(学習データ、バリデーションデータ注1)及びテストデータ注2)について、以下を参考に必要な項目を明記すること)
注1) バリデーションデータ:機械学習アルゴリズムのハイパーパラメータ(例:サポートベクターマシンの目的関数を決定するパラメータ、深層学習のネットワークの層数、特徴マップ数、畳み込みのフィルタサイズ、学習回数等)を決定するためのデータ
注2) テストデータ:システムの性能を評価・検証するためのデータ
画像4 (18KB)
データソース(取得及び管理方法の明確化を含む。特に、市販後に支援システム等の使用に伴い取得した画像等を市販後学習データとする場合には、対象となる患者から同意を取得する方法も含む。)
画像5 (18KB)
画像データ取得時の撮影パラメータ
画像6 (18KB)
紐付けした臨床データの種類注3)(アノテーション(例:病変等の位置やサイズ(ラベル画像も含む。)、良悪性の鑑別結果)も含む。)
画像7 (18KB)
臨床画像データ以外のデータ使用の有無注4)(Data Augmentation等の目的で作成したコンピュータシミュレーションやファントム使用による画像データ等)
画像8 (18KB)
画像データの枚数、サイズ、濃度レベル数等
画像9 (18KB)
学習前に加工(例:匿名化)している場合にはその処理方法
画像10 (18KB)
臨床データの最終判断を行った医師等
画像11 (18KB)
臨床データ以外のデータを使用した場合は、その最終判断を行った責任者等
画像12 (18KB)
テストデータを学習のプロセスから完全に切り離して管理するための方策
注3) これまでの医用画像診断支援システムは医用画像のみを用い、臨床的信頼度が高いアノテーションを用いて設計することがほとんどであった。しかし、技術の進歩により、近年では、学習データとして自然画像や人工画像、さらには紐づけされた臨床情報の信頼性が低いデータ(Weak labelデータ)を用いることが可能となってきたが、このようなデータを利用する場合は、その使用根拠及び妥当性を示す必要がある。また、テストデータに関する各種留意点に関しては、その評価段階に応じて6(3)項を参照すること。
注4) 特に転移学習の場合には、自然画像や別の医用画像、さらには人工画像等を学習データとして用いることが想定される。自然画像を用いた場合には画像中の対象部分、種類及び枚数等、別の医用画像を用いた場合には通常の医用画像を使用した場合と同等の事項、人工画像の場合にはその作成方法等について、その詳細を示すこと。
学習において使用する画像等をデータベース等から入手して使用する場合は、その妥当性を確認することが求められる。以下に、データベース等に関して承認申請時に記載が必要と考えられる点を例示する。なお、記載すべき項目は、データベースごとに異なるため、適切に選択、追加すること。
・ データベース運営者(学会、認定匿名加工医療情報作成業者等)の概要、組織体制等
・ 運営者が所有する事業計画書
・ 運営者が外部に委託している業務内容
・ データベースに保有するデータの種類
・ データベースの概要及び設計書
・ データ管理に係る各種手順書とその運用状況 等
上記の学習にかかわる全ての項目については、設計開発時の学習と市販後学習で共通の項目、相違する項目を区別して明記する必要がある。例えば、設計開発時の学習と市販後学習で学習アルゴリズムが異なる場合は、それぞれについて明らかにする必要がある。また、市販後学習により機械学習アルゴリズムのハイパーパラメータも再決定される場合は、変化しうる範囲をあらかじめ規定したうえで、そのハイパーパラメータの変化が規定範囲内となることを明らかにすることが求められる。さらに,市販後学習後のネットワークの変遷については性能変化ごとに必要な記録を保存し、後日検証可能な状態にすることが必要となる。
3) 使用環境及び情報セキュリティ
人工知能技術の利用において、その人工知能が使用者のコンピュータ上にあるのか又はネットワークを介して接続しているのかを明確にした上で、次の項目を示すことが求められる。
・ 画像撮影装置からのデータ転送方法
・ 使用に必要なソフトウェアのインストール等による画像撮影装置又はその他のソフトウェアへの干渉
・ 支援システム等がインターネット等外部機器と接続されている場合、平成27年4月28日付け薬食機参発0428第1号・薬食安発0428第1号厚生労働省大臣官房参事官(医療機器・再生医療等製品審査管理担当)、厚生労働省医薬食品局安全対策課長連名通知「医療機器におけるサイバーセキュリティの確保について」を参考にサイバーセキュリティ対策に必要な措置を講じていること
・ 支援システム等を使用して得られた臨床情報を市販後学習データとする場合は、以下のガイダンス等を参考に適切な管理を行い個人情報の保護に留意すること
画像13 (18KB)
「医療・介護関係事業者における個人情報の適切な取り扱いのためのガイダンス」平成29年4月14日、個人情報保護委員会、厚生労働省
画像14 (18KB)
「医療情報システムの安全管理に関するガイドライン第5版」平成29年5月、厚生労働省
注) 必要に応じて、個人情報保護法及び次世代医療基盤法も参考にすること
4) 併用する画像撮影装置等の条件
支援システム等が所定の機能を達成するにあたっては、あらかじめ併用する画像撮影装置で得られた医用画像データのフォーマットや解像度等が当該システム等の要求を満たす必要がある。また、市販されている特定の画像撮影装置全てに適用することが可能なものであっても、支援システム等の性能は、人工知能の学習に使用する医用画像データの撮像条件や教師データの作成方法等に影響されるため、必要に応じてそれらについて規定する必要がある。
(3) 安全性、品質及び性能評価
1) 承認申請時
支援システム等の評価においては、対象となる機器の目的やリスクに応じた評価が必要なため、品質、安全性及び有効性の評価に必要な規格値(検出率等)を明確にするとともに、その妥当性を示した上で適切な評価を行うことが必要である。
各種評価においては、6(2)項に記載した項目以外に支援システム等に特有の問題として、
・ 接続する画像撮影装置の機能(特に既存の画像撮影装置を利用可能なシステムの場合)
・ 責任者を含めた性能検証方法の明確化(治験による性能検証の場合は、「正解」となる最終的な確定診断を得るまでのプロトコール、後向き検証の場合は検証用テストデータに関して、その妥当性を示すために必要な情報を示すことが求められる)
・ 性能検証に使用したテストデータの種類、入手元及び妥当性(必要に応じて管理方法等も明らかにすること)
・ 市販後に生じ得る性能変化の範囲の規定(検出率の下限、偽陽性率及び偽陰性率の上限設定等)及びその規定根拠となる医学的又は統計学的データ等
・ 市販後に性能変化が発生しても、有効性及び安全性が確保されていることを確認するための方策(学習させるデータの入手方法、変化後の性能の検証方法等)
・ 性能変化に伴って生じ得る不具合
等、その目的に応じて考慮すべき項目を明確にする必要がある。
特に、性能検証用のテストデータセットは、学習データやバリデーションデータとは重複しないことが求められる一方、対象とする母集団の特徴を考慮して、十分な説明が可能となる質と量のデータが必要となる。しかしながら、機械学習の方法、目的及び対象に応じてその必要数は異なり一律に定義することは困難であるため、支援システム等の性能評価に使用したデータセット及び方法論を記載するとともにその妥当性検証スキーム等を個別に記載することが求められる。
2) 市販後
市販後、支援システム等に発生する性能変化に関しては、承認申請時に規定された性能検証方法に従い、市販後学習データにより変化した性能等が臨床上又は統計学的な観点からあらかじめ規定された範囲内を満たし、品質が確保できることを確認の上、その妥当性検証を行うことが求められる。
支援システム等を既存の画像撮影装置に接続して使用する場合、画像撮影装置の性能に依存して入手できる画像データの質が多様となることが想定される。この場合には、得られた画像データが学習データとして使用できる条件を規定する必要があり、その条件を満たさないデータは学習データとしないための対策が必要となる。また、性能検証及びそのために用いるテストデータセットに関する考え方は、基本的に前項と変わらない。加えて、市販後学習データ及びテストデータの臨床最終判断を行った医師等を明確にする必要がある点も、前項と変わらない。
なお、人工知能にネットワークを介して接続する支援システム等において、使用者に必要な性能及び動作の詳細を漏れなく把握できるよう、性能変化が生じた際には使用者にその旨を通知するシステムを有することが望ましい。
以下に、性能変化の実現方法ごとに必要となる留意点を示す。
① バージョンアップごとの段階的な性能変化を意図する場合
製造販売業者が臨床現場で入手したデータ等を定期的に収集し、データの偏り等にも配慮しながら適切な形で人工知能に市販後学習させることにより支援システム等の性能を変化させる場合がこれに該当する。なお、臨床現場で入手したデータ以外を利用することも想定されることから、それらの利用においては承認申請時に明記するとともにその妥当性を示すことが求められる。
この場合、変化した性能の評価や、その変化に伴う安全性及び品質の確保は製造販売業者によってバージョンアップごとに行うこととなるが、それらの評価にあたっては承認申請時と同様に前出の「コンピュータ診断支援装置に関する評価指標」を参考に行うこと。
また、支援システム等の性能変化において必要となる薬事上の手続きについては、システムの特性にも依存するため、想定可能な範囲については独立行政法人医薬品医療機器総合機構と承認申請前に相談して決定しておくことが望ましい。
② 臨床使用に伴った市販後学習により連続的又は相当程度高い頻度でのバージョンアップを意図する場合
支援システム等を臨床現場で使用した際に入手したデータを市販後学習データとして使用し、連続的又は相当程度高い頻度で性能を変化させる場合には、使用する人工知能は製造販売業者が一括して管理し、各支援システム等とネットワークを介して接続していることが想定される。この場合、自動的に追加されたデータを用いた市販後学習により変化した支援システム等の性能や品質があらかじめ規定された範囲に収まることが特に求められることから、その学習プロセス及びその管理方法を示すことが求められる。加えて、性能が規定範囲に収まることを検証するための機構をあらかじめ付与するとともに、製造販売業者で定期的にその性能検証を実施することが求められる。なお、当該バージョンアップの場合には、想定外の挙動、誤判定等の問題が生じる可能性が高いため、その解決策(リスクマネジメント)を講じておくことが求められる。
(4) リスクマネジメント
1) 基本的考え方
支援システム等におけるリスクとしては、市販後学習の結果性能が変化し「人工知能が規定された変化範囲を逸脱した結果、誤った情報を提示すること」が挙げられる。バージョンアップごとの段階的な性能変化を意図する支援システム等の場合には、その性能変化によって生じた問題は製造販売業者が解決してから上市することが前提となるため、そのリスクは低い。一方、市販後学習による性能変化が直ちに実装されることで性能が連続的又は相当程度高い頻度で変化する支援システム等の場合には、上記リスクが生じる可能性があるため、そのリスクを回避するためのシステムが必要となる。
また、上記リスクに加え、適応外で使用した際には、使用者が支援システム等における想定外の挙動に気付かない可能性も増大することが考えられるため、適応外使用を防ぐ方法を講じることが求められる。
2) 対策について
対策が必要となる支援システム等には、上記リスクを軽減するために、
・ 市販後学習データとする画像に関する詳細なログ(使用環境、診断結果、責任者等)を保存するための機能(6(2)を参照)
・ 支援システム等の内部データを利用した自己テスト等により、定期的に性能評価を行い、その時点での性能を使用者に示すことで最低限の性能を確保・確認できる機能
・ 上記機能により上記リスクが発生していることが確認された場合に、人工知能を市販時の状態に初期化又は変化直前の状態へと復元する機能
・ 上記リスク発生時に、必要に応じて、支援システム等を停止させる機能
・ 臨床での使用状況を逐次フィードバックして製造販売業者がその性能を適宜検証可能となる機能