第8回 匿名医療情報等の提供に関する専門委員会 議事録

保険局医療介護連携政策課保険データ企画室

日 時

2021年12月8日(水) 13:00~17:00

場 所

Web

出席者

【専門委員】
・宇佐美 伸治(日本歯科医師会 常務理事)
・鹿野 真弓(東京理科大学薬学部 教授)
・嵩 さやか(東北大学大学院法学研究科 教授)
・田尻 泰典(日本薬剤師会 副会長)
・田中 純子(広島大学 大学院医系科学研究科 疫学・疾病制御学 教授)
・東宮 秀夫(一般財団法人 医薬品医療機器レギュラトリーサイエンス財団 研修事業本部長)
・長島 公之(日本医師会 常任理事)
・中島 誠(全国健康保険協会 理事、代理:矢崎 和彦)
・中野 壮陛(公益財団法人医療機器センター 専務理事)
・中野 惠(健康保険組合連合会 参与)
・堀 真奈美(東海大学健康学部長 兼 健康マネジメント学科 教授)
・松田 晋哉(産業医科大学公衆衛生学 教授)
・宮島 香澄(日本テレビ報道局 解説委員)
・山本 隆一(一般財団法人医療情報システム開発センター 理事長)

議 題

  1. 1. 匿名診療等関連情報(DPCデータ)の個票情報の提供、NDB・介護DBとの連結について
  2. 2. 医療・介護データ等の解析基盤(HIC)開発の進捗
  3. 3. 個別審査(非公開)

議 事

※非公開部分を含みます。
山本委員長  それでは、定刻になりましたので、ただいまより第8回「匿名医療情報等の提供に関する専門委員会」を開催いたします。
委員の皆様におかれましては、御多忙の折、御参加いただきましてありがとうございます。
委員の出欠状況について、事務局から報告をお願いいたします。
牧戸室長補佐  医療介護連携政策課の牧戸でございます。
本日は御参加いただき、誠にありがとうございます。
今回は専門委員の皆様全てがウェブ参加となります。
中島委員の参考人として、矢崎参考人が代理出席となります。
齋藤委員は欠席となります。
なお、運営規程に基づいた開催要件を満たしておりますことを併せて御報告いたします。
続きまして、事務局に人事異動がございまして、この場をお借りして御紹介させていただきます。
令和3年10月4日に着任いたしました、医療介護連携政策課課長、水谷忠由です。
本日は前の会議がございまして、できれば後ほど御挨拶させていただこうかなと思います。
山本委員長  ありがとうございました。
それでは、会議の開催要件を満たしていることですので、早速ですが、本日の議事に入らせていただきます。
会議冒頭のカメラ撮りはここまでとさせていただきます。
それでは、議題の1番目、「匿名診療等関連情報(DPCデータ)の個票情報の提供、NDB・介護DBとの連結について」ということで、資料1の説明をお願いいたします。
金光課長補佐  保険局医療課でございます。
資料1で御説明をさしあげます。
1ページ目に、「これまでの議論等について」から始まる4つのメニューで今回御用意をしてございます。
2ページでございます。匿名診療等関連情報(DPCデータ)の収集・第三者提供について、上の青枠のところでまとめておりますが、収集、第三者への提供、情報との連結ということの現在の定めをまとめているものであります。
他の情報との連結につきましては、令和4年4月1日より施行ということで、厚生労働大臣は、収集したデータを提供する場合は、NDBや介護DBの情報と連結して利用することができる状態で提供することができるとなってございます。
3ページでございますが、第三者提供の流れについて、令和2年10月1日に改正健保法が施行されて、同日以降の第三者提供の流れはここでお示しをしているような形となってございます。3か月に1回の頻度で専門委員会を開催し、提供申出の審査のほか、ガイドラインの検討等が実施されているところでございます。
4ページでございますが、9月16日の第7回の専門委員会の中で、令和4年4月に連結規定が施行されるのに先立って、この青い色で書いてあるところの観点を踏まえさせていただくということで整理をいたしました。
1つ目、DPCデータが集計表情報のみを提供対象としてきた経緯や、上記の整理がなされた平成26年当時と現在との違いを、3つバーで書いておりますが、こういったことを踏まえて、以下の事項を御議論いただいて御了承いただいたものと承知してございます。
1つ目が、ガイドラインの改正等について検討することにより、個票情報の提供を可能とすることができるのではないか。2つ目が、ガイドラインを改正する場合には、令和4年4月以降、NDBや介護DBとの連結解析が可能となることを踏まえ、既に連結解析の規定が施行されているNDBや介護DBを参考に、連結解析に係る事項も含めることが考えられるのではないか。こういったことでいただきました。
本日、この2点については、後の資料で説明させていただこうと思っております。
その際いただいた御意見といたしまして、個人同定リスクを評価し、それに対する必要な対応策を提示してほしい。一つ一つの審査が重要になることから、審査がより確実あるいは迅速に行えるような環境整備をお願いしたい。提供が始まり、知見が蓄積された際に、総括を行い、必要が生じればガイドラインの見直しを行う必要があるのではないか。DPCデータは、様式1において詳細な診療情報というものを含んでおりますことから、公表基準についても議論が必要ではないか。
こういった点も御意見としていただきましたので、対応として盛り込みながら、以降の資料の御説明をさせていただければと思います。
5ページ、「個票情報の提供について」ということであります。
6ページは、先日の第7回専門委員会の中でもお示しいたしました、DPCデータの個票情報の提供をする際に、研究テーマの広がりや研究結果の精度の向上について期待できる内容をまとめたものでございます。
7ページでは、DPC導入の影響評価に係る調査、いわゆるDPCデータの中に包含されているデータについて、各種の様式とともにまとめているものであります。
8ページでございます。様式1、患者属性や病態等の情報には一体どういうものが含まれているのかということで構造化してお示ししております。キー情報、それから、調査項目の例といたしまして、全ての患者に関する項目。それだけではなくて、急性期の病棟や特定の疾患等に関する項目として、例えばがんの初発か再発か、TNM分類、肺炎の重症度分類、NYHA心機能分類、手術情報や、回復期、慢性期や精神病等に関する項目といたしまして、要介護度、要介護情報、FIM、入院時のGAF尺度といったところを取りまとめて、収集をしておるものでございます。
9ページでございます。DPCデータは匿名のデータベースでありますが、8ページにお示ししたような情報というのが機微に触れて多く入っておりますことから、ここにも書いてございますとおり、個票情報の提供を受けた利用者が照合することによって個人が特定される可能性は否定できないということで、平成26年の際に、研究班からの報告で、DPCデータの第三者提供に当たって、特定可能性の観点から留意すべき個別事項、共通事項が示されているとしてございます。
こちらは下にまとめておりますとおり、患者、医療機関、保険者、医師個人というところについて、例えば留意すべき個別事項、留意すべき共通事項と表にしてございますが、こういった内容をより慎重に見なければいけないのではないかと整理をし、当時には、これらについてオープンにしないというようなことで議論を進めておったというところかと思います。
10ページにお進めください。こういった観点を含めて、現在の取扱いとNDBでの取扱い、それから、このDPCデータの今後の取扱いということで、対照表をつくってまとめさせていただいているものでございます。
赤い枠で囲っておるところが、今後の取扱いとしております。その左側に現在集計表情報として提供している際の取扱い、右のほうではNDBの取扱いを入れてございます。上からいくと、患者情報については、例えば生年月日に関しては、現行、集計表情報では年齢に変換しております。今後は生年月への変換や、年齢への変換等を行うということで考えてございます。
患者居住情報については、現行、集計表情報では二次医療圏単位以上に変換した上で集計をしてございます。今後の取扱いも、これまでと同じく二次医療圏単位以上への変換とさせていただければと思っております。
データ識別番号については提供実績はございませんので、専門委員会が特に認める場合を除いて、原則として提供対象外とさせていただければと考えてございます。
医療機関情報の施設コードについては、これまで集計表情報においては、専門委員会が特に認める場合を除き、原則として提供対象外としてございました。NDBのほうを御覧いただくと、専門家が特に認める場合を除き原則として提供対象外というところは同一でございますが、提供申出に応じて医療機関が特定できない形(匿名化)をして提供するという運用もされておることから、今後の取扱いという赤枠の中では、専門委員会が特に認める場合を除き、原則として提供対象外ということは同一ながら、NDBにおける取扱いを参考に、提供申出に応じて匿名化長上で提供するということで考えてございます。
保険者番号については、これまでの取扱い、NDBも同一でございますので、専門委員会が特に認める場合を除き、原則として提供対象外と考えております。
医師コードも同様でございます。
共通事項として、希少な疾患、希少な手術・処置等、報道等で患者情報が周知された症例といったことがあるものでございますから、集計表情報の場合には集計した上で提供としておりましたが、今後の取扱いの中では、特異な記述に該当する可能性も踏まえ、専門委員会において個別審査をするということで整理をさせていただければと考えてございます。
11ページでございますが、NDB収載・提供情報の拡大に伴う対応についてということで、NDBにおいては、収載・提供情報の拡大に伴って、専門委員会における個別審査をさらに強化するということで対応してきたというものを資料として掲載してございます。
こういったことも踏まえ、12ページになりますが、DPCデータは、各種の規制に加えて、専門委員会における個別審査、こちらは冒頭の資料でも御説明をさしあげましたとおり、審査機能というものの拡充、強化を図るべしという御意見がございましたので、12ページにまとめておりますとおり、事前審査、事後規制、それから、追加的なもの。この追加的なものについては、事前規制をさらに実行性を高めるという位置づけで整理をしておるものでございますが、ここにマル1、マル2、マル3と書いてございます。
例えば追加事項のマル1で言えば、データの必要性を把握しやすくし、審査を確実に行えるよう、提供申出所と提供申出書サマリを見直して、厚労省・専門委員会における審査を強化するというものであります。
マル2倫理審査委員会の承認に関する書面について、個票情報の提供申出の際には、提出を必須化するということでさせていただければと思っております。
また、マル3必要に応じ、成果物を専門委員会の構成員に確認いただく。既にガイドライン上の規定はあるものでございますが、こういった取扱いを定めさせていただければと考えてございます。
13ページは、やや細かいですが、提供申出書の見直しということで、現行の左側の提供申出書の中に書いていることについて、より具体的に分かりやすく示させていただいて、研究者から申出をいただく際に、ディテールについてきちんといただけるように工夫をしたいと思ってございます。
また、中段でございますが、提供データはこれまで集計表情報だけでしたので、ここで集計表情報か特別抽出をするのかということがきちんと選択できるように明記をさせていただくことかと思っております。
14ページは、提供申出サマリの見直しについてというものでございます。先ほどの提供申出書に類するような形で、こちらも整理をさせていただいております。研究の概要や匿名診療等関連情報の利用目的といったところについて、より具体に分かるように整えさせていただいております。
15ページは、現行の提供申出サマリに含まれる研究対象データについての部分、先ほども御紹介をさしあげましたが、右側のところを御覧いただくと、4ポツと5ポツで患者居住地や医師コードというものがございますので、これが必要となるような背景情報についてきちんと収集できるようにさせていただくものであります。
16ページ以降、実際の提供申出サマリの例もつけてございますので、適宜御参照いただければと思います。
続いて、21ページになります。個票提供に伴うガイドラインの改正についてということでございます。現在のガイドラインの項目として整えているものを表形式でお示ししております。個票情報の提供を開始することに伴って、用語の追加や原則として提供しない項目の追加など、必要な改正を行うということで考えてございます。
第3の項で盛り込んでございます「匿名診療等関連情報の取扱い」というのは、集計表情報の取扱いについて記載された項目であったということから、「集計表情報の取扱い」に名称を変更して、位置を見直すということで考えてございます。
続いて、22ページから「NDB・介護DBとの連結解析について」であります。
23ページは改正健保法の内容をまとめております。
24ページには、NDB、介護DBの連結解析等ということで既存の資料を入れております。
また、25ページでございますが、NDB、介護DB、DPCデータベースについての概要を入れてございます。
26ページでありますが、DPCデータベースとほかのデータベースの連結解析について、現行では、このDPCデータの内容の中に含まれるKファイルにおいて、生年月日、カナ氏名、性別から生成した一次共通IDというものを格納するような形になってございます。これに基づいてNDB・介護DBと連結できるようにしているものであります。
27ページ、これも9月の際にお出しさせていただきましたが、NDB・介護DBとの連結解析によって、DPCデータに含まれる入院時の患者情報だけではなくて、外来や介護の状況まで含めた研究の実施が可能となるということで入れさせていただいております。
28ページでございます。匿名レセプト情報等の提供に関するガイドラインには、介護DBの情報と連結しているようできる状態で提供する場合の手続についての項目というのが含まれておるものでございます。この第18というところであります。
したがいまして、29ページにお進みいただければと思いますが、匿名診療等関連情報の提供に関するガイドラインにおいても、匿名レセプト情報・匿名特定健診等情報の提供に関するガイドライン、匿名介護情報等の提供に関するガイドラインと同様に、NDBや介護DBと連結して利用することができる状態で提供できる場合の手続についての項目を新設することとしてはどうかと考えております。記載内容を下に書いてございますが、同様の取扱いとしてはどうかと考えているところでございます。
続きまして30ページ、最後に「連結精度の向上に向けた取組について」でございます。
31ページ以降、連結精度の向上に向けて、これまで各種の委員会や検討会において議論がなされてきたことについて、やや時系列的にまとめております。
31ページについては、平成30年8月の医療等分野情報連携基盤検討会の取りまとめの中で、被保険者番号を医療等分野における識別子の一つとして活用することが現実的であるですとか、医療情報等の共有・収集・連結を行う者が、必要に応じて履歴管理提供主体から被保険者番号履歴の提供を受けることができる仕組みの整備を目指すことが適当とまとめられておったというところの御紹介。
32ページは、平成30年11月の取りまとめでございますが、DPCデータベースについても、連結解析に対する認識が期待される利用性が認められることから、データベースの課題を解決した上で、連結解析に向けた検討を進めるべきとした上で、この検討を進めるに当たっては、連結解析のための識別子等の技術的な対応について検討を進めるべきであるとされておったものでございます。
33ページ、令和元年10月の検討会の取りまとめでございますが、公的データベースから被保険者番号の履歴の照会を受け、同一人物性について回答を行うシステムの活用ということで議論が行われました。DPCデータベースでこのシステムを活用するかどうかは、所管部局や関係審議会等で検討することとされておったものでございます。
したがいまして、34ページでございますが、今般、この委員会で御議論いただいて、1つ目の○でございますけれども、DPCデータにおいても連結精度の向上に向けた取組を進めることが必要となることから、NDB・介護DBと連結解析する際に個人単位化された被保険者番号を用いること、個人単位化された被保険者番号の履歴の照会のために、履歴照会・回答システムを活用することとしてはどうかと考えてございます。
現在のDPCデータに被保険者番号は含まれてございません。今後、仮にDPCデータにおいて被保険者番号の収集を行う場合、DPCデータベースは匿名のデータベースとして運用してございますので、ハッシュ化して匿名化した状態の被保険番号を格納するということを考えてございます。
これが下のフロー図でいうとマル4になります。それの根元である病院からDPC調査事務局に対して御提出いただくデータというところについて被保険者番号を含めていただく必要があるものでございますが、ここについては、今般、この委員会で被保険者番号を使って連結解析というところについて御了解をいただきますれば、中央社会保険医療協議会のほうで実際にDPCデータの中に被保険者番号を含めるということの御了解を得ようと考えてございまして、両検討会、委員会の場での御決定をもって、連結解析が被保険者間で行えるということに進んでいくものと考えてございます。
35ページはDPCデータベースのスケジュールということでまとめております。
少し長くなってしまいました。事務局、私からの説明は以上でございます。
山本委員長  ありがとうございました。
それでは、議題1について議論を行いたいと思います。御意見がございます方は挙手ボタンを押していただくようにお願いいたします。
長島先生、どうぞ。
長島委員  長島です。
まず、2番の個票情報の提供につきましては、前回の会議で私が要望したことにほぼ全面的に対応していただけたということで、感謝いたします。
このような形で進めていくということには特に異論はございませんけれども、実際の審査が始まったときに、一つの審査において、この新しく改定された内容で十分か、何か問題点はないかということをしっかり確認しながら、問題点があれば随時しっかりと対応するという形で進めていただければと希望いたします。
3番の連結解析については特に異論はありません。現状、別々に行うことでいろいろ不便な点もあるかと思いますので、そこが改善されればいいかなと期待しております。
4つ目の連結精度向上で、個人単位化された被保険者番号をハッシュ化して使うということにも特に異論はございませんが、今後は例えばこれを地域医療連携あるいは次世代医療基盤法などにおける個人のひもづけというような、日本医師会が以前から言っている医療等IDのほうに発展させていくということが可能なのか。もしくは、ぜひそのような形でこれを基盤として発展させていただければありがたいと思います。
以上でございます。
山本委員長  ありがとうございます。
ほかに御意見、御質問はございますか。
あるいは事務局から御回答はございますでしょうか。
金光課長補佐  保険局医療課でございます。
特にございません。ありがとうございます。
山本委員長  ほかはいかがでしょうか。
私から、若干技術的な話になるのですけれども、34ページ目のスライド、最後の連結精度向上に関するところで、被保険者番号が入った情報をDPC調査事務局に送られて、これは今回の専門委員会でこれをよしとするならばの話ですが、ここで支払基金の履歴照会システムに問い合わせて、何らかの情報が返ってきて、そのデータをハッシュ化して格納するというふうに見えますけれども、それでよろしいのですよね。
金光課長補佐  おっしゃるとおりでございます。
山本委員長  そうだとすると、実はこの被保険者番号を医療分野の名寄せに使うという会議にも参加していたのですけれども、そのとき、やはりいろいろなデータベースを連結するとそれなりにリスクが高くなってくるということで、想定していた仕組みというのは、2つのデータベースで突合しなければならない被保険者番号を履歴照会システムに送って、共通の新たな識別番号として返してくる。その共通の識別番号が同じであれば同一人物であるということを判断する仕組みになっていたのです。だから、基本的にはその考え方ですかね。ですから、支払基金から返ってくる、恐らく概念的には最初の被保険者番号が返ってくるようになると思うのです。その最初に登録された被保険者番号をハッシュ化するということで、それが単独では識別できない形で同一人かどうかを判定できるというような趣旨で書かれているということでよろしゅうございますか。
金光課長補佐
 先生がおっしゃるとおりで結構かと思います。
山本委員長  やむを得ないと思いますけれども、本来は突合する研究プロジェクトごとに異なる番号にしておいたほうが安心だと。つまり、同じ値が二度と使われないというふうにしておくと、不用意な突合がされないということで、もともと考えたシステムは一回の問合せごとに違う系列の番号が返るという仕組みだったのです。ですから、このDPCデータに格納されるハッシュの取扱いというのは若干注意を要するということだろうと思います。これは今後の検討だと思いますけれども、そういう点に少し注意して進めるべきかなと思います。
明神主査  保険局医療介護連携政策課でございます。
当課からも補足させていただきますと、DPCデータベースには確かに唯一のものが既に入っております。第三者提供をされる際は、NDBと同じように、提供申出ごとに再ハッシュして異なるIDをそれぞれ提供するという仕組みはつくっておりますが、山本先生の御指摘はそちらとは違うということでしょうか。
山本委員長  いえ、基本的にはそれでオーケーです。つまりNDB及びDPCデータの管理が厳格に行われるという前提でということですよね。
同じシリアル番号を使ってしまうと、違う研究プロジェクト同士で突合できるという可能性が出てくるのでという意味ですから、例えば今NDB介護・DB等で行われているものには提供プロジェクトごとに違うIDが振られるということですよね。ですから、提供先では問題はないと思います。
明神主査  ありがとうございます。
山本委員長  長島先生、どうぞ。
長島委員  今、山本先生が御指摘されたように、この場面だけではなくて、ほかの様々な場面でもこれがひもづけにきちんと安全に活用できるような仕組みというのが重要かと思います。ただ、それはこのNDBの場で議論することではないと思いますけれども、そこのところはきちんと国の基盤として、これをよいきっかけとしてぜひ国として進めていただきたいと希望します。
以上です。
山本委員長  ありがとうございます。
それでは、鹿野先生、どうぞ。
鹿野委員  御説明ありがとうございました。
今の山本先生の御指摘とも関係するのですけれども、大体大きなデータベースを統合して連結なり何なりで情報を整理しようとすると、正確なデータが出てこないということはよくあるかと思います。
35ページのスケジュールを拝見すると、現在、真ん中のDPC調査事務局のところの技術的な精査、システム改修という黒矢印のところで作業されていると思いますけれども、ぜひ正確なデータがきちんと得られることを優先していただきたいなと思います。誤ったデータを基にいろいろ議論をされてしまうと、有効な手立てが打てなくなってしまいますので、半年以上の期間を取られているので大丈夫だとは思いますけれども、もしそのようなリスクがあるようでしたら、ぜひ注意をしていただきたいと思います。
以上です。
山本委員長  ありがとうございます。
引き続いて、堀先生、お願いいたします。
堀委員  異論はないのですが、質問です。16ページで審査会での確認事項というものがあると思うのですが、匿名診療等関連情報の直接の利用目的が「国民保健の向上に資するかどうかを確認」という記述があります。資料はあくまで参考として出されているのだと思うのですけれども、我々のところで今まで審査してきたものを見ますと、研究計画における研究目的、使用目的とデータが合致しているか、政策に貢献するかどうかなどを見てきたと思いますが、この国民保健の向上に資するというのは具体的にはどのような趣旨で使われているのか、教えていただけますでしょうか。
それから、本日、参考資料でついていたガイドラインですけれども、そちらの見直しと今回のこの議題のものの関係性がもしあれば教えていただけますでしょうか。
山本委員長  ありがとうございます。
事務局のほうから答えはありますでしょうか。
金光課長補佐
 保険局医療課でございます。
1点目についてでございますが、37ページに今回資料をおつけしております健康保険法を御覧いただきますと、第150条の2、国民保健の向上のための匿名診療等関連情報の利用又は提供という項目の中で記載をしてございます。この条文の上から5行目で「匿名診療等関連情報の提供を受けて行うことについて相当の公益性を有すると認められる業務として」と書かれていますので、こういった観点というのはDPCデータの使用においては必要なことだろうと思います。
参考資料でつけさせていただいておりますガイドラインについては、このDPCデータの提供に関するガイドラインということですので、今日御紹介をさしあげた議題の中で、個票情報の提供、NDB・介護DBとの連結解析、これらをまとめ込む形で改正するのであれば、こういった新旧になるということでつけておるものでございます。
堀委員  ありがとうございます。法文にあるから記載したということで理解いたしました。
具体的にそれはどういうものかという解釈は委員会の中で検討、議論しながらという理解でよろしいでしょうか。
金光課長補佐
 おっしゃるとおりです。
堀委員  それから、参考資料1のガイドラインで、誤字脱字とかではないと思うのですけれども、5ページ目に「ただし」という表現が2度あるので、少し読みづらいなと。新旧の新のところにありましたので、後で御確認いただければと思います。5ページの6(4)マル7の3行目あたりです。
以上です。
金光課長補佐
 承知いたしました。御指摘ありがとうございます。精査いたします。
堀委員  以上です。
山本委員長  ありがとうございます。
 NDBも同じように相当の公益性を確認することにはなっております。ですから、研究者の要望に応じていますけれども、その研究が今回から法令に基づいて提供されますので、民間事業者にも行くわけですよね。そういった場合に、それなりの公益性がないとお認めできないというのが今までどおりで、これはNDBも介護総合データベースも同じような基準で行っております。それとあまり変わらないというふうにお考えいただければいいと思います。
 ほかにいかがでしょうか。
 鹿野委員の御発言は非常に重要で、NDBとか介護の場合はDPC関連情報に比べると精度が比較的低いと言うと変ですけれども、項目がそれほど多くないわけですから、例えば地域の中でまとめるというときにそれほど大きな誤差が出ないということで、カタカナ氏名と生年月日ということで突合を許してきたわけですけれども、DPC関連ファイルで見ますと相当詳細なデータが入ってきて、多分分析の精度がもっと上がってくる。その場合に間違ったひもづけが行われると、相当程度影響が出る可能性があるので、今、当面はID4でやるということに先ほどの御発表でなったのですけれども、精度の向上はできるだけ急いでいただいて、確実に同じ人が結びつけられる状態で提供することが望まれると思いますので、よろしくお願いいたします。
 ほかはよろしゅうございますでしょうか。
 それでは、そのような形で進めていただくようにお願いいたします。
 続きまして、議題2「医療・介護データ等の解析基盤(HIC)開発の進捗」について、資料2の説明をお願いいたします。
水谷課長  保険局医療介護連携政策課長でございます。
資料2「医療・介護データ等の解析基盤(HIC)開発の進捗」という資料を御覧いただけますでしょうか。
2ページ目をお開きいただきますと、「医療・介護等の解析基盤(HIC)の開発」というスライドでございますが、皆様よく御案内かと存じますが、左側、現在のNDBでございますが、関東地区、関西地区と物理的にこうした形のものがあって、オンサイトリサーチセンターからユーザー端末でアクセスする。それから、情報を提供するときには、こうした電磁的な記録媒体で解析研究者の端末に行くということでございまして、そうしますと、下のところでございますが、データ抽出等の作業増大への対応にシステム処理を行う機器の増設が必要になるですとか、仮に災害等でシステム障害が発生した場合、システムが復旧するまで作業が滞るといった問題があるわけでございます。
右のほうを御覧いただきますと、現在、クラウド化に向けて準備を進めてございます。クラウド化した上で、その下のところに医療・介護データ等の解析基盤(HIC)、Healthcare Intelligence Cloudとございますが、オンサイトリサーチセンターのユーザー端末からNDBのオンサイトで抽出・解析できる環境ですとか、あるいはHIC解析環境と書いていますが、NDB、あるいは図には出てきませんが介護DBといったもののデータをこのHIC解析環境で整えることによって、解析研究者の端末からアクセスできるようにする。そうしたことを想定しているわけでございます。こうしますと、クラウド化に伴い、データ量や処理量に合わせて最適な処理能力の増減を行うことができるですとか、国内ではございますが、複数拠点でシステムが稼動しているということでございますので、仮に災害等が起きた場合でも被害のないサーバーを利用して迅速な対応が可能となるということでございます。
こうしたコンセプトで開発を進めているものでございますが、3ページにお進みいただきます。
HICの機能として予定しているものでございます。
大きく3つの機能がございますが、1つ目、ポータル機能でございます。全ての研究者を対象といたしまして、NDB・介護DB等の提供申出、利用、終了に至る一連の手続を電子化されたポータルサイトで行うというものでございます。同時に、データベース研究をしたことのない研究者等に向けて、教育・啓発のためのコンテンツの形成や各種マスターの共有等を行うことを想定してございます。
2つ目が探索的利用環境でございます。これは主にNDB・介護DB等を利用したことのない研究者を対象として想定しているものでございます。そうした方がダミーデータを用いて探索・試行的に分析するための環境を提供するというものでございます。このダミーデータをどういった仕様にするかということについては、今後検討してまいりたいと考えてございます。
3つ目が先ほど申し上げたHICの解析環境でございます。これは、これまでの研究と同様に、専門委員会の審査において承諾された提供申出ごとに利用者に対して解析環境を提供するということになろうかと存じます。今後、この安全管理措置を含め、HIC解析環境の利用については、ガイドラインをきちんと整備していく必要があると考えてございます。
下には解析環境の環境要件を点線囲みで記載してございます。
4ページにお進みいただきますと、今後のスケジュールと解析環境の試行的利用(案)ということで書いてございます。
まずポータル機能でございますが、これは2023年度中の開始可能となったタイミングで運用を開始し、また、最初から100%で運用開始するわけではなく順次機能やコンテンツを拡充していく。そのための調査研究・設計・開発を来年度から進めていきたいと考えてございます。
2つ目、探索的利用環境でございますが、これも2023年度中の開始可能となったタイミングで運用を開始する。先ほど申し上げましたが、そのためのダミーデータの仕様などを検討してまいりたいと考えてございます。
最後、HICの解析環境につきましては、まず点線囲みのところを御覧いただきますと、解析環境の試行的利用といたしまして、一部のNDBや介護DBの提供申出に対して、専門委員会において個別の審査を実施していただいた上で、安全性に十分な配慮を行いながら、HIC解析環境の試行的利用を開始してはどうかと考えてございます。その際、HIC解析環境の試行利用においては、匿名レセプト情報・匿名特定健診等情報の提供に関するガイドライン、匿名介護情報等の提供に関するガイドラインにつきまして、インターネット接続に関する部分を除いて、基本的に準用することとしてはどうかと考えてございます。
インターネット接続に関する部分というのは、5ページで赤字にしておりますが、匿名レセプト情報等を複写した情報システムは、インターネット等の外部ネットワークに接続しないこと。あるいは7ページでございますが、匿名レセプト情報等の保存・利用に際しては、インターネット等の外部ネットワークに接続した情報システムを使用しないこと、こうした規定はクラウドに対してアクセスをするということではなし得ない規定ということになりますので、こうした部分を除いた形で準用する。そうした形で、まずは試行的利用を開始してはどうかというものでございます。
4ページにお戻りいただきます。
4ページの点線囲みの2つ目のポツのところを今御覧いただいておりますが、こうしたインターネット接続に関する部分を除いて基本的に準用するということで、NDBガイドライン、介護DBのガイドラインを改正する。
その上で、3つ目のポツでございますが、このNDBガイドライン、介護DBガイドラインのその他の規定について、必ずしもそのまま適用することがHICの解析環境の実情に合っていないのではないかという指摘もございます。まずは試行的に利用いただきながら、試行的利用者からの御意見を踏まえて、本格利用につきましても2023年度中の開始可能となったタイミングで順次開始することを想定してございますが、そうした本格利用に向けて、新しくHIC解析環境の利用に関するガイドラインを策定することを検討してはどうかといったことで考えてございます。
駆け足でございますが、私からの説明は以上でございます。よろしくお願いします。
山本委員長  ありがとうございました。
ただいまの御説明に関しまして、御意見、御質問がありましたらよろしくお願いいたします。
長島先生、どうぞ。
長島委員  現在、このようなクラウド化みたいなものに関して、サイバーセキュリティー上の不安というのが全体的に非常に増していると思いますので、そこでHICを使うことによって何かサイバーセキュリティー上のリスクが増大するような場面があるのか。特に利用者側の安全対策というのをしっかり担保する方法、あるいはそれは可能なのかということを教えてください。
山本委員長  一般論であれば私も多少説明できますけれども、事務局からございますでしょうか。
水谷課長  保険局の医療介護連携政策課長でございます。
説明を漏らしておりましたが、資料の9ページ、10ページにHICのセキュリティー要件というものが書いてございます。不正プログラム対策、ファイアウォール機能など、今、様々な情報セキュリティー対策について要件を設定して臨んでいるところでございます。こちらについては、政府部内で申し上げますと、デジタル庁の指導も仰ぎながらこうした要件を設定して対応しているところでございまして、サイバーセキュリティー上の不安といった御指摘についてもこうした形できちんと対応しているところでございます。
山本委員長  ありがとうございます。
それでは、ほかに。
長島委員  今の点で、HIC側はこれでできると思うのですが、利用者側もしっかりと安全対策をしていただかないといけないと思うのですが、そこのところがどのような形で担保できるのでしょうかということです。
水谷課長  保険局の医療介護連携政策課長でございます。
そうした意味で、利用者端末においてアクセスする、解析研究者の端末においてアクセスする環境におきまして、現在も5ページから7ページにかけてのガイドラインにおいて様々な安全管理措置を講じなければならない。それは、組織的安全管理措置、人的安全管理措置、物理的安全管理措置、技術的安全管理措置を含め、様々な安全管理措置を講じなければならない。こうしたことで、現在のクラウドでない環境においても解析研究者の端末における安全管理を実施しているところでございます。
先ほど申し上げた私の説明が悪くて恐縮ですが、そうしたことについて、インターネットのアクセスに関する部分を除いて全て準用する。したがって、これに全て従っていただくということで、まずはHICの試行的利用を開始することによって、解析研究者端末側での安全管理も万全を期してスタートしたい。その上で、それが今のこのクラウドにアクセスするという環境の中で必ずしも実情に合っていない部分があるとすれば、そうしたことをどのように担保できるかということをこの試行的利用者の意見を踏まえて御議論をいただき、そして、新しいガイドラインの策定につなげていきたいと考えてございます。
長島委員  試行しながら、そこのところをしっかり確認していくということで了解いたしました。
山本委員長  これはインターネットと書いていますけれども、基本的にHICに接続するのはVPN接続で、インターネットに直接露出するわけではない。したがって、研究者側の環境が、研究に参加するまでの話ですけれども、研究が開始するまでの間で、マルウェアに汚染していたりということがないことが確認できれば大丈夫だろうと思います。それを運用上確認するのか、あるいはVPN接続の際にサーバー側からその状況を確認するのか、どちらも多分手段としては可能で、基本的には予算によるのだろうと思いますけれども、それをやっていくのだろうと思います。
これは、同じような環境が米国のレセプトデータベースであるCMSのデータベースで、Virtual Research Data Centerという名前になっていますけれども、それで運用されていて、同じようなことを数年間も既に運用されていて、特段サイバー攻撃があったというようなお話は聞いていないです。
ほかにいかがでしょうか。
私からお聞きしたいのですけれども、例えば4ページの図で新しく装備される機能が3つ書かれているわけですけれども、実際に提供するときに、今はサンプリングデータセットと特別抽出とオンサイトセンターに分かれているわけです。それで、このHIC解析環境というものだけにするのですか。それとも、例えば特別抽出をして、データをそのまま提供するものも併用するのか、あるいはオンサイトセンターで言っているように、最後までHIC環境でやるのではなくて、そこである程度安全性を高めた中間ファイルをダウンロードするといいますか、提供することによって、今度は研究者の環境の中で分析することもお認めするという組合せが結構あるのだろうと思うのですけれども、それに関しては、今、事務局のほうで何かまとまったお考えはお持ちでしょうか。
明神主査  ありがとうございます。事務局、保険局医療介護連携政策課でございます。
今のところ、NDBのサンプリングデータ・集計表情報・特別抽出はいずれもHIC解析環境で御利用いただくことを想定しております。ただ、このHIC解析環境自体を使った上で、どういった利用場所で使っていただけるか。なので、物理的安全管理措置であったり、技術的であったりといった部分、利用者に求める安全管理措置をサンプリングデータだったらより緩和してもいいかなというようなことは方向性としては考えておりますが、その辺りは専門委員会の先生方の御議論を踏まえて進めていきたいと考えております。
山本委員長  ということは、HIC解析環境以外での解析は認めないということでよろしいですか。
明神主査  基本的にはHICのみでやっていただくことを想定しています。
山本委員長  分かりました。
いかがでしょうか。構成員の先生方、御意見はございますでしょうか。
本当にHIC環境だけで分析、研究が完遂するのかというのは、やはり試行してみないと分からないところがあると思うのです。かなり中央で相当なツールをそろえられるとは思うのですけれども、それなりに自分たちで工夫した分析ツールとかというのも多分あり得る話でしょうし、RとPythonだけでやれるのかというとそうでもないかもしれないわけですよね。ですから、その辺は試行過程を通じて検討しながら進めていけばいいのではないかなと思います。
明神主査  委員長、失礼いたしました。
現行のいわゆるオンプレでやっていただくパターンというのは、当面は並行稼動と考えております。HIC解析環境単独にするとなると、先生がおっしゃるとおり、様々なユーザーのパターンを考える必要があり、かなり慎重に検討しないといけないと考えております。そのため、当面は並行で行います。失礼いたしました。
山本委員長  そうすると、さっき申し上げたように、途中までHICを使って、そこから持ち出すといいますか、今のオンサイトセンターの持ち出しルールみたいなのも若干考慮しておいたほうがいいかもしれませんね。
明神主査  そうですね。ありがとうございます。
山本委員長  ほかにいかがでしょうか。
このHICのような仕組みを導入することによって、オンサイトセンターの場合は入室管理がかなり第三者的に厳格に行えるわけですけれども、HICの場合は、分析している環境への入室環境はルール上の保障ということになって、そういう意味では若干落ちる可能性がありますけれども、それにしても全てを研究者の環境にお任せしてというよりは安全性が大分上がるだろうという期待がされると思います。
オンサイトセンターですと、今3か所で順番待ちの状態ですので、そういったことが解消されるのではないかなと思われますけれども、御意見はいかがでしょうか。
東宮先生、お願いします。
東宮委員  試行的利用に関して、申出のあった利用者に試行的に利用してもらうということですが、これは希望するところが多いだろうと考えておられるのでしょうか。
それと、実際に利用してもらうときには、申出があったときの委員会の審査でもその点を十分検討することになるのでしょうか。
明神主査  御質問ありがとうございます。事務局でございます。
最初の試行的利用の申出というのはそれほど多くないと考えております。と言いますのも、現行のガイドラインをインターネット以外は全部認めていただくということを守っていただくことを前提にしておりますので、利用者にとっては当面の間かなり負荷になるかと考えております。その前提となると、NDB・介護DBのガイドラインを熟知している厚労科研等の研究者を想定しております。もちろん提供するデータに関しては専門委員会で御審査いたいただきます。
東宮委員  ありがとうございました。
山本委員長  ほかにいかがでしょうか。
多分今後の検討なのでしょうけれども、今のサンプリングデータセットに関して言うと、私は相当程度緩めて大丈夫だと考えています。あれで患者が識別される、あるいは特定の医療機関が識別されるリスクはほぼゼロに近いと考えていますので、探索的利用環境でダミーデータを使うというのがありましたけれども、ほとんどそれに近いような安全性を確保していると思いますので、それはできれば今後皆様方と一緒に検討して、可能な限り使いやすい形で利用していただくような環境ができればと考えています。
ほかにいかがでしょうか。よろしゅうございますでしょうか。
それでは、今御説明いただいたような方向でさらに検討を進めていただいて、ガイドラインの改定等に進めていきたいと思います。ありがとうございました。
それでは、次は個別審査ですね。個別審査は非公開となりますので、傍聴者の皆様は退室をお願いします。
個別審査に移る前に、10分間の休憩としたいと思います。14時5分から個別審査を始めたいと思いますので、よろしくお願いいたします。
事務局のほうはそれでよろしいですか。
牧戸室長補佐  それでお願いいたします。
山本委員長  それでは、14時5分に再開ということでよろしくお願いいたします。
 
(休  憩)
 
山本委員長  それでは、14時5分になりましたので、会議を再開したいと思います。
 
(非 公 開)
 
山本委員長  本当に長時間にわたり、ありがとうございました。
それでは、次回の日程につきまして事務局から連絡をお願いいたします。
牧戸室長補佐  本日は長時間にわたり御審議いただきまして、誠にありがとうございます。
御指摘のあった部分に関しましては確認を取らせていただいて、提供に向けた手続を進めさせていただきたいと思います。
次回の会議日程につきましては、3月16日を予定しております。詳細につきましては追って御連絡をさせていただきます。
どうもありがとうございます。
山本委員長  それでは、以上をもちまして、第8回「匿名医療情報等の提供に関する専門委員会」を終了いたします。
本日はどうもありがとうございました。