第15回 匿名医療情報等の提供に関する専門委員会 議事録

保険局医療介護連携政策課保険データ企画室

日 時

2023年4月19日(水) 10:00~12:00

場 所

Web

出席者

【専門委員】
・宇佐美 伸治(日本歯科医師会 常務理事)
・鹿野 真弓(東京理科大学薬学部 教授)
・田尻 泰典(日本薬剤師会 副会長)
・東宮 秀夫(一般財団法人 医薬品医療機器レギュラトリーサイエンス財団 理事)
・長島 公之(日本医師会 常任理事)
・中島 誠(全国健康保険協会 理事、代理:矢崎 和彦)
・中野 壮陛(公益財団法人医療機器センター 専務理事)
・中野 惠(健康保険組合連合会 参与)
・野口 晴子(早稲田大学政治経済学術院 教授)
・宮島 香澄(日本テレビ報道局 解説委員)
・山本 隆一(一般財団法人医療情報システム開発センター 理事長)

議 題

1.HICの本格運用を見据えたNDBデータ利活用のさらなる促進について

議 事

 
山本委員長 それでは、定刻になりましたので、ただいまより第15回「匿名医療情報等の提供に関する専門委員会」を開催いたします。
 構成員の皆様におかれましては、御多忙の折、御参加いただきありがとうございます。
 まず、委員の出欠状況について、事務局から御報告をお願いいたします。
鈴木室長補佐 医療介護連携政策課の鈴木でございます。
 本日は、御参加いただき、誠にありがとうございます。
 今回は、専門委員の皆様全てがウェブ参加となります。
 中島委員の参考人として、矢崎参考人が代理出席されます。
 齋藤委員、嵩委員、田中委員、堀委員、松田委員は御欠席となります。
 以上です。
 
山本委員長 ありがとうございました。
それでは、会議の開催要件を満たしていると思われますので、早速ですが、本日の議事に入りたいと思います。
 会議冒頭のカメラの頭撮りは、ここまでとさせていただきます。
  (冒頭カメラ撮り終了)
山本委員長 それでは、早速、議題1「医療・介護データ等解析基盤(HIC)の本格運用を見据えたNDBデータの利活用の更なる促進について」、資料1の説明をお願いいたします。
水谷課長 医療介護連携政策課長でございます。
 資料1「医療・介護データ等解析基盤(HIC)の本格運用を見据えたNDBデータの利活用の更なる促進について」を御説明申し上げます。
 2ページをお開きいただけますでしょうか。
 NDBの利活用につきまして、これまでの経過をまとめたスライドでございます。
 一番上ですが、NDBは、レセプト情報(診療報酬明細書)等の情報を収載したものでございます。レセプトは、1件当たり約1,600項目を有するものでございまして、これが、これまでの累積で約240億件分格納されておりまして、年間約20億件程度が追加をされていっている状況でございます。
 こうしたNDBにつきまして、私どもは令和元年、2019年に第三者提供の制度を法定化いたしました後、NDBの利活用の促進に向けまして、NDBの利便性の向上、価値の向上のために、ここに記載されております様々な取り組みを、この委員会にも御相談をさせていただきながら講じてまいりました。
 その結果、NDBの活用について、さらにニーズが高まってきている状況と考えてございます。
 3ページにお進みいただけますでしょうか。
 これは、NDBデータの提供の形式について、改めて整理をした資料でございます。
 まず、左から2つ目「特別抽出(第三者提供)」と書いてあるところでございます。この専門委員会で個別に御審査をいただきまして、提供の承諾を得た研究につきましては、研究者の依頼に応じた、いわばテーラーメイドのデータ抽出を行って、個人単位の経時的な追跡が可能となるようなデータを提供しているわけでございます。
 このデータ提供につきましては、この専門委員会で承諾が得られてから実際に提供するまで、平均330日かかっているのが実態でございます。
 このほか、右に「オープンデータ」とございます。NDBデータにつきまして、診療行為等々の各項目別に集計を行ったもの、これをCSVファイル形式で厚生労働省ホームページ上に公開をしてございます。
 全国レベルの集計に加えまして、診療月・性年齢・都道府県・二次医療圏別など、層別集計の結果も公開しております。
 これは、厚生労働省ホームページ上でダウンロード可能となっておりまして、年間約44万回程度アクセスをいただいている状況でございます。
 一番右は「サンプリングデータセット」でございます。1か月分、具体的には1月、4月、7月、10月診療分、このレセプトデータのうち入院で約10%、外来で約1%を抽出いたしまして、高額レセプトの削除等の匿名化処理を行った、いわばプリセットのデータということになります。
 こちらにつきましても、この専門委員会で個別に御審議いただいて承諾をされ、提供されるということになるわけですが、プリセットのデータをお渡しするということになりますので、提供日数が短縮されることになります。大体平均50日程度で提供がなされている、そうした実態でございます。
 こうしたサンプリングデータセットにつきましては、個人単位の経時的な追跡までは行うことができませんが、探索的な研究を行うことが可能なものとなってございます。
 もう一つ、一番左でございます。「特別抽出(本省利用)」と書いてございます。高齢者医療確保法に基づきまして、私ども厚生労働省におきましても、政策の企画立案のためにNDBデータを抽出しまして、個人単位のデータを利用する。その際には、経時的な追跡も可能な形で利用させていただいている状況がございます。
 一番下のグラフでございますが、NDBのデータの抽出件数、具体的には、上の表の「特別抽出(本省利用)」「特別抽出(第三者提供)」というところになるわけですが、そこの抽出件数と抽出量について、経年で整理をしてみました。
 御覧いただきますと、抽出件数につきましては、本省利用が第三者提供のほぼ倍程度。それから抽出量、テラバイトで御覧いただきますと、本省利用と第三者提供は、おおむね同じ程度の利活用がなされている状況でございます。
 また、一番下には事業費の推移を整理してございますが、NDBデータの利活用についてのニーズの高まりを受けまして、予算を増やしてきているところでございます。
 特に令和4年度につきましては、クラウド化に伴う利用料も含めまして、大幅に増額を図っている状況でございます。
 4ページにお進みいただきますと、こうしたNDBのデータの利活用の促進につきまして、近年、様々な指摘がなされていることを整理したものでございます。
 昨年12月に閣議決定されましたデジタル田園都市国家構想総合戦略におきましては、HICにつきまして、ポータル機能や探索的利用環境の運用開始といった機能の充実や利便性の向上等を図るとされてございます。
 また、昨年12月の規制改革推進会議の規制改革推進に関する中間答申におきましては、規制改革の4つの分野、重点的に取り組む分野の1つとして、デジタル時代の規制改革というのが掲げられており、その中には医療データの利活用促進ということが掲げられております。
 規制改革推進会議におきましては、昨年11月に「医療・介護・感染症対策ワーキング・グループ」におきまして、NDBの利活用容易化という議題につきまして、厚生労働省ほか、関係団体からヒアリングが行われているところでございます。
 5ページ、6ページに、このヒアリングにおける委員等の御発言につきまして、ホームページ上に掲載をされているものを抜粋して掲載してございます。
 下線は、私どものほうで付しておりますが、例えば1つ目の○、2つ目の○につきましては、データ提供に要する期間についての御指摘を頂戴しております。
 また、3つ目の○につきましては、データの提供形態についての御指摘でございます。
 また、4つ目の○は、データの利用要件の明確化、そうした御指摘を頂戴しております。
 6ページにお進みいただきまして、1つ目の○ですが、これは、セキュリティ要件の設定につきまして、目的に応じた設定、そうしたことについての御指摘。
 2つ目の○につきましては、抽出条件をSQLに落とし込むためのやり取りに時間がかかっている、抽出条件の精緻化をもっと効率化させる取り組みも必要、そうした御指摘でございます。
 3つ目の○でございますが、データベースの持ち方等のシステム上の課題、業務フローの課題等の御指摘。
 4つ目の○では、委員会の開催方法等についても御指摘をいただいております。
 そうした中で、5つ目の○でございますが、座長のほうから根本的に考え方を変えないと、もしかしたら、この問題は解決しないのかもしれませんということでしょうか。こうした議論がなされているということでございます。
 7ページにお進みいただきまして、私どもとしても、こうした御指摘をいただいているような内容は、かねて問題意識を持っていたところでございますので、改めまして、このNDBのデータ提供、実態がどうなっているか、どこに課題があるのか、そうしたことを整理してみたのが、7ページのスライドでございます。
 上のほうの第三者提供というところを御覧いただきまして、改めて流れを整理いたしますと、まず、データ提供の事前相談をいただいて、実際に利用申請をいただく。ここに平均で大体30日程度かかっております。
 審査会は、年4回開催をしていただいておりますので、大体3か月に1回審査が行われることになります。
 この審査で承諾が得られますれば、先ほど申し上げたとおり、データを抽出して提供するという流れになるわけですが、ここに平均約330日かかっている状況でございます。
 この330日というのを、もう少し分解的に分析をいたしまして、どこに時間がかかっているのか、そうしたものを整理してみたものが、下の帯の部分でございます。
 大きく時間がかかっているポイントが2つございまして、1つ目の赤点線で囲われている部分、抽出条件の確定、コーディネーターとしているところが、約5か月程度かかっているということでございます。
 ここの部分につきましては、研究者側が、こうした研究をしたいということ。それに合わせる形でデータを抽出する。そこはデータベース技術者、SEが対応することになるわけですが、そこの間をコーディネーターがつないでいる、今はそうした構造にあるわけでございます。
 こうしたコーディネーターの不足という部分もあろうかと存じますが、一方で、研究者側のNDBデータリテラシーが不足しているのではないか、そうした御指摘もかねてよりいただいているところでございまして、いわば、ここには構造的な問題が潜んでいるのではないかと考えてございます。
 もう一つ、横に書いてございます赤点線で囲ってあるところ、データベースの実際の抽出等にかかるところが、約100日超かかってございます。
 実際に抽出条件が確定しますれば、それをSQLにデータベース技術者が落とし込む作業自体は約9日ということでございますが、ここに書いてございますとおり、抽出作業自体、これは抽出量の問題もございます、約44日かかってございますし、抽出待ちも約55日かかっているということでございます。
 1つは、抽出に係るサーバー数等の物理的制限という要素があろうかと存じます。これにつきましては、令和4年4月からクラウド化をしておりますので、その範囲で一定程度解消されていると思いますが、そうした制約。
 もう一つは、データベース技術者、SEの数による人的制限、制約でございます。私どもとしては、予算を増やして、SEの数を増やすというアプローチを取ってきておりますが、当然そうしたアプローチには、一定の限界があるわけでございます。
 そうした中で、8ページにお進みいただきまして、私どもは、さらにNDBデータの利便性を向上し、価値を高めていくために、データ提供の方法につきまして、抜本的に見直しをしてはどうかということで整理をしてみたのが、このスライドでございます。
 8ページの左のほうを御覧いただきまして、NDBと書いてあるところから右に矢印が出ております。「NDBサンプルデータの作成」と書いてございます。
 先ほどのスライドで御説明をいたしました、研究者のNDBデータリテラシーに対応するために、サンプルデータを作成し、公表してはどうかというものでございます。
 先に9ページを御覧いただきますと、ここでは、医科入院外のレセプトが書いてありまして、ここに書いてある様々な項目、必要な匿名化加工をした上で、実際にレセプトとして収載されているデータ、これは右下にございますとおり、一見してみれば、数字あるいは記号の羅列に見えるデータであるわけでございます。
 したがって、左に書いてある医科のレセプトが、こうした数字あるいは記号の羅列の形で掲載されて格納されていることが、なかなかイメージしづらいというところがございます。
 そうした意味におきまして、こうしたNDBデータの構造の理解を促進する目的で、厚生労働省ホームページ上で、サンプルデータ、データ見本を公開してはどうかと考えてございます。
 これは、研究者の方等々の利便に資する、つまりダウンロードして御活用いただけるという意味での利便に資するものでなければなりませんので、数メガバイト程度、そうした範囲で研究者にデータ構造の理解を促すことができるようなものを整理してまいりたいと考えてございます。
 8ページにお戻りいただきまして、これは、すぐにでも対応可能なことでございます。本年6月を目途にホームページに公表したいと考えてございます。
 その後でございます。左の図の研究者からNDBに、下から上に点線の矢印がございます。私ども、真ん中辺りにございますHIC、クラウド上の解析基盤を整理するに当たって、こうした不正アクセスを監視する機能を実装しようということで、今、作業をしておりますし、一番下のところ、研究者等の方のログ履歴を管理する仕組み、これは既に措置済みとなってございます。ただ、現時点においては、これはログ履歴が残っていて、それをSEが人的に監視する構造であるわけでございます。
 HICにつきましては、現在、試行運用をしておるところでございますが、本年秋を目途に、これにつきまして、本格運用を開始するタイミングで、HIC上、クラウド上におきまして、今から申し上げる2つのデータを解析可能としてはどうかと考えてございます。
 1つ目が、解析用に特別抽出したデータということでございます。現在、先ほど申し上げたとおり、承諾が得られた研究につきましては、特別抽出してデータを電子媒体に落として、お渡しをしております。それと同じものを、HIC上、クラウド上でアクセスできるようにするということでございます。
 もう一つが「トライアルデータセット」と書いてございます。トライアルデータセットの使用につきましては、昨年12月、この専門委員会で御議論をいただきました。探索的利用に資するデータということで、先ほど4類型の中で御説明申し上げました、サンプリングデータセットに近い形だと捉えていただければと存じますが、そうしたものにつきましても、HIC上でアクセスできるようにすることによって、探索的利用というものをより促していきたいと考えてございます。
 これが、いわば第一段階ということでございますが、第二段階といたしまして、右の図のほうになります。
 「不適切利用の監視機能の実装」と書いてございます。
 具体的には、NDBデータは、特定商品・役務の広告・宣伝、マーケティング利用ということは禁止されてございます。
 また、当然研究目的と合致しないデータにアクセスをしようとするとか、あるいは特定個人の識別等を目的とするような利用、そうしたことは当然不適切な利用となるわけでございます。
 そうしたものを自動的なログ監視によって自動検知する機能、そうしたものをHIC上で実装することによって、真ん中に「解析用に処理したNDB」と書いてございます。クラウド上で解析用に処理した、いわばNDBそのものを、このHIC上でアクセス可能とするようにしてはどうかというものでございます。来年秋を目途に、こうしたこととしたいと考えてございます。
 ここの部分につきまして、10ページでもう一度整理して御説明をしたいと考えてございます。
 一番左に現行の仕組みが書いてございます。NDBデータにつきまして、この専門委員会におきまして、相当の公益性があるか、データは最小限となっているか、安全管理措置がきちんと講じられているか、こうしたことについて御審査をいただき、承諾が得られたものについては、解析用に特別抽出して、その抽出されたデータを電子媒体で研究者にお渡しをしている、これが現行のシステムでございます。
 今度、新しく右のほうでございますが、背景を薄いブルーとしてございますが、医療・介護データ等解析基盤、右上に吹き出し矢印がついてございますが、HICでございまして、ここで適切なデータ解析を監視できる安全な環境を確保したいと考えてございます。
 そうした環境が確保されることを前提としますれば、NDBから出ている矢印の一番左「解析用に処理したNDB」と書いてございます。
 ※の1のところにございますが「ブラックリスト方式で個人特定の可能性のある項目を匿名化する等の処理をしたもの」、NDBそのものに近い形の解析用に処理したNDBにつきまして、研究者がHIC上でリモートアクセスできるようにすることとしてはどうかというものでございます。
 この場合、実際のNDBデータを研究者が御活用されるに当たっては、データを抽出することが必要になるわけでございます。それは、研究者御自身で御対応いただける場合は、もちろん御対応いただくことになりますし、その下のところに「アドバイザリープラットフォーム(仮称)」と書いてございます。
 私どもとして、データの専門家が研究者に伴走してデータ抽出等を支援するような、そうした枠組みを整理することによって、研究者がNDBデータについての習熟度に応じて、柔軟にNDBデータを扱えるようにしてはどうかというものでございます。
 このHIC上では、NDBのデータ等々を含めまして、自らのPC等にデータをダウンロードすることはできないとなってございますので、まさにHIC上で安全な環境を確保すれば、こうした取扱いも可能ではないかというものでございます。
 その右「トライアルデータセット」と書いてございます。
 ※の2にございますとおり「NDBに実際に収載されるデータに近い探索・試行的に解析するためのデータ」というものでございまして、こうしたものにつきましては、より簡便な手段で研究者がリモートアクセスできるようにしたいと考えてございます。
 こうしたものへのアクセスにつきましては、左上のところにございます。委員会の審査につきましても、審査を簡略化することができるのではないか。具体的には、最小限のデータを抽出して提供する必要がない仕組みということになりますので、そうした意味で、審査の簡略化が可能ではないかと考えてございます。
 一方で、一番右でございますが、原則として、こうしたHIC上での提供を基本としていきたいと考えてございますが、解析環境が整った専門的研究機関等の中には、例外的に電子媒体で提供してほしいといったニーズもあるかもしれません。
 そうした場合には、現行と同じように、解析用に特別抽出したデータを電子媒体でお渡しをするということになりますので、この場合の委員会審査というのは、従来どおり行っていただくことになろうかと存じます。
 なお、この図の「解析用に処理したNDB」の隣に「汎用データセット(検討)」と書いてございます。
 先ほど御覧いただいたとおり、NDBは、診療報酬の請求の目的のために作成されたものを、いわば二次利用するために集積をしているものでございます。
 したがって、必ずしもデータそのものが、研究用に使いやすい形にはなっておらないことは、かねてより研究者の皆様から指摘をされてございました。
 それをより研究に使いやすいような形で、汎用のデータセットのようなものが検討できるのであれば、そうしたものは、より研究利用に資することになりますので、そうしたことにつきましても、私どもは併せて検討をしていきたいと考えてございます。
 この関係で、11ページを御覧いただきますと、令和5年度の厚生労働科学研究で、NDBの迅速提供に向けたスキーム再構築に資する研究というのを実施いたしてございます。
 これは、当委員会の委員長を務めていただいております山本先生に研究代表をお務めいただきまして、研究体制のところに掲げさせていただいているようなNDBオンサイトセンターの利用者、NDBで研究実績がある研究者、審査実務に精通した研究者、こうした方々にお集まりをいただいて、左の「主な検討事項」というところにございますが、HICにおける効率的なデータ提供の在り方、新たな提供体系において必要な安全管理措置、データ活用を促進するための必要な支援の在り方、こうしたことについて御議論をいただき、私が先ほど申し上げたような全体のデータ提供方法の抜本的見直しの中で、こうした知見を生かしてまいりたいと考えてございます。
 12ページにお進みいただけますでしょうか。
 こうしたデータ提供方法の見直し、HICの機能拡充に伴う見直しに併せまして、この専門委員会における審査の方法についても、見直しが可能ではないかと考えてございます。
 詳細は、今後検討していく必要があると思ってございますので、あくまで現時点でのイメージということにはなりますが、現在、申請からデータ提供まで平均390日かかっている。そうした現状につきまして、申請の締め切りを毎月設定し、申請から最短7日で処理することを検討してはどうかと考えてございます。
 このイメージでございますが、下のフロー図を御覧いただきまして、例えば、NDBデータの利用申請につきまして、毎月最終週の月曜日を1つの期限として設定し、そこまでに、ポータルサイト上で申請をいただくということでございます。
 そうしますと、例えば、毎月1回水曜日に専門委員会を開催していただいて、書面審査で木曜までに審査が終了すれば、その後、研究者側から手数料を納付していただければ、ポータルサイト上のID、パスワードを振り出して、翌週月曜日から利用開始できるような環境を設定するという考え方でございます。
 もちろん、右下にございますとおり、不承諾あるいは継続審査になるようなものもあると思いますし、研究内容が不明確で判断できないような場合には、今回のような対面で御審査をいただくということも、当然必要だと思ってございます。
 一番上の点線囲みの※のところでございます。現在の申請件数ベースで単純に置き換えますと、申請は月5件程度でございますので、今、当面月1回、こうしたフローを実装することを1つのイメージとしてお示しをしてございます。
 もちろん、NDBデータの提供方法の見直しに伴いまして申請件数が増えてくれば、複数回設定することも検討する必要があるのではないかと考えてございます。
 8ページにお戻りをいただきます。
 一番上の枠囲みの中に、今まで私が申し上げてきたことを文字で整理してございます。
 第一段階のステップでございますが、本年6月、NDBサンプルデータを厚生労働省ホームページ上に公表する。そして、今年の秋にリモートアクセスでトライアルデータセット・解析用に特別抽出したデータを解析可能としたいと考えております。
 その上で、第二段階といたしまして、不適切利用等の監視機能、そしてポータルサイトの機能拡充、こうしたものを開発・実装した上で、来年秋にリモートアクセスの解析データを拡大するとともに、申請締切りを毎月設定し、申請から最短7日で処理できるような仕組みに改めていきたいと考えてございます。
 ただ、不適切利用等があった場合に、厳格な対応をするということは、当然の前提でございます。
 最後に、13ページを御覧いただけますでしょうか。
 2というところに「NDBの安全管理措置」、現行の措置を改めて整理してございます。
 2つ目のポツでございますが、まず、高齢者医療確保法に基づきまして、研究者側には、他の情報と照合等の禁止の義務ですとか、利用後のデータ消去、安全管理措置、不当な目的利用等の禁止などの義務が課されているほか、ガイドラインにおきまして、成果物を公表する前に確認する、こうした仕組みも講じられているところでございます。
 私ども厚生労働省は、法令違反などの疑いがある場合には、この高齢者医療確保法に基づいて立入検査、是正命令を行うことが可能となってございますし、これに違反した場合には、罰則も設けられているところでございます。
 また、こうした法令上の手続に移行する前であっても、NDBの不適切利用ということがあった場合には、厚生労働省におきましては、ガイドライン、利用規約に基づきまして、利用停止等の措置をこれまでも講じさせていただいているところでございますし、これは、引き続き厳格に運用してまいりたいと考えてございます。
 私からの説明は、以上でございます。どうぞよろしくお願いいたします。
山本委員長 どうもありがとうございました。
 本日の議題は、これだけですので、活発に御議論をいただければと思います。ただいまの事務局の御説明に関しまして、御質問、御意見がありましたら、よろしくお願いいたします。
 長島先生、どうぞ。
長島委員 日本医師会の長島でございます。
 NDBというのは、世界でも有数な極めて重要なビッグデータだと思います。そのビックデータが今まで十分に利活用できていなかったというのも実際かと思いますので、個人情報の安全をしっかり担保しつつ、もっと研究者にとって使いやすくするということで、今回示された全体像、方向性としては賛成いたします。
 その中で特に重要になるのが、不適切利用の監視機能が実際にどれだけ機能できるかということかと思います。
 データをそのまま渡してしまうと、渡した側で実際に何をしているかというところのチェックができないのですけれども、HICの中で、その辺のログの監視等できちんとチェックできるということなので、これが適切に機能すれば、むしろ今以上に、しっかりとセキュリティが向上し、不適切利用に対する抑止力が働くということで非常に重要ですが、これが本当に機能するかというところが大変重要かと思いますので、ここの仕組みをどうつくって、どうチェックできるかというところがポイントかと思います。
 もう一点が、7ページの課題のところで、研究者のNDBデータリテラシーの不足というのがありますが、これには2つの対応が必要かと思います。
 1つは、それほど高いデータリテラシーを持っていなくても利用できるようにしてあげるということで、利用できるようなツールを準備したりとか、いろいろな支援をするということも重要かと思います。
 もう一つは、リテラシーを上げるための育成とか、環境整備ということも重要かと思います。
 その意味では、サンプルデータを公表するだけではなくて、サンプルデータの上手な利用法に、こんなものがありますというような、利用法のサンプルというのも一緒に見せて上げることも重要かと思います。
 審査に関しましては、特に今まで大きな問題がなかったのか、不適切利用があるのではないかというところが大きな心配でしたけれども、もしも、監視機能が十分に機能してくれば、その辺りの審査のほうがかなり楽になると思いますけれども、ただ、一気にやるのではなくて、やはり段階的に、それぞれが十分に機能しているかをチェックしながら進めていくことが重要ではないかと思います。
 私からは、以上です。
山本委員長 ありがとうございました。
 田尻構成員、お願いいたします。
田尻委員 日薬の田尻でございます。
 今、長島先生がおっしゃったことと全く同じ意見なのですけれども、やはり不安に思うのが、ログの監視がどの程度きちんとできるかということにかかっているかと思います。
 ですから、AI技術辺りもかなり向上していると聞いていますので、安全が確保できるのであれば、これは歓迎します。このシステムが順調に動いてくれれば、今まで医療データの活用というのを世界的に見て、どうなのだろうかと心配していたところ、これだけの大きな健康にまつわる膨大なデータベースが完成して、それが毎月積み上げられていく、それを有効に利用する、やっと先の見える手立てをここで見させていただいて、ほっとしている気持ちが強いところです。
 今日は、内容は違いますけれども、個別審査で私たちがいろいろな想像をしながら審査するというのも、数にも限界がありましょうし、役所のほうでもデータを抽出するのに、すごい労力がかかっていたと想像していますので、これについては、本当にそのような問題が解決できる非常にありがたい方法だと思いますので、ぜひとも監視の部分をきちんと担保できるような格好で実行していただければと思います。
 田尻のほうからは、以上です。ありがとうございました。
山本委員長 ありがとうございました。
 ほかに御意見は、いかがでしょうか。
 野口先生、どうぞ。
野口委員 御丁寧な御説明いただき、どうもありがとうございました。
 私からは何点かあるのですけれども、全体としては、我々研究者にとって非常に喜ばしい方向性であると思いつつ、申請から最低7日間、これは非常にありがたいお話ではあるのですが、規制改革委員会の議事録を見せていただいて、1つ現状確認として、要するに諸外国のケースなのですが、どこの国も最短7日間で提供というような国は、私が知る限りないです。
 総務省でやった研究会があるのですけれども、イギリスなども、こういった大きなデータを処理する場合は、9か月から12か月かかっておりますし、アメリカのCMS、Center for Medicare and Medicaid Serviceなども、私は昔、自分で使っていたので分かるのですけれども、大体1年ぐらいかかるのです。
 ですので、300日というのは、確かに我々研究者からすると少し長過ぎるなと、それは、当然そう思うことなのですけれども、申請から7日間で処理するというのが、すごいなという感じがしています。
 そのことについて、もし本当に最低7日間で処理するということになりますと、人員と予算をかける必要があると思うのです。例えば、日本よりも短いとしても、イギリスやアメリカなどだと、例えば、先ほど言ったアメリカですとCMSで、イギリスだと、また別の組織があるのですけれども、率直に言うと50人ぐらい、要するにPhDの若い研究者がデータ提供に関わっているわけです。
 先ほど、10ページにアドバイザリーボードというのがあったと思うのですけれども、アドバイザリーボードというのが適切な言い方かどうか分からないですけれども、例えば、CMSでメディケアとかメディケイドのクレームデータを使う場合に、もちろんCMSに50人ぐらいいるPhDの人たちがコンサルティングに応じてくれるとともに、教育機関として有名なのですけれども、RePEcという組織があって、ミシガンでしたか、ちょっと忘れましたけれども、どこかの大学にあるのですけれども、とにかく非常に多くの人員が割かれているわけです。
 ということは、これは御質問にもなるのですけれども、要するにこういった体制づくりをするのに、全く人員も増やさなくて、予算も増やさないということになると、物すごく持続可能性が問われる話になってくるので、しっかりと人員と予算の確保を厚労省のほうからお願いをすべきだと私は思っております。
 このアドバイザリーボードというのも、ただ単にアドバイザーをするだけだと、要するになかなかなり手がいないわけですね。ウイン・ウインな関係にならないので、これは私も前から言っているのですけれども、厚労省の中あるいはほかの科学院でもいいのですけれども、PhDを取った人たちを研究者として任期つきで雇って、彼らにデータを自由に使わせて論文を書かせてあげる代わりに、こうしたデータクリーンナップであるとか、アドバイザーだとか、そういった職責を与えて仕組みをつくらないと、絶対に持続可能性がないので、体制づくりあるいは予算、人員の確保をしっかりとやられることが重要だと思っております。
 3番目、最後の点なのですけれども、CMSとか、イギリス、デンマーク、スウェーデン、どこもそうなのですけれども、要するにお金を取るわけですね。研究者に対してただで提供しているというのは、本当に日本のすばらしいところだと思うのですけれども、非常にフェアだし、公平だと思うのですけれども、仮に人員であるとか予算を獲得するために、財務省のほうから、例えば金を取れという指示があった場合、1つだけ物すごく注意していただきたいのは、アメリカとかイギリスで何が起こっているかというと、非常に高いのです。こういったレセプトデータを国からもらうとき、すごく高額なお金を取っているわけです。
 そうなると、例えば一部の保険会社であるとか、製薬メーカーといったところが、いわゆる著名な大学の著名な研究者に物すごいお金を与えて、その下にぶら下がる形でみんなが研究をやっていくというスタイルになる。
 そうなると何が一番問題かというと、パブリケーションバイアスがかかってくる。例えば、アメリカというのは、基本的に若い人たちは公的保険を持っていないですから、保険会社の意向あるいは製薬メーカーの意向に沿わないような結果は、発表できないといったパブリケーションバイアスがかかってきてしまうと。
 したがって、私が何を言いたいかというと、お金を取るということは、日本でも、そういった体制をつくるためにもやるべきだと思うのです。ただ、余りにそれが高額過ぎると、結果として、利益追求団体の都合のいい結果しか世の中に発表できなくなる状況に陥ってしまうと。
 ですので、皆さんがおっしゃるようにHICの監視システムが重要であると同時に、アドバイザリーのプラットフォームの体制づくりをどうしていくかというのが、非常に今後のキーポイントになってくるかなと、私は思います。
 すみません。長くなってしまいましたけれども、以上です。
山本委員長 ありがとうございました。
 イギリスは、相変わらず時間がかかっているようですけれども、CMSは2016年からVirtual Research Data Centerというシステムを提供して、その場合は、2週間ぐらいで提供はできているようで、このHICを利用した仕組みは、Virtual Research Data Centerのダッシュといいますか、それよりは使いやすいデータセットを提供して、その分監視をきつくしていこうというアイデアだと思っています。
 事務局のほうから、今の野口先生の御意見に対してコメントはございますか。
水谷課長
医療介護連携政策課長でございます。
 野口先生、山本先生、どうもありがとうございます。
 諸外国の状況につきましては、私どもより先生方のほうがお詳しい面もあろうかと存じます。
 どうしても諸外国の制度と比べるときに、データ提供の形態、私どもも今までのやり方で390日、今回7日、これはある意味土俵が違う部分もございまして、データをテーラーメイドで特別抽出してお渡しをする、それまでの期間か、それともHICという安全な環境の下で、NDBデータに近いものに触り得る環境を提供する、そこまでなのかということと、当然、土俵が違うと私は申し上げましたが、そういうことになるわけでございます。
 諸外国の場合に、どういった形でお渡しをしているのか、先ほど山本先生がおっしゃられましたとおり、CMSでも、例えばホームページ上では、12週から20週ということが書かれているわけでございますが、今、山本先生がおっしゃったような別の渡し方もあるということでございましょうし、まさにそうしたものも含めて比較をしていく必要があるのかなと考えてございます。
 そうした中、野口先生のほうから、アドバイザリープラットフォームにつきまして、様々御指摘を頂戴いたしました。まさに私どもとしても、山本先生に研究代表をお務めいただいている厚労科研の中で、この検討事項の中に、データ活用を促進するための必要な支援の在り方ということを書いてございます。
 こうしたものをどのような形で提供していけるのか、それは研究者側の視点だけでなく、先ほど野口先生から予算、人員の確保が必要という指摘もございました。もちろん私ども厚労省本省でやっている部分もございますが、NDBデータの提供に関する事務につきましては、社会保険診療報酬支払基金に委託をして実施していただいている部分もございます。
 これは支払基金の体制も含めまして、どういう形で提供していけるのか、そこにアドバイザリープラットフォームがどういう形で支援として関わっていただけるのか、そうしたことも含めまして、この研究の中での御提言を参考にさせていただきながら、体制を整備していきたいと考えてございます。
 それから、野口先生から最後に御指摘をいただきました手数料の問題でございます。これにつきましては、私ども現行で、今、NDBのデータ提供に当たりまして、例えば科研費ですとか、そうした公的資金による研究補助が行われているような研究につきましては、手数料をいただかない取扱いをしてございます。
 一方で、今後、こうした新しいデータ提供方法にする中で、データ提供の手数料といったものをどうしていくのかということについては、このデータ提供方法の実務を整理していく中で、また改めて御議論をいただきたいと考えてございます。
 もう一つ論点としてございますのが、HICのクラウドの利用環境、今、試行運用ということで特に料金はいただかないでお使いをいただいてございますが、HICを利用する利用料といったものをどう考えていくのか、それも当然論点ということになってこようかと思います。
 まさに野口先生がおっしゃったような、お金を取るということになると、そうしたパブリケーションバイアスも含めて弊害が起こり得る、そうした指摘も念頭に置きながら、また一方で、こうした環境を整備し、それを提供することについての一定の費用というものを御負担いただくということ。その観点のバランスを取りながら、これもこの専門委員会で御議論いただきながら整理をしていきたいと考えてございます。
 以上です。
山本委員長 それでは、中野壮陛構成員、お願いいたします。
中野(壮)委員 ありがとうございます。
 今、野口先生と課長がおっしゃった話と、ほとんどかぶる気がしていますので、手短にと思っていますが、今ちょうど映っているところで、委員会の審査で2つ目のポツに「最小限原則」と書いてありますが、ちょうど先週か先週ぐらいに、私も野口先生がおっしゃったイギリスのところの審査がどうなっているか、別のことがあっていろいろ調べていたら、結局、議事録を見ていると、差戻しが結構あるのですけれども、そのときは最小限の原則に反していると、目的から見ると、そこまでデータは要らないだろうということで、差戻しがあることがどうも多かったような気がしています。
 そういったことを考えたときに、7ページのスライドを見させていただきたいのですけれども、今回331日を減らすというところ、実は上の赤枠のデータ抽出のところが330日と、下がそこを拡大しているのですけれども、一番かかっているのは、コーディネーターのところが151日なので、これをサンプルデータとかトライアルデータというのか、そういったものを使わせることを先にすることで減らすと、151がゼロになることはないのでしょうけれども、減らすということが目的かなと思っています。
 そうすると、要は利用申請の前のところに、そういったフェーズを持ってくるという、多分、フェーズの置換えをしていくことだろうと思っていまして、その観点から見ると、そこはすごくダイナミックでいいことだろうなと思いますが、やはり先ほど御議論のとおり、利用申請前の御負担のほうが、事務局のほうに非常にかかってくると思っています。
 それで、データリテラシーということが、データの取扱いという中でSQLとかの取扱い、テクニカルなことだけではなくて、目的からすれば最小限になるのかというところまでの、何かアドバイスがあることが多分大事なのだろうなと思っていまして、そういったところがなされると、厚労省のほうで、今、狙われている目的は十分に達成し得るのかなと思っていますので、ぜひ相談のところの拡充、山本先生のほうで御検討されているところが、すごく大事なのだろうなと思っていますし、そこについての予算配分とかが結構大事になってくるのではないかなと思って聞いておりました。
 以上でございます。
山本委員長 ありがとうございます。
 ほかに御意見ございますでしょうか。
 長島先生、どうぞ。
長島委員 今の点にも少し関係しますけれども、今までの審査でどのようなところが問題になったりとか、どのようなところで改善を求められたかというのを少し整理していただくと、事前に相談していただくときに、こういうところは、こうしたほうがうまくいきますよということなので、ぜひ今までの審査での、いろいろな問題というのを少し整理していただいて、それを提供するのも非常に有効ではないかと思います。
 以上です。
山本委員長 ありがとうございます。
 宮島先生、どうぞ。
宮島委員 どうもありがとうございます。
 私も今かかっている日数がとても多いというのは、規制改革会議のほうの問題意識も当然だと思いますし、短くなる手法は、まずはこれでやってみるということなのかなと思います。
 今、お話にあったように、これだけ短くなるのであれば、やはり長い間に、お互いが議論してすり寄っていっている部分というのが、かなり欠けてしまうのではないかというような不安がありまして、それは全体のもともとの意識を上げることによってカバーするしかないのではないかと思います。
 その意味では、全体にデータを要求する人たちの基本的な知識とか認識を上げるということは、やはり非常に重要なことだと思っています。
 今までも時間が経つにつれて、初期では考えられなかったような申請が出てくると感じていたのですけれども、そういう人たちは、それはいけないのだというところを、これでは通らないのだということを、あらかじめ、もう少し分かっていれば、こんな申請は出てこないのではないかなとも思っていましたので、そういうことをあらかじめ、こうしたことに関わる方々が分かるような状況にしておくことが全体の短縮とか、全体の負担軽減になるのかなと思います。
 あとは、打ち出し方ですけれども、すごく長いと言われたので、これは一般というか、メディアからというか、取材する記者としての感覚ですけれども、三百何十日ではすごく長いと言われたので、7日にしますというのは、感覚としてかなり強引な感じはしますが、それは形を変えてやるということなので、どこをどう変えたから、つまり全く同じことの三百何十日を7日にするのではなくて、ここのところはこういう考え方に変えたから短くなるのだということ、前後に少し寄せてきているものが形の上でもあるのだということを、ちゃんと説明しながら申請する方々にも理解をしていただくことが必要だと思います。
 あと心配していますのは、事務局その他の負担がどうなるかということに関しては、やはりとても気になりますので、まずは進めるということなのでしょうけれども、随時検証を行いながら進めるのがいいのではないかと思います。
 以上です。
山本委員長 ありがとうございます。
 鹿野先生、どうぞ。
鹿野委員 御説明ありがとうございます。
 私も期間が300日以上というのは、長いという問題点だと思いますので、非常に短縮に向けて画期的な対応をされるというのは賛成なのですが、今まさに宮島先生がおっしゃったように、あまりに短くなり過ぎる印象があって、本当に見ているのですかと言われかねないかなというのは少し危惧するところです。
 恐らくそうはいっても、最短7日と言いながらも、事前の相談であるとか、事務局側の調整に相当時間をかけられるのかなとは思いますので、その辺も含めた説明をしていただくということ。
 あと、審査が実質一日になるわけですね。そこの前にある程度事務局で整理をするとか、ちゃんとやっているのですよということを説明いただくこと。
 あと、継続審査、差戻しをするというのも、その判断も一日でするというのが、ちゃんとできるのかとか、ちゃんと見ているのかと言われそうな気がしますので、その辺、それぞれのステップで何をするというポイントを明確にしていただいたほうが、世間からの信頼も得やすいのかなと思います。
 以上です。
山本委員長 ありがとうございます。
 最短7日というのは、本当に理想的な場合ですね。ですから、あくまでも最短で、例えば、毎年毎年やられているような研究を今年度もやりたい、その研究者が非常によく理解されているといった場合には、多分7日でも可能だと思いますけれども、それ以外は、普通はあり得ない期間ですね。
宮島委員 想像すると、恐らく事務局のほうで、この申請は、こういう問題がありますというのをピックアップされて委員に回ってきて、これは、こうしたらいいよという意見をつけて、そこで差戻しになるなりと、そういう形かなと思うのですけれども。
山本委員長 ありがとうございます。
 ほかは、いかがでしょうか。
 中野先生、どうぞ。
中野(惠)委員 皆さんからの御意見が言い尽くされたという感じが致します。
 特に追加の意見ではないのですけれども、今の7日については、アピール的には、7日というとインパクトがあっていいのですけれども、その分のしわ寄せというのが、やはりどうしても気になるということ。
 特に事務局のほうで、必要以上の負担になってしまうのではないかということを危惧することと、当然、専門委員に関しましても、今、鹿野委員もおっしゃいましたけれども、一日で審査かと、全部答えるのかみたいなことになりかねませんので、その辺の課題をきちんと整理して進めるということと、検証できる部分はモデル的にやってみることも必要になるかと思います。
 その点でいいますと、山本先生の科研費研究班が大いに力を発揮するのではないかと思います。そこでおたずねしますが、これは今年度中に結論が出る研究だということでよろしいでしょうか。
山本委員長 一応そのように理解していますけれども、お考えはいかがでしょうか。
中野(惠)委員 大変だと思いますけれども、よろしくお願いしたいと思いますし、規制改革に言われるまでもなく、これは結局、いかに期待されているかということの結果の御意見だと思いますので、それを真摯に受け止めて、できることをきちんとやっていくということだと思います。方向性は、皆さん御同意されているかと思いますので、これで進められたらいいかと思います。
 以上でございます。
山本委員長 ありがとうございます。
 東宮構成員、どうぞ。
東宮委員 方向性につきましては、全く異論はございませんで、ぜひこの方向で進めていただけたらというのが1つ。
 一方で、例えばコーディネーターのやっていた作業が申請者に移るということでは意味がありません。申請からデータ抽出を経て実際に解析作業に入るまでの期間が短縮するというのが、本来目指すべきところかと思いますので、作業分担を意識した形で進めていただくことを期待いたします。
 以上です。
山本委員長 ありがとうございます。
 ほかは、いかがでしょうか。
 よろしゅうございますか。それでは、事務局から全体を通して、コメントはございますか。
水谷課長
医療介護連携政策課長でございます。
 様々御指摘を頂戴いたしました。まず、何人かの委員が御指摘くださいましたとおり、390日を7日にする、全く同じことを7日でやりますということではございません。そこは、私、先ほど御説明をしたつもりでございますが、こうしたことは、対外的に発信していくに当たっても、きちんとどういう考え方でやっていくのかということを、私どもとしても丁寧に説明してまいりたいと考えてございます。
 それから、これも様々な委員から御指摘をいただきましたが、単にNDBのデータ提供という抽出とかそういう部分だけに着目するのではなく、まさにトライアルデータセットをHIC上でより使いやすくすることによって、研究者の方に探索的研究をしていただく、あるいはそういった経験を積んでいただいた上で、実際の研究に関わっていただくですとか、あるいは長島先生から御指摘いただいたとおり、これまでの審査でどういうことが問題になってポイントになっているのか、そうしたことをお示しすることも、研究者側にとっては予見可能性を高めるということになろうかと思います。
 私どもとして、そうした環境整備をしていくことによって、まさに本体の審査というものが、真に必要な洗練された申請が上がってきて、それを皆さん方に審査していただけるような、そうした環境を全体として構築していくことが重要だと思っています。
 宮島委員から、全体の意識ということがございましたが、そうしたことを意識しながら、単に数字を短くするということではなくて、NDBデータを日本国の研究者全体できちんと活用していくのだと、そのための環境整備をどう進めていくか、そうした観点で進めていきたいと考えてございます。
 また、審査の実務について、様々御指摘を頂戴いたしました。実際、数日で審査をしていただくということになりますと、当然それに伴った審査実務の在り方ということも考えていかなくてはいけないと思っております。今いただいた御指摘も踏まえながら、私どもとして、これは、また具体的に整理をして、ここにお諮りをしながら進めていきたいと思っております。
 私どもとして、申請をいただいたときに、そこでアドバイスを求められれば、私ども事務局あるいはアドバイザリープラットフォームを含めて、適切なアドバイスができる環境というのを構築していきたいと思っておりますし、ただ一方で、申請者の側に、私どもが過剰な制約を課すということも、これはルール上おかしいということになりますので、申請者がそうしたものを求める場合に、それを適切に提供できるような環境、そうしたものを構築していきたいと考えてございます。
 全体といたしまして、今回御提案している内容、抜本的見直しと私ども申し上げましたが、本当に大きな見直しだと思ってございます。
 今回、大きな方向性について、ある程度の皆様方から御了解をいただけたものと思っておりますが、詳細について、これは具体的なことを一つ一つ、この専門委員会にお諮りをしながら進めていきたいと思ってございます。
 あと、先ほど委員の皆様から御指摘がありましたとおり、検証をしながら進めていく、すなわち、実際に動かしてみながら、また不都合なところがあれば見直していく、そうした姿勢で臨んでいきたいと考えてございますので、引き続き御協力をよろしくお願いいたします。
山本委員長 まだ御発言のある構成員の方はいらっしゃいますでしょうか。おおむね御意見をいただいたように思いますし、今日、事務局の御提案に関しては、それぞれ構成員の方々からいただいた意見を十分しんしゃくして、おおむねこの方向で検討を続けていただくということで、よろしゅうございますね。
  (異議なしの意思表示あり)
山本委員長 ありがとうございます。
 それでは、そのように進めていただければと思います。
 本日御議論いただく案件は、以上でございます。
 次回の日程について、事務局から連絡をお願いします。
 
鈴木室長補佐
本日は長時間にわたり御議論いただき、ありがとうございました。
 次回の会議日程につきましては、事務局より既に御連絡をしておりますが、6月7日の予定です。詳細につきましては、追って御連絡させていただきます。
山本委員長 ありがとうございます。
 それでは、以上をもちまして、第15回「匿名医療情報等の提供に関する専門委員会」を終了いたします。
 本日は、誠にありがとうございました。