ホーム> 政策について> 審議会・研究会等> 保険局が実施する検討会等> 医療・介護データ等の解析基盤に関する有識者会議> 第7回医療・介護データ等の解析基盤に関する有識者会議議事録(2018年9月27日)

 
 

2018年9月27日 第7回医療・介護データ等の解析基盤に関する有識者会議 議事録

保険局医療介護連携政策課

○日時

平成30年9月27日(木) 13:00~15:00

 

○場所

全国都市会館 第2会議室(3階)

○議題

 レセプト情報・特定健診等情報データベース(NDB)及び介護保険総合データベース(介護DB)の連結について
(1)データベースの整備・保守管理 その他(オープンデータ等の扱い)
(2)さらに検討が必要な論点(案)
 

○議事


○遠藤座長 それでは、定刻となりましたので、ただいまから第7回「医療・介護データ等の解析基盤に関する有識者会議」を開催いたします。
構成員の皆様におかれましては、お忙しい中、御参集をいただきましてどうもありがとうございます。
まず本日の構成員の出欠状況について、事務局から報告をお願いします。
○宮崎課長 事務局でございます。
本日の構成員の皆様の出欠状況を御報告させていただきます。
本日は松田構成員、松山構成員、武藤構成員から御欠席との連絡をいただいております。
また、海老名構成員、樋口構成員におかれては、おくれて御到着の見込みと伺っております。
以上でございます。
○遠藤座長 ありがとうございます。
それでは、議事に入らせていただきます。
冒頭のカメラ撮りは、ここまでとさせていただきます。
本日は、「レセプト情報・特定健診等情報データベース(NDB)及び介護保険総合データベース(介護DB)の連結について」を議題といたします。
前回、主に第三者提供に関して御議論をいただきましたので、データベースの整理・保守管理等について、本日は重点的に御議論をいただきたいと思います。
それでは、事務局から説明をお願いしたいと思います。
○宮崎課長 事務局でございます。
それでは、お配りしております資料について御説明をさせていただきます。
お配りしておりますのは資料1、資料2、参考資料として1~7がございます。
参考資料1~6についてはこれまでの資料でございまして、参考資料7はデータ管理のシステム関係について、御議論に資すればということで、資料を用意させていただいております。
冒頭の説明に当たりましては、資料1、資料2に沿って御説明させていただければと思います。
また、資料1、資料2と別に、各構成員の皆様のお手元には「NDB・介護DB情報の解析基盤のイメージ」という資料をお配りしております。これは、これまでの議論を踏まえまして、まだ全くの途中段階でございますが、イメージを絵にすればということで資料にしたものでございます。今後変わっていくものでもございますので、構成員の皆様への机上の配付として、会議後回収させていただくという扱いにさせていただければと思います。
それでは、資料1、資料2に沿いまして御説明をさせていただきます。
まず先に資料2をお開きいただければと思います。前回から本有識者会議の7月19日のこれまでの議論の整理に沿いまして、さらに検討が必要な論点について御議論をいただいているところでございますけれども、先ほど座長からお話がございましたように、本日は前回御議論いただいた第三者提供に関して、横串で見ていただいた論点以外の論点について御議論をいただければと思っております。
具体的に申し上げますと、資料2の1ページでございますが、論点2-1から2-3はオープンデータや試行的な分析のためのデータセットなど、現在提供している情報提供のあり方につきましての御議論です。論点2-1としては標準的な項目(オープンデータ等)の定期的な公表のあり方についてどう考えるのか、定期的に公表することについてニーズ等を踏まえた検討を行ってはどうかという論点。
論点2-2としては、試行的な分析のためのデータセットの設定のあり方、具体的には現在、サンプリングデータという形で探索的に利用可能なデータの提供を行っていますけれども、こうしたデータ提供について利便性の向上という観点から、どのようなことが考えられるのかという論点。
論点2-3としては、オンサイトリサーチセンターのあり方、オンサイトリサーチセンターにつきましては、現在NDBの利用に関して設置をしておりますけれども、現行の取り組みや利用ニーズの増加等を踏まえて、今後の役割についてどう考えるのかという論点があろうかと考えております。
2ページ目には論点2-4を示しております。こちらはこれまでの議論の整理においては、実施体制のところで、安全で高度な研究利用に応えるデータベースという点についてどう考えるのか、具体的には保守・管理に加えて今後そのデータベースの解析機能の充実や改善等に向けて、先駆的な技術や研究成果等を随時取り込むための機能が必要となるのではないか、この機能を充実するために実施体制やシステム・データベースの構造等において、具体的にどのような方策が考えられるのかといった点が論点になろうかと考えております。
最後、3ページでございますけれども、7月のこれまでの整理の段階では、技術面の課題としてまとめさせていただいていた部分でございます。論点2-5として連結解析のための技術的な対応についてどう考えるのか。論点2-6としてセキュリティーの確保等についてどう考えるのか、具体的には2020年度の開始に向けて今後、将来的に導入が見込まれる個人単位被保険者番号の活用について、その準備状況等を踏まえた上で検討していくことが必要ではないか、セキュリティーに関しては、これまでの検討を踏まえて第三者による利用時に必要なセキュリティー水準等、技術的な対応の内容についてどう考えるかという点が論点になろうかと考えております。
資料1につきましては、こうした論点に沿いまして構成をしております。
まず2ページでございます。これは現在のデータベースの概要を絵で示したものでございます。NDBと介護DBそれぞれございまして、NDBに関して申しますとオープンデータという形でデータの公表を行っているほか、第三者提供としてオンサイトセンターを活用した提供、また、特別抽出やサンプリングデータセットといった形での提供を行っています。介護DBは、第三者提供につきまして、先回、御説明させていただきましたとおり、年内に第1回の審査を行い、今年度中に提供開始予定していうことで現在、作業が進められているという段階でございます。
3ページ以降、まずはオープンデータ、サンプリングデータセットあるいはオンサイトリサーチセンターについての現状を資料としてまとめております。
まずオープンデータでございます。5ページをお開きいただければと思います。オープンデータにつきましては、このNDBは悉皆性が高いレセプト情報で非常に有用なデータが含まれており、今後、多くの研究者の方による利用を想定しているわけですけれども、研究者の中には必ずしも詳細な個票データを必要とされていない方もいらっしゃいます。こうしたニーズに対しては汎用性が高くて、さまざまなニーズに一定程度応える基礎的な集計表を作成して公表していくことで応えていくことが必要ではないかという観点から、オープンデータの提供を行っております。
6ページに具体的な個票の一例を示しております。上段にありますように、集計表の形式で公表しておりまして、これは厚生労働省のホームページからアクセスできまして、この場合ですと薬効分類に従って医薬品名それぞれに都道府県ごとの算定の状況が出ているわけです。同様に医科点数表ごとの各都道府県ごとの状況などを集計表形式で提供し、ダウンロードして御利用いただけるようにしているところでございます。
また、下段にありますように、各項目のうち回数の多い項目につきましては、解説のような形で取りまとめており、グラフ化してわかりやすく説明を付して、御利用に供してございます。
具体的な項目につきましては7ページでございます。このようなオープンデータの取り組みというのは、28年から行っており、ことしで3回目になりますが、1回目から毎回内容を充実させてきているところです。充実させるに当たりましては、厚生労働省ホームページにおいて要望を募集し、有識者の皆様からの御意見も踏まえた上で、項目を追加して、利用に供しているという状況です。
9ページをお開きいただけると、具体的にどのような形で公開しているかという、厚生労働省のホームページの状況が出ております。このような形で1回から3回までのオープンデータが出ており、さらにクリックしていくとそれぞれのデータにアクセスできるという形になっております。
一方、介護の分につきましては、介護DBとしてオープンデータという形での公表はしておりません。月間、年間の介護レセプト情報をもとに年齢別、都道府県別のサービス算定件数等を介護給付費実態調査、公的統計として集計し、公表しています。
以上がオープンデータという形で提供しているデータの現状でございます。
続きまして11ページをお開きいただければと思います。11ページはサンプリングデータセットというものでございます。これは試行的な分析あるいは探索的なデータ分析のためのデータを提供しているという取り組みです。具体的には12ページをお開きいただければと思います。
NDBの第三者提供におきましては、利用者のニーズに応じて利用形態を設定し、それぞれの必要なセキュリティー環境等の要件を設定しています。表にありますように3類型ございますけれども、一番左側の特別抽出というのは、いわばオーダーメードの抽出で、研究者の申し出、要望に応じ、データベースの全データの中から該当する個票の情報を抽出して、提供しております。想定される利用者像としては、レセプト研究、レセプトの構造とか、そういうものにきちんと知見がある方が、申出内容や抽出状況を十分吟味された上で大量のデータを高速に処理するようなことを想定してございます。一方でサンプリングデータという形での提供も行っております。こちらにつきましては抽出をして、個人特定の可能性をより低下させる処理を施して、安全性に十分配慮したデータセットで対応してございます。
具体的に申し上げますと、1月、4月、7月、10月という特定の月のデータをあらかじめ抽出しまして、かつ、それにつきましては一定の割合、外来で言うと1%、入院で言うと10%という形で抽出をかけ、さらに希少な傷病名などの項目を除去いたしまして、もともと匿名の情報ではございますけれども、さらに抽出の条件によって個人等が特定される可能性を、その恐れをより減じたものです。研究者の方々は例えば平成27年1月分とか、1月、4月、7月、10月の4回分とか、そのような形で申請をいただいて、データセットを提供するというものでございます。
連続した月のデータになっておりませんので、経過の追跡調査ができないということがございます。また、抽出そのものも外来1%、入院10%という形で一定の割合で抽出をかけていますので、利用者の側で抽出条件を指定できないという制約がかかりますけれども、個人の特定可能性がより抑えられたイージーオーダーといいますか、そういう仕組み、こうした仕組みを設けることで、一方では各種のアクセスの要件等を緩和した形で、研究者の方の利便性に配慮してございます。
想定している利用者像といたしましては、まだこうしたレセプトの研究について十分な経験がない方でしたり、データの特徴や各項目の概要をまず把握したいと考えているような利用者の方などを想定してございます。
13ページに、こうしたデータセットの特徴の違いからサンプリングデータセットにつきましては、利用形態につきまして要件を少し緩和していることを模式的に書いております。特別抽出のようなオーダーメードでお願いされて提供する場合は、あらかじめ申し出られた施錠可能なスペースで入退室の状況も管理して、情報システムへの複写は原則1回切りとする等々、かなり厳しい制約をかけています。けれども、サンプリングデータセットの利用に当たりましては、入退室に係る制限等は置いていなかったり、利用者間での共有を一定程度認めるという形での緩和を行ってございます。
また、14ページにありますように、申し出の手続に当たっては書類の倫理委員会承諾書等、要件を緩和する形でより研究者の方の利用に便に寄与しているということでございます。
15ページ、16ページには、サンプリングデータをもとにした成果の具体例も示しております。このような形で、研究者の方のニーズに合わせて、オーダーメード方式の特別抽出から、イージーオーダーで提供するサンプリングデータセットでの提供という形を行っています。
続きまして、17ページ、オンサイトリサーチセンターについてでございます。NDBのオンサイトリサーチセンターにつきましては、利用される方に安全な解析環境を提供することで、利用者の側で独自に利用環境を準備する負担を軽減することを主な目的として設置しています。また、公表を前提とした研究だけではなくて、探索的な研究のためにも活用されることを念頭に、NDB本体に直接つながる回線も整備しているところです。現在は東京大学、京都大学、厚生労働省において試行運転中で、これはNDBの有識者会議におきましてもオンサイトセンターの利用につきまして、いろいろと御検討いただいて、利便性の向上等を図っています。
資料としては19ページを見ていただきますと、左側がオンサイトセンターを使わない普通の第三者提供となりますけれども、この場合利用者には御自分の研究区画におきまして、セキュリティーをしっかりと確保していただくことを求めています。一方で、なかなか1つの研究のためにNDBの側から求めるセキュリティー環境を確保できないという場合には、右側にあるオンサイトセンターという形で、あらかじめセキュリティー環境を設定したところで御利用いただく、研究者自身がオンサイトセンターに出向いていただいて、利用していただくという形式をとっております。これを現在3カ所、東京大学、京都大学、厚生労働省において提供してございます。
以上がオープンデータ、サンプリングデータセット、オンサイトリサーチセンターという形での情報提供の現状でございます。
続きまして、21ページ、データベースの保守管理の状況につきまして資料をまとめております。
まず22ページは、全体の概要の中での赤線部分の説明でありますけれども、23ページをお開きいただければと思います。NDB、介護DBでは、それぞれ保守管理としてシステム障害の発生を防ぐための予防保守、障害発生時の速やかな復旧作業を実施する体制を設けております。具体的にはアプリケーションソフトウエアの保守からハードウエアの保守、ミドルウエアの保守、性能維持といった、ここに表として掲げておりますような保守管理を業者に委託をして行っています。
24ページはシステムの整備の状況です。これはNDBを例にして出しておりますけれども、NDBにつきましては平成21年度にデータベースを構築の後、システム更改の際に大規模な改修を行っています。また、定期的な集計のためのデータ抽出機能の付加とか、突合IDに係るシステム改修等をニーズの増加や解析の高度化、複雑化を念頭に置いて行ってきています。現在は平成27年度に構築しました第2世代のデータベースシステムを利用していますけれども、これにつきましては近々、システムの更改を予定しています。オンプレミスで国が管理をしている形になっておりますので、そのシステム環境を国のほうでハードウエアから整備いたしまして、一定の期間、5年から6年程度の期間を置いて、大規模な更改を行うという形で対応してきています。
現状のNDBのシステムにつきましては、したがいまして27年度の時点での技術を使ってシステム・データベースを設計しているわけですけれども、これにつきましては高度な解析ニーズ等に対応するために、より高度化が必要ではないかという御意見もいただいています。
例えば25ページにおきましては、このNDB等についての関連研究ということで、次世代のNDBデータベース研究基盤構築に関する研究を、京都大学の黒田先生、医療経済研究機構の満武先生などが行っておられます。
資料としてここには掲げておりませんけれども、例えば現在のNDBの第三者提供におきまして、抽出にかかる時間を見ますと、これは抽出の条件によって全くさまざまではありますが、数日から数カ月かかることもございます。NDBは膨大な量のデータを格納していることに加えまして、レセプトのデータが複雑な構造をとっているので、抽出の条件によっては非常に複雑化をして、長時間を要することがございます。こうした中で少しでも短時間で抽出ができるような仕組みが考えられないかと、研究も行われています。
続きまして、27ページからです。NDB、介護DBの連結解析のための連結キーについて資料を用意しております。
まず27ページは、改めての振り返りになりますけれども、ことし7月の本有識者会議の議論の整理の段階においては、技術面の課題として連結解析するに当たってどうするかということで、現行はそれぞれ匿名化されたデータベースに収載されていて、それぞれで匿名化に用いる情報項目や識別子の生成方法が異なり、連結解析を現時点では行うことができないということです。ですが、今後の方向性として匿名での連結解析という前提を踏まえ、医療保険及び介護保険の両制度のレセプト等で共通に収集している情報項目、氏名、生年月日、性別の3情報をもとに共通の識別子を生成し、連結キーとして活用することで匿名情報としての性質を維持した上で、連結解析を可能とすべきである。また、その上でさらに技術面の環境整備等に応じて、匿名情報としての性質を維持した上で識別、連結の精度の向上につながる方策(個人単位被保険者番号の活用等)についても今後、引き続き検討すべきであるという取りまとめをいただいてございます。
現在の状況ですけれども、29ページをお開きいただければと思います。これは既に何度かお示ししている資料でございますが、NDBの収集経路と匿名化処理の状況でございます。レセプト情報と特定健診等情報につきまして、それぞれ図にありますような形で匿名化処理を行っております。ハッシュ関数を用いた匿名化処理を行っているところでございます。
また、30ページにおきましては、介護DBの収集経路と匿名化処理の状況をお示ししております。
お開きいただいて31ページに、ハッシュ値を作成する際の情報項目について整理しておりますが、現在ではNDBの場合は赤で囲っている項目、漢字での氏名、性別、生年月日、医療保険の記号、番号を用いましてハッシュ値を生成して匿名化処理を行っています。一方、介護DBにつきましては、介護保険の保険者番号、被保険者番号をもとにハッシュ化をして、匿名化処理をしているところでございます。
今後の方向性としては、青で囲みました共通して収集している仮名による氏名、性別、生年月日を用いて連結キーとしていくことが考えられるのではないかということです。ただし、仮名による氏名、性別、生年月日を活用してハッシュ値を生成する場合には、レセプトの記載誤りなど連結精度に一定の限界があることにも留意いただく必要があろうかと考えており、その意味で、その先には7月の整理でございましたように、識別、連結の精度の向上につながる方策について、さらに検討すべきであるという御指摘をいただいてございます。
32ページには、その関連として被保険者番号の個人単位化に関し現在示されているスケジュールをお示ししているところです。被保険者番号個人単位化の欄の一番右側でございますけれども、個人単位の被保番によるレセプト請求につきましては2021年度4月以降、請求が行われていくことを、今後関係者の調整で変わり得るものでございますが、現時点としては予定しているところでございます。そうしたものが実現した暁には、この連結にどのように活用していくか御議論の対象に、今後検討していく必要があると思っています。
最後に4点目、セキュリティーの関係です。34ページに利用者が確保すべきセキュリティーとして、オーダーメードの特別抽出の場合にそれぞれの利用者の方にお願いをしている、求めているセキュリティーの状況、また、サンプリングや集計表情報という形で情報提供する場合に求めているセキュリティーの状況についてお示ししております。特別抽出の場合には、データ利用者の限定から始まり、データ分析のための専用室などを設けていただいて、専用室への入退室の管理等も行う形で厳重な管理をお願いしてございます。
35ページに具体的なNDBデータ利用のために利用者が用意する必要のある環境を示しております。このような厳格な取り扱いをお願いしているために、一方でオンサイトセンターという形で、利用者の利便に供そうとしているのは先ほど御説明したおりでございます。
また、システム上のセキュリティーといたしましては、36ページに掲げておりますような複数のセキュリティー対策を講じてございます。アクセスの制御、証跡管理、暗号化対策等を行っていまして、こうしたセキュリティーを講じることで、データベースなり情報が不用意に流出することがないように対策を講じているところでございます。
最後、資料1、資料2とあわせて机上に配付いたしました資料について、簡単に御説明させていただきます。
これまで御議論いただいておりまして、また、この間、御説明してきましたとおり、解析基盤について今、御議論をいただいているわけでございますが、この解析基盤につきましてはNDB、介護DBはそれぞれ独立したデータベースとして運用しつつ、安全性、公益性の観点から適切なデータについて、解析基盤において一元的に提供することを想定しております。この解析基盤について一元的に提供するに当たっては、クラウドの利用ということも考えられるのではないかということは、先日お話したとおりでございます。
また、オンサイトリサーチセンターの活用によりまして、機密性の高い解析作業場所の確保ですとか、大規模な解析処理の高速化ということも同時に必要ではないかと考えております。
解析基盤の持つ機能といたしましては、第三者提供に合わせて、申請の窓口や研修等の機能につきましても提供していくことが考えられるのではないかと考えており、こうしたこれまでの議論に上がってきたもの、あるいは御説明してきたものを簡単にまとめますと、以下にあるようなものになろうかと考えているところです。冒頭申し上げましたように、これは今後の御議論を踏まえてさらにブラッシュアップしていくものと考えているところです。
以上でございます。よろしくお願いいたします。
○遠藤座長 ありがとうございました。
それでは、資料2「さらに検討が必要な論点(案)」に記されました論点の順番に従って、構成員の皆様から御議論をいただきたいと思います。
資料2でございますけれども、まずは1ページにあります論点2-1、2-2、2-3について御意見を頂戴できればと思いますが、いかがでございましょうか。山本座長代理、お願いします。
○山本座長代理 皆様が考えている間に、まず2-1でオープンデータの話なのですが、例えば、介護保険でも資料1の10ページ目に統計情報を公表しているという、いわゆるオープンデータの形の介護DBもありますが、NDBのオープンデータの本質的な特徴は、常に利用される方の意見を聴取して、1回目、2回目、3回目の項目がふえてきていますし、変わってきています。集めている側の都合で出しているわけではなくて、皆さんの希望を聞いて出しているというところが1つの特徴だと思うのです。したがって、連結しても最初から物すごく充実したものは多分できないと思いますが、それとオープンデータは絶対に安全でないといけないというのが大前提ですので、絶対に安全でかなり保守的なオープンデータをつくっておいて、その後いろいろな方々の意見を広く聞いて、それを少しずつ充実させていくという道筋が大事ではないかと思います。
○遠藤座長 どうもありがとうございます。
石川構成員、どうぞ。
○石川構成員 質問なのですが、オープンデータにしてもこれは介護DBそのものでオープンデータではなくて、連結したものも含めてオープンデータなのですか。私は前から言っていますように、介護DBでの利用というのがまだ余り具体的には行っておらないわけで、そういう点では介護DBもデータベースとしては小さいわけですから、これのオープンデータベースをやってみて、それで連結したものも含めてやるというのも1つの手だと思うのですが、いかがでしょうか。
○遠藤座長 事務局、お願いします。
○木内室長 今、山本先生からもお話のあったことにも関連しますが、オープンデータについて、そもそもどういうところにニーズがあるのかというところの議論、確かに介護につきましては、第三者提供自体まだこれからということもございまして、そこのあたりの利用の仕方といったところは、よく見ていく必要があるのかなと思います。
そういう意味では連結についても同様に、どのようなものがオープンデータとして求められているのかというところは、検討が必要かと思っております。
○遠藤座長 石川構成員、どうですか。
○石川構成員 資料2の7ページ目にあるように、例えばNDBオープンデータの公表項目の充実というのは、第1回目から2回目、3回目と進化してきていますね。つまりそれと同じように、介護データベースというのがどのような内容なのかということも含めて皆さんに知っていただく、研究者に知っていただくということも含めて、これともちろん違いますが、こういった形で順を追って少しずつ介護DBとしてやっていく、研究していく。なおさらNDBと連結した形でのものがいきなりオープンデータで出せるほどイメージが豊かということはないと思うので、ぜひそのようにやってもらえればいいかなと思っています。
○遠藤座長 重要な御指摘だと思います。
事務局どうぞ。
○眞鍋課長 石川構成員、ありがとうございました。NDBに比べまして介護DBはお兄さんと弟みたいな感じで、まだ発展の途中だと思っております。このように先ほど山本先生からありましたように、利用者のリクエストをちゃんと踏まえてオープンデータをつくっていくこと自体は、私どもも検討していかなければいけないと思っておりまして、その先に連結したものができるかどうかというのは、また検討があるのだろうと思いますけれども、まずはそのように進めさせていただきたいと思っております。
○遠藤座長 よろしくお願いします。
ほかに何かございますか。では、海老名構成員、どうぞ。
○海老名構成員 意見といいますか、自治体もデータを使わせていただく立場なのですけれども、前回の議論にも通じるところがあると思うのですが、事務局のほうではオープンデータとか、あるいはサンプリングデータとか、オンサイトセンターとか、いろいろな形で使いやすい形態を御準備いただいていると思うのですが、使う側にしてみると、サンプリングデータはそれが済むのではないかとか、オンサイトリサーチセンターで使うようなデータでないとできないのかとか、そういったところが十分教えていただけると、先ほど特別抽出だと数カ月かかるようなものもあるというお話がありましたので、もっと効率的に利用できるのではないかと思います。前回の議論に続くのだと思いますけれども、やはり研究者といいますか、ユーザーのほうにこういう形で使えるのではないですかというような御提案をしていただくような仕組みがあると、よりいいのかなと思いましたので、これは意見でございます。
○遠藤座長 御意見として承りました。ありがとうございます。
それでは、またあれば戻るということにさせていただきまして、次いで2ページの論点2-4について何か御意見ございますか。田中構成員、どうぞ。
○田中構成員 技術的なことは詳しくないのであれですが、近年の技術革新というのは目覚ましくて、医療機器とか創薬の分野でも非常にいろいろなものが進んでいまして、人工知能の活用といった部分も世界的にもいろいろな分野で活用され始めています。
数年先の技術がどのように変わっていくのかということを考えると、スケジュールで出ていましたように、例えばオンライン資格確認が2021年に始まりますよと言うと、国保で言うと中間サーバーがないし、クラウド化していくところが取り組まなければいけないというのが一方であります。片やこちらのほうで新たな取り組みをしていくことで、先駆的な技術や研究成果を随時取り込んで、DBそのものを進化させていって機能を充実していくという、すばらしいことだと思うのですが、これにより例えば自治体の負担がいつごろに、どのくらいの規模で発生するのかという予見的なものもぜひ機能強化とあわせてスケジュールの中で示していただくということをしていかないと、なかなかいろいろなものに対応していく。国保連合会のほうも審査の9割を機械化するなど審査方法が変化することにより,審査体制の見直しや新に都道府県が国保保険者となるなど、国保連合会の市町村事務支援や保険者協議会事務局として役割そのものも変わらなければならないとか、いろいろなものが出てきますので、ぜひともそういったところは議論の折々にテーマとして挙げていただきたいということは、要望として挙げておきたいと思います。
以上です。
○遠藤座長 ありがとうございました。
それでは、葛西参与、お願いいたします。
○葛西参与 これは私のITというバックグラウンドからの意見ではあるのですが、現状のNDBの構造は事務局でも説明があったとおりで、もともと扱っているデータの構造体、レセプトのデータの構造体が非常に複雑であるがゆえに、データの抽出にかなり時間がかかっている。これを速くするということに対して、きょうの資料の25ページ目に、この方式が私はベストだとかいう話では全然なくて、私は別にこの研究に参加しているわけでも何でもないので、ただ、どちらも共通してやられていたのが、構造に依存しない形のデータベースです。データベースの根本的なあり方を構造型データベースではなくて、非構造型のデータベースを活用していたというのが実態であって、恐らく根本から構造型ではないものの考え方を施行しないと、速くはならないのではないかなというのは一応、私の専門的な意見ではございます。
もう一点、誤解のないようにお伝えしておかなければいけないのが、前回クラウドというお話があったので、クラウドというのはかなりコンセプトの幅が広いので、データベースあればプラットフォームもありますし、いろいろなものがあるので、安易にクラウドをすぐ採用するしないという議論には多分ならないでしょうし、そのクラウドの中の何を使う、使わないというのはもう少し精密な議論は多分必要だろうなと。そこは多分慎重にしないといけないなとは思っております。
結構データベースをクラウドに乗せたら速くなるとか不思議な、それはそういう場合もあると思うのですが、かなりアグレッシブに方式を決めてしまわないように検証しながら、かつ、でも現状のデータベースの構造というのは抜本的に見直すということを両方にらんでやったほうがいいのではないかということを気にしておりますというか、私自身もそういう方向で検討しているところでございます。
○遠藤座長 どうもありがとうございます。
それでは、何かあればまた戻っていただくということで、3ページにまいりましょうか。3ページの論点2-5と2-6について何か御意見があればお願いします。
○山本座長代理 資料1の31ページに仮名の氏名を使ったハッシュを新たに作って、当面結びつけていこうと。これだと2020年まで待たなくても、今年4月からレセプトには必ず氏名が入っていますから、少なくとも4月以降あるいはずっと前からレセプトがある人は、氏名を使えば遡って同じ人を結びつけることが可能という意味では現実的な解ですし、もう一つ気になるのは、これとは別の医療等分野情報連携基盤検討会で1人1番号化されたものをベースにして、それぞれのデータベースにそれぞれの1変換したハッシュ値をつけているという絵があって、その絵の中には実は2つのデータベースに同じハッシュ値が入っているという意味では余り変わらない。安全性という面から見ると余り変わらなくて、つまりデータセットとして抽出されたものがどこかにコピーが残っていると、ずっと同じ連結子が残ったデータセットが沢山できてくるわけで、後でそれを全部合わせると、全て連結したデータベースを大きくすることができるという、絶対的な安全性の欠如が起こり得るわけです。
それを阻止する為にはそれぞれのデータベースの識別子は変えておかなければならず、変えた上で突合できる識別子というもの、いわゆるマイナンバー制度による機関別符号の役割と同じ仕組みにしておかないと、データセットを突合するリスクの増大というのは抑えられないのです。そういう意味では、ここに書かれているのも、今の別の会議で検討されているのも、そこの議論が不十分ですので、それを踏まえると更に検討しなければいけないという点があるのだと思うのです。
そうしないと電子データはどこかにコピーが残る可能性が必ずありますので、そういう意味ではそれぞれの研究者のデータが各々残っていて、それが突合されると非常にリスクが大きくなるという危険性があると思うのです。ここに留意して検討というのはそのとおりだと思うのですけれども、その検討の中にさらに安全な扱いを含めて検討することがあったほうがいいと思います。現状まだそこは検討が不十分だと思っています。
○遠藤座長 ありがとうございました。
どうぞ。
○国民健康保険中央会 厚労省さんに教えていただきたいことがありまして、きょう机上に配られたこのイメージなのですが、今回論議している連結するというような機能、仕組みをどこにどう配置するかが、このイメージだと私はわからなくて。極端に言うと現在、被保険者番号の枝番をつけて統一しましょうということで言うと、それぞれのデータに振ってあるので、あとは利用者側がそのコードを使って勝手にやりなさいというようなイメージなのか、真ん中にあるクラウド上にデータを置かれるので、それぞれ処理しやすいようにクラウドの中に何らかの仕組みをもってデータを連結しておくという形なのか。
この絵で言うとオンサイトセンターが別立てに立っているので、NDB、介護DBを提供する現在の厚労側の絵になると思うのですが、一番下のところで何らかの仕組みを持つというイメージなのか、どのような前提で書かれているのか教えていただきたいのですが。
○遠藤座長 事務局お願いします。
○廣瀬室長 足りない部分は、葛西参与からも補足があったほうがいいのかもしれませんが、あらかじめデータを連結した状態でどこかに保管をしておくか、それとも御利用いただく方々自身にデータ連結の作業をやっていただくか、事務方でも当面その2つのやり方が想定し得ると考えております。具体的な方法については、今後の議論の中で深めていくものと考えております。
○宮崎課長 当然、匿名化されるのは先に匿名化されているわけです。ハッシュをかけたものが利用者の方の個別のニーズに応じて既に連結した形でデータセットをお渡しするのか、それぞれハッシュをかけ当然匿名化されているわけですが、NDBから出てきたデータセットと介護DBから出てきたデータセット、それぞれ置いて、それを研究者の方のほうで解析されるのか、それは両方あり得るだろう。いずれにせよハッシュをかけてというのは当然、もとのほうでやってということでございます。
○遠藤座長 葛西参与、お願いします。
○葛西参与 簡単にだけ補足をすると、恐らく解析をされている方は実態で言うと、別に全量の全国民のIDを全部連結したいという方はほぼいないというか、考えにくくて、そうなると多分お立場からすると、例えば被保番のシステムを今クラウド上に乗せることと関係するのかとか、そういうことを気にされていると思うのですが、それは余り考えにくいかなというのが1つです。
もう一点言うと、クラウドについて私は別に方式の1つだとはもちろん十分理解しているのですが、実はもう少し複雑でございまして、政府で決められているルールもあります。それから、クラウドというのは成長過程の技術なので、ちょうどセキュリティーのところでも1個お伝えしておきたいことがあるのですが、クラウドのセキュリティーを例えば可視化することができなかったり、クラウドはブラックボックスですので、そういうことを担保するようなセキュリティー技術が適用されない限りは、そこにハッシュがかかっているからといって個人の情報をすっと乗っけるかというと、そこまでは飛びません。一方、そういう技術ができてきているのも確かなので、それは両にらみです。
ただ、最初の話ですけれども、全ての個人の情報をハッシュ化してようがしてなかろうが、クラウド上、1カ所に集めておくことはないのではないか。研究上ないのではないか。まさに今、台帳を使われて研究されている方が多いので、それと同じようなモデルでデータセットができるのではないかと思います。
○遠藤座長 どうもありがとうございました。
どうでしょう。石川構成員、どうぞ。
○石川構成員 31ページ目の連結のことについては、まだ十分に話はできていないですね。議論は十分ではないですね。そのように考えているのですけれども、この技術的な2-5というのは、連結解析のための技術的な対応については、まだ詳細が例えば氏名、性別、生年月日だとか、ハッシュ値を生成ということが書いてありますが、本当にこれでいいかどうかということについてはまだ結論ではないですね。どうなのでしょうか。
○遠藤座長 事務局お願いします。
○宮崎課長 7月の時点での整理といたしましては、今集めている情報をもとに考えますと、共通して収集している情報項目、氏名、生年月日、性別をもとに連結解析をまず可能としていくべきではないかということであります。ただ、この間、きょうの御議論でも出ておりますように、匿名情報、もう一方で個人単位被保険者番号等の活用についても御議論が別途進んでおりますので、こうした状況も踏まえてさらなる検討が必要だというのも事実であります。
また、前段の部分につきましても、単にこれだけでつくれるものではありませんので、具体的な制度の設計にはさらに内部的な検討等は必要であろうと思いますけれども、方向性といたしましては第1段階として、3情報をもとに共通の識別子を用いて連結解析を可能としていくということでの御議論をいただいたものと受けとめております。
○遠藤座長 山本座長代理、どうぞ。
○山本座長代理 1番号化された被保番を待てないというのはそのとおりだと思うので、だからといって仮名氏名と性別、生年月日でNDBと介護DBを同じシードでハッシュをかける。つまり同じ値が入ってくるというふうにするのか、あるいは異なるシードでハッシュをかけて、値は違うのだけれども、シードさえハードウェアセキュリティモジュールの中できちんと保存されていれば突合はできるんだという話にするかは、まだ多分結論は出ていないというか、実装の問題だと思うのです。その2つによって安全性が異なってくるので、そこの議論はもう少し多分実際にやるときには詰めたほうがいいと思います。
○遠藤座長 石川構成員、どうぞ。
○石川構成員 ですから、そのデータベースの格納の仕方といいますか、どこにストレージするのかということについても、要するにこれは利用者のオーダーによって、研究の材料をどうするかによって、そのたびにやるしかないのではないかと思うのです。連結するしかないのではないかと、今までこれが出てきたときはそういうイメージでした。
高木さんのやっているオンライン資格確認だとかそちらのほうは、もう少し時間がかかるので、それでずっと私が一連の発表で発言しているように、介護DBを早く使ったらというのが出てくるのです。このところがまだきっと難しいのです。議論は私たちもこの8年の間、NDBで一生懸命大事に議論してきたことが、ここで突如として何か緩くなっては嫌なのです。ですからここも厳重にしたい、連結も厳重にしたいということも含めて、もう一回、2回、ここだけの議論というのは技術的なところでもやってもらって、提案してもらいたいと思います。
○宮崎課長 今、山本構成員、石川構成員からそれぞれお話がございましたように、1つには研究者からの実際のニーズに応じて、何か先に提供ありきではなくて、研究者のニーズに合わせて提供していくものですし、それまでには道筋があって、段階を踏んでやっていくものだと考えております。今、御指摘いただいた点を踏まえて実際の実装までの間にはさらに1段、2段の検討が必要だと思います。
そうした点につきましては、システムの面で言えば具体的な仕組みをもう少し検討した上でないと明らかにならない部分がありますし、また、石川構成員の御指摘のように、そもそも介護のほうの第三者提供もことしから始まるという段階でありますので、研究者の側のニーズがそれについてどうなるのか。また、連結したものについてのニーズがどういうふうになるのかというのを見ながら、どういう提供の仕方があるのかということは考えていくものだと思っています。きちんとその辺は提供ありきではありませんので、よくニーズを踏まえながら、また具体的な検討を1段、2段としていく必要があると思っております。
○遠藤座長 全体で結構ですけれども、何かございますか。山本座長代理、どうぞ。
○山本座長代理 机上配付の7という番号の書いた図ですけれども、これからシステムのやり方を考えていく上ではかなり整理がついた絵だと思うのですが、若干もう少し軸をきっちり定めた上で整理をしたほうがよくて、データベースを利用者に対して1つは公表つまりオープンデータです。公表で、ここでいう汎用性の高い公表データ。これは公表ですから無審査ですし、相手を特定しないで誰でも見られる状態にするということで、もちろん大事な1つの方法だと思います。
もう一つの第三者提供、研究者の解析環境とオンサイトリサーチセンターが並べて書いてあるのですが、現在のNDBで言うといわゆる特別抽出によるデータセットの提供というものがあって、これは研究者とそれなりに契約を結んだ、取り扱いの約束をした上でデータをDVDなりで提供しているわけです。それとオンサイトセンターの間に本当はもう一つあって、データを提供しないで分析できる環境を提供する。データ自体は研究者の手元には行かない。研究者はそれを操作できるだけだという、これは米国のCMSでやっているバーチャルリサーチデータセンターという仕組みがそうで、利用者がどんどんふえているそうで、かなり自由に使えるのですが、欠点としてはシステム側が用意した解析ツールしか使えない。米国のCMSのバーチャルリサーチデータセンターの場合は、特別な統計処理ソフトしか使えない。研究者はその統計処理ソフトの技術者を雇わないと使えないみたいなところがあって、若干それが問題だと言われていますが、そこは安全性とのバーターなのです。つまり、何でもできるとどうしてもセキュリティーが弱くなる。しかし、研究者の研究室で操作をすることはできる。オンサイトリサーチセンターはそれより厳しくて、周りの環境も、後ろから覗かれるなどといった環境を絶対に認めないので、そこに来てもらうわけです。そういう環境のセキュリティーの話と、データセットの話は別のレイヤーとして分けて考えたほうがいいと思うのです。
葛西さんがいる前でセキュリティーを話すのもなんですが、セキュリティーとはシステムとネットワークと人間で規定されます。一番弱いのは人間です。例えば、人が扱ってCD-ROMやDVDを持って運んだり、病院のデータのセキュリティー事故というのも、ほとんどは医師がパソコンに入ったデータを持って歩いていてパソコンを盗まれたとか、あるいはCD-ROMがどこかにいってわからないとか、USBがポケットに入ったままクリーニングに出してしまったようなことがほとんどなのです。実際にシステムから漏えいすることはほとんどない。これはシステムのほうがそれなりに論理的に考えているからで、人間の行動は論理的に考えられないので、何をするかわからないところがあるのです。そういう面も含めて、人にどれだけその負担をかける話あるいは人をどれだけ信用しなければいけない話というのと、この提供の環境というのをきちんとレイヤーを分けて図にしていただけると、多分わかりやすくなると思います。
ここで言うと、例えばオンサイトセンターだけがこのクラウドのほうに行っていないというのは現状のオンサイトセンターの認識があるのだと思います。現状のオンサイトセンターはちょっと変わっていて、オンサイトセンターに入ってしまうとNDBを全部触れるという状況になっていて、本当はそんな必要は絶対になくて、分析に応じたデータセットを本来つくっていいはずなのです。ただ、そのデータセットは非常にリスクがあるので、オンサイトセンターに来ていただかないと触れませんというだけの話で、この分け方が少しねじれているような気がしますから、そこも考えて整理していただければと思います。
○遠藤座長 ありがとうございます。
全体で結構でございます。きょうの問いかけ、どうもデータベースにある程度知識がないと、あるいはIT技術にある程度知識がないと、なかなか答えられないような問いかけが出ていまして、どう見ても構成員のメンバーと若干のミスマッチがあるかなという感じもあるものですから、むしろその辺は取っ払って制度論の御意見でも結構でございますので、先ほど来、少し出ていましたけれども、御自由に御意見をいただければと思います。
樋口構成員、どうぞ。
○樋口構成員 励まされたので、でも2点だけにします。余り長くしゃべるといけないので。
今、山本さんがおっしゃったことで、机上配付というものの図でも、ほかのところでも同じ図が出ていて、オープンデータ、オンサイト、第三者提供、3つ方法があります。今のお話だと、アメリカ等ではオンサイトと第三者提供の間にバーチャル何とかという、私はこういう研究はきっと一生することもないと思うのだけれども、仮に研究者の立場に立って考えると、自分のところで提供してもらうのはありがたいけれども、先ほどの説明であったように、物すごく重装備の安全とか何とかいうのをやらなければいけないというと、そこだけで腰が砕ける。それはやらなくていいですよというのでオンサイトというと、絶対に行かないといけないわけですね。それはまたそれで腰の重い人間にとってはという。そうするとバーチャル何とかというので、その真ん中というのをどこかの国でやっているのなら、それはそれで選択肢の一つとして考えておいてもらわないといけないのでなはいかというような気がするのですが、それは時期尚早というか、こういうものを走らせてみてということなのかどうか。これが1点です。
2つ目は、これはシステムの問題だと思うのですけれども、こうやって幾つか選択肢、まず根本的な問題は、研究者のニーズに合わせてというので、こういうすごいデータがあるんです。どんどん研究してくださいというので、私は基本的な態度というか立場としてはそれでいいのだと思うのです。研究の自由、学問の自由というので、それが社会の利益につながるということがあれば一番いいわけで、それで自由な研究。そうすると今、考えると、この時点で考えると、そんなことやったって意味ないんじゃないかと思うようなものが、10年たったらわからないということもありますから、だからそうやって自由にというのもあるのですけれども、一方では医療、介護を所管している厚労省あるいは市町村も含めてだと思うのですが、公共団体がこのデータを何とかこういう形で利用して、その結果、何が出てくるかということも当然ありますね。結局こういうデータに基づく政策をつくっていくんだというところの、そちらのほうの話というのがあくまで研究者ニーズに合わせてこういう提供をするというだけしか出てこないというのは、それはまた別のところでというか、当然、政策部門で厚労省あるいはそれぞれの自治体で考えるべきことだから、こういうところで、つまり問題を切り分けていて、研究者用の自由な研究に使えるところだけをここでは議論しているというふうに、こちらのほうはとりあえず忘れればいいのだろうかというのが第2点なのです。
ついでに3つ目は、先ほどの3分類なんかは私素人にはわかりやすいのです。オープンデータで研究してもらいますという話と、第三者提供で一応何かカスタマイズされたものをつくってもらってやるというのと、オンサイト割に広いデータベースについて、しかし、それは安全性もあるからというのはわかりやすいのですけれども、結局それぞれがどういう影響あるいは効果を、効果は簡単にわからないかもしれないのですが、どういう成果が出てきてというのはやはりチェックすべき事柄だと思うのです。研究の自由は自由として、その結果どういう研究が出てきましたという話があっていいので、そうするとオープンデータというものだと全く何もわからないようなことで制度的にはいいのかもしれないのですけれども、だから入るときは自由でいいのですが、出てきたものについて何か報告してもらうとか、何かここがこういうことに結びついていますよというものも出てくるような制度設計があってもいいような気がするのです。これが3つ目です。
コメントと質問とごちゃごちゃだったかもしれません。
○遠藤座長 では、質問に対する答えと、コメントに対するコメントがあればぜひお願いします。
○宮崎課長 まずNDB、介護DBともに国が法律の規定に基づいて収集しているものでありますので、その利用に関しても当然公益が前提となっておりますし、7月の議論の整理でも公益目的での利用ということは議論の前提になっていたと認識しておりますので、そういう意味で研究者のニーズを踏まえてではありますけれども、何でもかんでもということではもちろんない。その制約があるということであります。
そして樋口構成員御指摘の点で言いますと、例えばNDBではもともと法律の本来目的というものがありまして、医療費適正化計画の作成、実施等のために収集するというものがございまして、そのための都道府県等での利用というのがまずありまして、その上で第三者提供という形でのいろいろな御利用もされている。今回の有識者会議の御議論につきましては、こちらの第三者提供の議論に焦点が当たってはおりますけれども、当然、法定の各都道府県等での計画の作成、実施、PDCAを回す上での利用というものが当然ある。だからこそ国が法律に基づいて収集をしているということであります。
その上で、さらに国民の保健の向上など公益の観点から、どのような利用が考えられるのかということで御議論いただいているものと思っております。決して公的な利用の部分をおろそかにするのではなくて、そこはそこできちんとした上で、さらに公益目的のためにどのような活用ができるかということで御議論いただいているものと思っております。
○樋口構成員 第1点の3つというのではなくて、4番目のバーチャルオンサイトリサーチみたいなものですかね。そういうものの可能性は考えておられないのですか。例えば東大と京大という話がありましたね。やはり北海道の人だって研究したいというときにオンサイトと言われて、もちろん近いですけれども、やってこいという感じかもしれないですが、何か別の。かつ、安全性もあるという何かがあるのであれば、そういう道もあってもいいのかなと山本さんの話を聞いて感じたものだから。
○宮崎課長 山本座長代理からも何度か御紹介をいただいておりまして、そのような形態をとっている実例がございますので、将来的にそういうものを、端から否定するものではないのですが、現時点で申しますと何かそういうものを具体に想定して検討している状態ではありません。予算ですとかいろいろ具体的な安全性確保はどうなるのかというところもございますので。
ただ、一方でオンサイトリサーチセンターにつきましては、私どもに聞こえてくる声としては、まさに樋口構成員御指摘のように東京と京都にしかないのでは不便なのではないかと。同じスペックかどうかは別として、もう少しアクセスしやすいところにふやすべきではないかという御意見をいただいたりということはございます。
○遠藤座長 ほかに何か御意見ございますか。田中構成員、どうぞ。
○田中構成員 今の話ですけれども、今のNDBでいくと自治体の使用割合はすごく少ない。170件ぐらいですごく少ない割合です。ゆくゆく第三者提供で市町村も見てねというのが前回の話だったと思うのですが、今のお話を聞くと、例えば自治体向けのそういうバーチャルな場所があって、定例的なものでいわゆる医療費適正化計画だったらこんなものを見てくださいとか、介護だったらこんなものを見てくださいというものがあって、それを見に行ける環境というものがあると随分違うのかなと思いました。
それは当然、第三者提供に当たるのかどうなのかわかりませんけれども、そうすると費用負担のところにも話が飛んでいってしまって、そもそもの法律というのは医療費適正化計画だったり介護保険事業計画、これに資するものについては本来は入れないよというイメージがあるのです。ところが、第三者提供で使いますよとなったら、それは別途お金が要りますよという話になってきて、どこまでを自治体が利用する場合は費用負担すればいいのかというところに行きつくと思います。そういう話と、先ほど言った見に行きたいときに行ける場所があるというのが非常に大事かなと。
この話をし出すと研修の話になってきて、自治体職員はローテーションで変わっていきますから、定期的に国の研修を受けなければいけないと思うのですが、せっかく基金と中央会でオンライン資格確認なんかでもデータを共有してやっていこうとやっていますから、例えば審査支払が90%は機械化で審査しますよとなったときに、今の審査体制は要らなくなる。随分軽減されてくるわけです。そうすると例えば市町村の場合だと介護も後期も国保も連合会に委託していますから、連合会が一定、職員向けに情報提供やアドバイスをしていったりとか、それができる環境にシフトしていっていただくようなことを例えば中央会と一緒になってそのようにしていただくと、わざわざ研修に行くとしても、そこに行かなくても連合会の職員とのやりとりの中で、このデータを見るとこうですよという話ができる環境というのが将来的にできていくと、随分と47都道府県では楽になっていくと思います。
ですからそう考えると、連合会が将来的にはそちらのほうに幾分シフトしていくことで、市町村の計画の進捗だったり現在の状況を確認していくというのは随分やりやすくなってくると思うし、ローテーションで変わっていくとどうしても薄まっていってしまうところが出てきますので、連合会だとローテーションが少ないですから、そういった形を整えていただくと医療費適正化とか、そういう社会保障の全体像をどうするんだと。
もう一つ言うと、保険者協議会の事務局が担っています。ということは、県も一緒になって医療機関等々の話の中でこのままでいいのかという話もしやすくなると思うのです。だからそういう意味で言うと連合会の役割というのはそちらのほうにシフトしていったほうが、市町村も助かる、県も助かるというイメージがあるのですけれども、そこら辺はどうなのですか。
○高木室長 NDBについては、適正化計画に活用いただくことになっており、保険者からのデータ登録や管理に関わる部分は厚生労働省で毎年予算も措置しています。さらに、NDBから都道府県の御担当者に医療費適正化計画の実施状況のフォローに資するデータを個別に抽出して提供できるような取組を、今年度からやっていきます。
KDBについては、国保連にあります。被用者データは入っておりませんが、国保連は保険者協議会の事務局も担っていただいていますので、国保中央会では、国立保健医療科学院の先生をお招きして県の方々と47国保連の方々に来ていただいて共同で研修したり、実際にKDBを活用した分析でどのようなことができるのかを共有いただいたりしています。こうした分野で都道府県担当の皆様に活用できるような環境を進めていくことは、非常に重要と思っておりまして、引き続きやっていきたいと思っております。
○国民健康保険中央会 国保中央会の齋藤でございます。
ちょうど今、厚生労働省から説明がありましたとおり、現在、各県の連合会には、データは国保の関係に限られてはいるのですが、既に医療レセプトと特定健診と介護のデータを連携したKDBというシステムを持っています。国保データベースシステム。それで現在は市町村の保険者様宛てに、いろいろな保健事業への推進ということで、それを利用した指導とか相談、コンサルに近いところまでできるように、我々としても活用の方法を指導しておりますので、今、御指摘がありました方向に一歩、近づいていっているのではないかと思っております。
以上でございます。
○遠藤座長 ありがとうございます。
ほかに何か。田中構成員、どうぞ。
○田中構成員 重ねてですけれども、国立人口問題研究所の出した2040年の人口で見ますと、例えば高知県の大川村は議会が成立するかどうかという話題提供をしていますが、あそこが人口170人ぐらいですごく小さな規模になっていってしまいます。
介護保険というのは市町村が保険者で運営していますけれども、何回か前の会で言いましたが、市町村の規模が小さくなるので市町村単位で全てのメニューをフルセットで構えることが無理だとなったときに、総務省では、複数の小規模市町村を一定の圏域を設定して行政事務を考えるという考え方で今、議論がされていると思うのですが、市町村単位で全部見ていくことが不可能な市町村というか、困難な市町村も出てくる。事業そのものも全部構えられない。だから県域でどうなのかというところも見ていく必要があって、それはやはり県の役割で、県としてその圏域をどう見ていくかという、そんな話し合いも一方では必要だと思うのです。
高知市の場合は高齢者の社会増が多いです。介護とか医療が充実していますので県内から集まってきているのです。若者は減っていっているのですけれども、高齢化という意味で言うと社会増加が多いです。そうすると周辺市町村というのはどんどん現役も減るし、高齢者も減っていくという、なかなか厳しい状況が出てくるので、そう考えたときに今、言った市町村単位で全部見ていくというのは苦しいところが出てくるので、そうするとそこにこういう圏域はこうですよというところも連合会だと見られる。そこを県と一緒になってというところの作業もゆくゆくは考えていく必要があるのかなという気がしておりまして、これはコメントでございます。
○遠藤座長 ほかに何かございますか。大体御意見は出尽くしたということでよろしゅうございますか。葛西参与どうぞ。
○葛西参与 今の話でなるほどなと思ったところもあるのですが、具体的にシステムの設計の視点で見るとKDBとNDBは持ち主も違いますし、法律も当然違いますし、確かに機能論としてだんだん重複していくものがあるのであれば、それは同じ方向性を向いていたほうがいいのだろうなという気は、使い勝手としては、そういうことはそう思います。
そのときに2点だけ関係するのが、だんだん結構私としてはどきどきしている面もあるのが、そんなに簡単にハッシュでつないで公表データにして、例えばKDBのようなユースケースで使っていきますというと、どんどん広がるなというのはかなり不安でございまして、それは段階的に施行する必要がありますね。
そのときに1つこれは一参与としての普通の意見なのですけれども、実は匿名化のところの研究は、ここにも何名も使われている方も、研究されている方もいらっしゃるので釈迦に説法なのですが、こういう場でちゃんと言っておかなければいけないので発言しておきたいのですが、いろいろな学会が例えば一般化をして匿名化をするところでいいのか、どこまでやればいいのか、多様性まで見るべきかとか、いろいろな議論をされているという、こういった公表の段階での匿名化に関する安全性の担保というのは、今後このハッシュの検討の際には、ハッシュを最新にするとかは当たり前だと思うのですが、古いハッシュを使うということはないと思うのですが、そういった研究もちゃんと吸収しながら公表していく仕組みが必要だなと。
一方、オープンデータのイニシアチブ、普通に他省もやっているような、産業界がやっているオープンデータのイニシアチブからすると、サイトのつくり方とか、KDBはサイトのつくり方が非常に使いやすいイメージになっていて、NDBはそのように今つくっていないので、そういうサイトのユーザビリティーとかも確保しないと、簡単にトレーニングだけすればいいというものでもないですよねというところは、肝に銘じて設計していかなければいけないなと思っています。
もう一点、これは私の専門性からの発言で、先ほど途中で言ったクラウドなのですけれども、1つは政府が安全性の評価の基準を今つくろうとしているという、これとの互換性は一定とろうと思っております。一方、現実的にはクラウドは可視化であるとかデータの持ち出しチェックとか、例えばセキュリティーポリシーどおり実はパラメーターが設定されていないとか、もっとメジャーなもので言うとI Love Translationって結構有名なのですけれども、契約書の翻訳サイトを使っていたらある企業とか、他省なので言いにくいのですが、日本のある政府の機密文書が普通に翻訳前のデータで出てきてしまったみたいな、このようなことがたくさんありますので、これは例えばガートナーが提唱しているみたいなクラウドアクセスセキュリティーブローカーみたいな、クラウドを中心としたセキュリティー体制をちゃんと確立しないと安易には使えないぞと。一方、そういうことを検討する研究もいろいろな方がやられているようですので、そういう情報も集約しながら進める必要があるなと思っていることは、意見としてもお伝えしておきたいと思います。
○遠藤座長 どうもありがとうございました。貴重な御意見だと思います。
ほかに何かございますか。石川構成員、どうぞ。
○石川構成員 先ほどNDBだとかオンサイトセンターでかなりCPUの能力もあって、何時間あるいは何日もかかるなんて話がありましたけれども、これは連結だとか次のステップになりますと、もっと時間がかかって、オンサイトセンターの限界といいますか、1つしかないとか、そういう限界はすごくあると思うのです。
ただ、そのときに今までNDBのほうで進めてきたサンプリングデータセットだとか、集計表のところでの研究者の方のオーダーの出し方というか、そこをもう少し、今回もNDBのほうは四十何件という集計が出ていましたね。そうすると個票は六十何件で、サンプリングと集計表でそれぞればらついていますね。そういったところの御案内を厚労からきちんとしていけば、少しその負担がオンサイトセンター1つだけとか、2つしかそこにはコンピューターがないとか、そういったことでまたつくるとか大変なので、そういうことは免れるのではないかと思うので、ぜひその辺のところですね。技術的にもサンプリングと集計表の出し方について提案できるような形をしていくというお願いをしたいと思います。
○遠藤座長 ありがとうございます。
ほかに何かございますか。海老名構成員、どうぞ。
○海老名構成員 最後、セキュリティーのところだけ一言、申し上げたいと思うのですけれども、これも意見なのですが、今までNDBはかなり例えばしっかりしたセキュリティーを物理的な形で設定していただいていて、すごくそれは葛西参与とか専門家に言わせれば、そんなのはまだまだ足りないとおっしゃるのかもしれませんけれども、素人目に見るとすごくセキュリティーが担保されているように見えるのですが、当然その時代の流れによって先ほどお話のあるようなクラウドというものが、より現状よりもセキュリティーの度合いが高いというようなお話があるにしても、一般人の受ける印象としては、クラウドというとネットワーク上にあって、大丈夫なのだろうかという不安を持つ方もいらっしゃると思います。国という立場で言えば国民だと思いますが、私ども自治体にしてみれば住民の方々のデータということでありますので、住民の方々が安心してデータを提供いただけるという語弊はありますけれども、使わせていただけるように、仮に今後利便性を高めるという観点で検討されるのであれば、安全性というものを国民に対してしっかりと住民の方に私どもが説明できるような形でお示しをいただけるように要望したいと思っております。
○遠藤座長 ありがとうございます。
ほかに何か。よろしゅうございますか。
それでは、少し予定した時間よりも早うございますけれども、本日はこれぐらいにさせていただきたいと思います。
本日いろいろな御意見をいただきましたので、事務局におかれましては整理、検討していただいて、次回以降の議論に資するようなものにしていただければと思いますので、よろしくお願いします。
それでは、次回の日程等につきまして事務局からお願いします。
○宮崎課長 次回の日程につきましては、詳しくは追って御連絡させていただきたいと思いますけれども、来月下旬に予定させていただきたいと思っております。その際には7月の時点で宿題となっておりました他の公的データベースとの関係についての御議論もお願いしたいと考えているところでございます。
また、お手元にお配りしました机上配付の資料につきましては、冒頭も申し上げましたし、また、先ほど山本構成員から文言を含めてきちんと整理が必要だという御指摘もございましたので、会議後回収という扱いとさせていただきたいと思います。どうぞ御協力よろしくお願いいたします。
○遠藤座長 ありがとうございました。
それでは、本日はこれにて閉会したいと思います。どうもありがとうございます。
 

ホーム> 政策について> 審議会・研究会等> 保険局が実施する検討会等> 医療・介護データ等の解析基盤に関する有識者会議> 第7回医療・介護データ等の解析基盤に関する有識者会議議事録(2018年9月27日)

ページの先頭へ戻る