第16回 匿名医療・介護情報等の提供に関する委員会 議事録

日 時

2024年3月21日(木) 15:00~17:00

場 所

Web

出席者

【委員】
・小野寺 哲夫(日本歯科医師会 常務理事、代理:古山 純)
・川又 竹男(全国健康保険協会 理事、代理:長谷川 功)
・齋藤 俊哉(国民健康保険中央会 理事)
・田尻 泰典(日本薬剤師会 副会長)
・田中 純子(広島大学 大学院医系科学研究科 疫学・疫病制御学 特任教授)
・東宮 秀夫(一般財団法人 医薬品医療機器レギュラトリーサイエンス財団 理事・研修事業本部長)
・長島 公之(日本医師会 常任理事)
・中野 壮陛(公益財団法人医療機器センター 専務理事)
・中野  惠(健康保険組合連合会 参与)
・野口 晴子(早稲田大学政治経済学術院 教授)
・堀 真奈美(東海大学 健康マネジメント学科 教授)
・宮島 香澄(日本テレビ報道局 解説委員)
・山本 隆一(一般財団法人医療情報システム開発センター 理事長)
 

議 題

1. 医療・介護サンプルデータについて 
2. 個別審査(医療・介護連結申出)(非公開)

議 事

※非公開部分は含まれません
 
山本委員長 それでは、定刻を少し過ぎましたので、ただいまより第16回「匿名医療・介護情報等の提供に関する委員会」を開催いたします。
 委員の皆様におかれましては、御多忙の折御参加いただき、ありがとうございます。
 まず、委員の出欠状況について、事務局から報告をお願いいたします。
長嶺課長補佐 老健局老人保健課の長嶺でございます。
 本日も御参加いただき、誠にありがとうございます。
 本日は、委員の皆様全員がウェブ参加となります。
 今村委員、鹿野委員、田尻委員、嵩委員、辻委員、武藤委員、村松委員は御欠席の御連絡をいただいております。
 本日は、川又委員の代理人として長谷川参考人が代理出席となります。
 開催要件を満たしていることを御報告いたします。
 本日は公開の議題がございまして、京都大学の森先生に御発表いただきます。申出の個別審査は非公開の議題となりますので、審査の前に御退室いただきます。
 議事録作成のため、事務局にて録音をさせていただきますので、御了承をお願いいたします。議事録作成後に、録音ファイルは消去いたします。
 続きまして、資料の確認をいたします。議事次第のファイルをお開きください。本日の議事と資料一覧が記載されております。資料はお手元にございますでしょうか。
 本日の資料を画面表示して御説明いたしますが、適宜事務局から送付しております資料もお手元で御参照いただければと存じます。
 御不明な点がございましたら、会議のチャットに書いていただきますか、御発言いただければと存じます。御不明な点はございませんでしょうか。
 よろしければ、山本委員長に進行をお渡しさせていただきます。山本委員長、よろしくお願いいたします。
山本委員長 それでは、早速、本日の議事に入りたいと思います。
 まず、議事1「医療・介護サンプルデータについて」を行います。
 事務局からの説明に引き続いて森先生からの御説明ですね。よろしくお願いいたします。
鈴木室長補佐 医療介護連携政策課です。
 この件は、2022年3月の合同委員会の審査で承諾をいただきました承諾番号1458「臨床疫学に活用可能なNDB等データセットの作成に関する研究」の成果物の御説明になります。
 こちらの案件は、当室の厚労科研政策科学研究で実施いただきましたもので、医療・介護のデータ構造の解析などに加え、その成果物の一部として医療・介護、NDBと介護DB双方のデータを連結してできる解析について、連結したデータセットの例を示していただくことをお願いしておりました。承諾のときにも対面審査で森先生からその旨を御説明していただいておりまして、今回成果物の一部ができましたので、そちらの御報告をさせていただくものでございます。
 森先生、準備はよろしいでしょうか。御説明をよろしくお願いいたします。
京都大学・森先生 京都大学医学部附属病院の医療事務企画部の森と申します。
 このたびはお時間をいただき、ありがとうございます。
 私からは、今回の厚労科研の一環として作成させていただきました医療・介護のサンプルデータについて御報告させていただきます。
 資料を2ページにお進めください。ありがとうございます。先ほど鈴木補佐からも御説明いただきましたように、今回の研究は令和3年度の厚労科研として実施させていただいているものの一環になります。「臨床疫学に活用可能なNDB等データセットの作成に関する研究」としまして、NDBと介護DB、さらに連結データの利活用推進を目的にしたデータセットの開発を行ってまいりました。
 この研究の一環として、今まで介護DBのデータブックの作成や、名寄せIDの研究も進めてまいりましたが、それと同時に様々な研究者の先生方に入っていただいておりますので、それぞれの専門分野に応じたデータセットの検討を行う中で、今回、連結データのサンプルデータのセットを作成しましたので、御報告いたします。
 3ページにお進めください。今回のデータセットの概要でございます。一旦ダミーデータセットと書かせていただいておりますが、どういう設計かと申し上げますと、まず介護のデータマートを本研究用に作成いたしました。これは介護DBの認定情報とつないだようなデータマートをまずつくり架空のIDをつくりまして、そちらとまた別にNDBデータにも、架空のIDをつくりまして、「共通ID」という書き方をしていますがNDBのAさんと介護DBのAさんは本来別の人なのですけれども、それぞれに架空のIDを振ることで連結させて、見た目上一個人に見えるようなデータをつくっております。その連結されたデータからデータセットを作成して、個人特定性を下げる目的で、そのデータセットからさらにランダムサンプリングを行うという形でデータをつくっております。
 その中で、幾つかの解析ができるような形でデータセットを作らせていただいておりまして、1つ目は、要介護度ごとに傷病分類とのクロス集計ができるようなデータセットをつくったということと、介護施設の入所者に関しまして、その入所者が入所後に入院したかどうかに関して分析できるようなデータセット、さらに、介護を受けていらっしゃる方で経管栄養を受ける方がいらっしゃいますので、そういう経管栄養の分とNDBのデータを連結したようなデータセットという形で作成しております。
 4ページにお進めください。少しそれぞれのデータセットをどのように作成したかをお示ししたいと思います。
 1つ目は傷病ごとの要介護認定の集計をするためのデータセットになります。まずNDBに関しては、REファイルやSYファイルを使って傷病名等のデータを取ってくることにしております。そこから患者ごとに傷病名の仮分類をつけて分析できるようにしたようなデータセットをつくっておいて、さらに介護用のデータマートから認定情報等を取ってくるようなデータを準備します。そちらを先ほど申し上げた架空のIDで年月情報を使ってジョインさせて、水色のデータマートになっているところが実際の今回納品予定のものなのですけれども、年月ごと、患者ごとでNDBと介護DBの傷病名の情報と認定情報を持っているようなデータマートを作成しました。介護情報の特性として、同年月に複数の要介護度が入っているようなものに関しては、新しいほうを採用するという形で今回は作成しています。そちらのデータマートを使って、今回集計のテーブルをつくってはいるのですけれども、データセットとしてはこの連結したデータという形で提供、納品できればと考えております。
 5ページにお進めください。実際にどういう分類ができる感じなのかということで、どういう集計表なのかをお示ししています。今回は脳卒中や虚血性心疾患、高血圧を対象疾患としてデータセットはつくっております。そちらを年齢階級別、性別別、要支援、要介護の程度に応じてこのような集計表がつくれるようなデータセットという形で作成しました。数字は出ておりますが、もちろんダミーですし、そもそも介護の方とNDBの方は同一個人では本来ないので、このデータとしては本当に研究としては使えるものではないのですが、こういう集計表をつくる練習ができるようなデータセットになっています。
 6ページにお進めください。あと2つできるようにしているのですけれども、介護施設の入所者の入院の有無のデータセットです。こちらも介護DBのデータとNDBのデータを架空IDで連結することで、その架空IDの方は入所をいつにして、介護施設にいつ入所して、その後、入院があったのかなかったのか、入院年月がいつなのか、要介護度は、どれくらいなのかということが集計できるようなデータセットをつくっております。
 7ページにお進めください。このデータセットを使ってどういうことができるか。これは私が本当につくったデータですので、完全に架空の結果なのですけれども、このデータを使ったら、こういう介護施設の入所者の入院数の入院ありなしの比率や、介護施設の入所日から初回入院までの期間がどれぐらい要介護度によって違うのかということが練習で集計できるようなデータセットになっているかと思います。
 8ページにお進めください。さらにもう一つ集計できるようにしたのが、経管栄養の有無のデータセットです。こちらも設計としては同じです。介護DBから必要な情報を取ってきて、NDBも必要な情報を取ってきて、架空のIDでジョインさせて、水色のところで連結したデータセットという形でつくっております。こちらは先ほどの情報に加えて経管栄養の情報も加えるような形で作成しております。
 9ページにお進めください。こちらでどういう分析ができるかというところで、認定情報が入っておりますので、要介護度別の経管栄養のありなし等々の分析ができるようなデータセットになっております。
 10ページにお進めください。このように幾つかのデータセットを今回つくらせていただいて、サンプルデータとして納品予定です。ただ、このデータセットの特徴というか、裏返しなのですけれども、欠点もございます。
架空のIDでNDBデータと介護DBそれぞれ連結しておりますので、個人の特定は原則不可能かと考えております。
 万が一、万万が一、本当の個人が結びついてしまう可能性はゼロではないと言われるかもしれないと思って、さらにそこをサンプリングすることで、個人特定性を下げる形にさせていただいております。
 ただ、その裏返しで、同一個人を連結していないので、データとしては病態が不合理になっておりますので、解析結果を研究成果として出すことは不可能だと考えています。あくまでも分析手法の練習用のデータセットとしての利用を想定して作成したものになります。
 私からの説明は以上になります。
山本委員長 ありがとうございました。
 ただいまの御説明について、御質問、御意見がありましたらよろしくお願いいたします。いかがでしょうか。
 東宮先生、どうぞ。
東宮委員 単純な質問ですが、架空のIDでマージするときに、何か条件はつけているのでしょうか。
京都大学・森先生 特に条件は、今回分析するつもりでつくっていないので、年月などでは整合性はあるのですけれども、基本的には性別は合わせたくらいで、あまり加工せずにくっつけたイメージです。
東宮委員 せいぜい性別とか、その程度のことを合わせたと。
京都大学・森先生 年代と性別は合わせているのですけれども。
東宮委員 もちろん、それで匿名性が崩れるということは数からしてあり得ないと思うのですけれども。分かりました。ありがとうございます。
京都大学・森先生 逆に病態がそろっていないはずです。
山本委員長 いかがでしょうか。
 堀先生、どうぞ。
堀委員 非常に丁寧な説明をありがとうございます。
 将来的にNDBと介護DBを連結してどういう研究ができるのかを想像する上で非常に有意義なものだと感じました。ただ、先生御自身がおっしゃっていたように、同一個人を連結していないので、あくまで練習用のデータセットであると思うのですが、逆に非常にデータセットとしてはよくできていると思うのですけれども、このデータセットから仮説をつくるというのは、現実の病態がそろっていないのでかなり難しいような気がするのですけれども、あくまでデータベースの操作の練習のためのデータセットということでよろしいのでしょうか。私が分かっていないところはあるかもしれませんが、教えていただければと思います。
京都大学・森先生 ありがとうございます。
 今回のデータセットに関しては、操作の練習用ということを主眼に置いて作成しております。最初にこれをつくり出した当初は、そもそもデータをちゃんと連結して何が見えるのかというか、どことどこを連結したら分析に足るようなデータセットになるかという、どちらかというとデータ構造を見る上で最初に始めたところがありまして、その成果としてデータブックなどをつくっているのですけれども、その上で、あえて同一個人ではないからこそ練習のデータセットに加工可能なのではないかという形で、さらに加工させていただいてつくったデータセットになりますので、あくまでもこれは練習のデータセットだと思います。同じようなスキームを使えばサンプルデータセット、いわゆるサンプリングデータセットも作成可能だとは思いますが、その場合のどこまでランダムサンプリングすればいいのかは、また御検討いただくところなのかと思います。今回それはつくっておりません。
堀委員 ありがとうございます。
 では、今回つくって、これで練習していただいて、同じようなものを毎回つくるわけではなく、これは1回で終わりという理解でよろしいでしょうか。
京都大学・森先生 連結のデータはこの研究の一環としていただいているので、実際の連結データで同じようなものを今はつくれる状態だと思うのですけれども、安全性などは検討されていないので、つくる予定は正直ないのですが、とはいえ、まだ連結データは使った方が少ないので、連結データでどういう研究が想像できるか、まさにどういうものができそうかを少し触っていただくという意味で、まず練習用として使っていただければと思って作成いたしました。  
堀委員 ありがとうございます。分かりました。
山本委員長 ほか、いかがでしょうか。よろしゅうございますか。
 この後はどうなるのですか。このデータセットをオープンにして、みんなで練習してもらうというように進むのでしょうか。
鈴木室長補佐 ありがとうございます。医療介護連携政策課です。
 NDBでは、昨年の6月に規制改革実施計画への対応もございまして、かなり症例数を落としたものについて、ホームページで自由にダウンロードしていただける状態にしております。今回森先生との御相談の中でも、まだ介護との連結も始まって3年というところで、そもそも連結してどういうデータセットがつくれるのかのイメージが全くつかない研究者も特に臨床家には多いと思われたことから、実際に分析していただく手前でそういった自由にダウンロードするという形態もよいのではないかと思っておりまして、その中で実際の同一人ではないデータ同士の連結という形で今回ダミーを作成いただいております。ですから、森先生とももう少し相談してからになりますが、できればNDBと介護DBのホームページのようなところで自由にダウンロードいただける形で公開する方向を考えております。
 長島先生から挙手をいただいておりますでしょうか。
山本委員長 長島先生、どうぞ。
長島委員 自由にダウンロードよりは、きちんと申請フォーム等で、誰でも渡すのだけれども、どなたに渡したのかが分かるようにはしておいたほうがいいと思います。
山本委員長 ありがとうございます。
鈴木室長補佐 参考にしていただいた方をこちらでも把握できるようにという御意見だと伺いました。方式について検討させていただきます。ありがとうございます。
山本委員長 ほか、よろしいでしょうか。
 それでは、森先生、ありがとうございました。
 公開の議事は以上で終了になります。
 個別審査に移る前に、事務局から必要なアナウンスをお願いいたします。
長嶺課長補佐 事務局でございます。
 それでは、ここからは申出者の具体的な申請内容に基づき審査を行うことから、非公開とさせていただきます。
 御発表いただいた森先生につきましては、ありがとうございました。
 すみませんが、御退室をお願いいたします。
京都大学・森先生 ありがとうございました。失礼させていただきます。
  (京都大学・森先生 退室)
長嶺課長補佐 委員の皆様におかれましては、いましばらくお待ちください。完了しましたら事務局よりお声がけいたします。
 退室が完了いたしましたので、御報告いたします。
 山本委員長、よろしくお願いいたします。
山本委員長 引き続いて、議題2「個別審査(医療・介護連結申出)」を行います。
 事務局より個別審査についての説明をお願いいたします。
  (非公開)
長嶺課長補佐 本日の審査は以上となります。
 御指摘のあった部分につきましては、こちらでも対応させていただきまして、提供に向けた手続を進めさせていただきたいと思います。
 次回の会議日程につきましては、追って御連絡をさせていただきます。
 どうもありがとうございました。
山本委員長 それでは、以上をもちまして、第16回「匿名医療・介護情報等の提供に関する委員会」を終了いたします。
 どうも本日はありがとうございました。