ホーム> 政策について> 審議会・研究会等> 保険局が実施する検討会等> レセプト情報等の提供に関する有識者会議> 第38回レセプト情報等の提供に関する有識者会議 議事録(2017年8月10日)
2017年8月10日 第38回レセプト情報等の提供に関する有識者会議 議事録
保険局医療介護連携政策課保険システム高度化推進室
○日時
平成29年度8月10日(木)14:00~16:00
○場所
中央合同庁舎5号館17階 専用第21会議室
(東京都千代田区霞が関1-2-2)
○議題
(1)オンサイトリサーチセンター第三者利用に向けた準備について
(2)レセプトデータと特定健診等データの突合について(報告)
(3)DPCデータの提供について
(4)第3回NDBオープンデータについて
(5)第2回NDBオープンデータについて(非公開)
○議事
○山本座長 それでは、定刻より少し前ですけれども、構成員の方が全員おそろいですので、ただいまから第38回「レセプト情報等の提供に関する有識者会議」を開催いたします。
構成員の皆様には、御多忙の折、お集まりいただき、厚く御礼を申し上げます。
8月の厚生労働省は暑くて、我慢大会になることが多いのですけれども、きょうは幸い、ちょっと曇っておりまして、確かにクーラーがきいているという環境がありますので、ぜひ活発に御議論をよろしくお願いいたします。
それでは、会議に先立ちまして、本日の構成員の出欠状況について、事務局からお願いいたします。
○赤羽根室長 事務局でございます。
そうしましたら、本日の構成員の出欠状況について、御報告させていただきます。
本日は、後藤構成員、藤井構成員、松山構成員、武藤構成員の4名から御欠席の御連絡をいただいております。
本会議の規程に基づいた開催要件は満たしておりますことを御報告させていただきます。
それから、前回の有識者会議から構成員の交代がありましたので、御紹介させていただきます。
猪口雄二構成員にかわりまして、全日本病院協会の高橋肇常任理事に御就任いただいております。
○高橋構成員 全日本病院協会から参りました高橋です。よろしくお願いいたします。
○赤羽根室長 それから、布施高広構成員にかわりまして、新潟県後期高齢者医療広域連合の野本信雄事務局長に御就任いただいております。
○野本構成員 野本でございます。よろしくお願いいたします。
○赤羽根室長 それから、事務局側でございますが、本日、DPCデータの提供についての審議がございますので、保険局医療課から中谷補佐が出席しております。
○中谷課長補佐 中谷です。
○赤羽根室長 よろしくお願いします。
それから、お手元の議事次第で、議事の5つ目で「 第2回NDBオープンデータについて」というものがあるのですけれども、こちらについては公表前のデータの内容についての議論を予定しておりますので、こちらについては非公開とさせていただきますので、よろしくお願いいたします。
それでは、 カメラの撮影はここまでとさせていただきます。
(カメラ撮影終了)
○赤羽根室長 事務局からは以上でございます。
○山本座長 どうもありがとうございました。
会議開催要件を満たしているとのことですので、早速ですけれども、本日の議事に入っていきたいと思います。
議事次第の「 2.議事」の 「(1) オンサイトリサーチセンター第三者利用に向けた準備について 」ということで、事務局から説明をお願いいたします。
○赤羽根室長 事務局でございます。
そうしましたら、お手元の資料1-1の「 オンサイトリサーチセンター第三者利用に向けた準備について 」という資料をごらんいただければと思います。
めくっていただきまして、2ページ目でございます。まず、こちらにオンサイトリサーチセンターの現状を書かせていただいております。
オンサイトリサーチセンターについては、平成27年12月に東京大学で試行利用を開始しまして、翌平成28年2月に京都大学で試行利用を開始しているという現状でございます。
オンサイトのパフォーマンステストを東京大学、京都大学でそれぞれ実施いただいたのですけれども、こちらについては有識者会議でも御報告させていただきましたが、おおむね完了してきている状況で、現在は模擬申出による個別研究が進行しておりまして、こちらも数カ月以内には完了の見込みという状況でございます。
そうした状況も踏まえまして、第三者利用開始に向けた準備を、これまでも御議論いただいてきたのですけれども、進めている状況です。オンサイトリサーチセンター諸規程等の整備についてはもろもろ進めておりまして、それから、いずれ第三者に開いていくことになると、まず第三者の模擬申出・審査を行っていくということで考えております。
そうした第三者利用開始に向けた準備ということで、次の3ページ目をごらんいただければと思うのです。
このオンサイトを第三者に開いていくに当たって、実際にそのガイドラインをこれまで第34~36回の有識者会議で御議論いただいてきて、こちらがまとまってきている状況でございます。
それから、実際、第三者に利用していただくに当たって、規約等々も準備が必要ということで、今回、そこのところを少し議題にさせていただければと思っています。
これが済みますと、まずは限定された方々で第三者利用の模擬申出・審査をいただいて、さらに試行利用というところで進んでいくことになるかと思います。
次の4ページ目なのですけれども、利用規約について少し第三者提供の現行のものから軽微な修正を加えたいということで今回答申させていただいております。
1つ目なのですが、やはりオンサイトで、ある程度、データ利用に関し、自由度がある部分もありますので、基本的に有識者会議にデータ利用範囲ということで申し出た範囲を超えたデータ利用については不正利用であるということを規約の中にはっきり明記したほうがいいのではないかということが1点目でございます。
2点目が、実際に規約に違反するような行為があった場合には、基本的にお名前とか所属機関を公表するという、これは現行の第三者提供からずっとやっている話なのですけれども、こちらの規約について、さらに違反の行為があった場合には、申出者・利用者の氏名・所属機関の公表だけではなくて、具体的な違反の内容の公表といったあたりも明記してはどうかということで、今回、この利用規約について少し変更を加えさせていただければと考えさせていただいております。
最後の5ページ目が、これは参考までに、従前の第三者提供の利用規約の違反等々に関する措置を挙げさせていただいております。
事務局からは以上でございます。
○山本座長 どうもありがとうございます。
それでは、ただいまの御説明に関しまして、御質問・御意見等がありましたら、どうぞよろしくお願いいたします。いかがでしょうか。
これは、この有識者会議が始まったころからの問題意識として、こういった第三者提供に対して何か重大な過失がある、あるいは故意による漏えいがあったときに、契約上の対策しか今はとれないわけですね。そういう意味では、法的な処置が難しい、あるいは行政処分的なことは難しいわけで、これはNDBに関する第三者提供に関して、きちんとした法的根拠がないところがやはり大きいのだと思うのです。
これは8~9年にわたって、この議論をして、まだないということは、これは非常に難しいということはよくわかるのですけれども、ただ、こういったオンサイトセンターで、ある程度、探索的なことができるようになるとかという利用の拡張を進めるべきだと私は思うのですけれども、一方で何かあったときの対策はそろそろ制度整備が要るのではないかなとは座長としては思います。ですから、そこは多分、今までも努力をされてきたと思いますが、引き続き事務局のほうに努力をお願いしたいと考えています。
ほかはいかがでしょうか。
飯山先生、どうぞ。
○飯山構成員 前にも1回、もうそろそろNDB法みたいなものをつくって、きちんとした対応方針をつくるようにしたらどうかと申し上げたこともたしかあったのですけれども、今、厚生労働省におかれては、この前からビッグデータの利活用について随分大きな構想をずっと掲げていらっしゃるので、一度、そこも含めて全体的な法整備について検討してみられたらいいのではないかと思うのですけれども、いかがでしょうか。
○赤羽根室長 事務局でございます。
ちょっと突っ込んだ内容ですので、私のほうから余りつまびらかに申し上げられることではないのですけれども、ただ、NDBも含めて、要はデータヘルス改革推進本部の中で所々の検討が行われておりますので、そういう検討もにらみながらということになっていくかなとは認識しております。
○飯山構成員 では、この会議ではなくて、この会議の構成員から、そういう強い意見があったということは申し上げていただければと思います。
○山本座長 頭金先生、どうぞ。
○頭金構成員 3ページ目に今後の第三者利用の模擬申出、試行利用開始ということが書かれているのですが、現時点でわかっている予定があれば、教えていただければと思います。
○森室長補佐 事務局の森でございます。
今回、利用規約のほうを御議論いただきまして、できればなのですが、次の有識者会議ぐらいまでに模擬申出の審査や運用管理規程等の準備を進めて、審査いただけるようにできればと考えております。 なので、実際、模擬申出の方に入っていただけるのが年明けぐらいにできればとは思っているのですが、まだ不透明ではございます。
○山本座長 どうぞ。
○杉山構成員 第三者提供利用規約からの変更点ということなのですが、対策1の申出範囲を超えたデータ利用については不正利用であることを明記することについては大賛成です。
ただ、対策2の違反内容の公表なのですが、性善説に立つか、性悪説に立つかというところで変わってくると思うのですが、基本的に、これが技術的にできればということになりますけれども、具体的に違反の内容が累積されたときにそういうことをするのも一つの方法かな。
というのは、なかなかそういうことはないでしょうけれども、例えばそういうものを目にしてしまうと、人は結構誘導されてしまうところがあるので、そんな考え方をすると、内容についての公表は若干、まだなのかなという気がいたします。
以上です。
○山本座長 ありがとうございます。
ほかはいかがでしょうか。
この対策で、杉山先生がおっしゃられたように、内容の公表というものを一発でやるか、累積でやるのか、あるいは違反の内容によって変えるのかという選択肢があると思うのです。この辺も次のガイドラインの改定のときに少し考慮していただければと思います。
宮島先生、どうぞ。
○宮島構成員 次のお話かもしれませんが、累積にするものとの、今、影響されるとおっしゃったので、具体的にどんな感じの影響があり得るのか、教えていただければと思います。
○杉山構成員 利用者サイドにいないので、なかなか想定は難しいと思いますけれども、これは前提で、仮定の話になりますが、同じ違反があったとすると、基本的にはそれをしやすいという話になりますね。そういう違反になりやすいというもとになるので、その累積によって、このことについては注意をすることはやはり必要なのかなと思うのですが、前提としては、そういう違反行為がないという前提でおやりになったほうがいいのかなと思っていたので、そういう発言をさせていただきました。
○宮島構成員 つまり、割合うっかりやってしまったような場合は、すぐにだとかわいそうというか、やり過ぎだということですか。
○杉山構成員 いや、別に感情的なものではなくて、実際、本当にそれだけの違反が出るかどうかもわかりませんので、前提としては、今、明確にこういう違反は起こり得る可能性が非常に高いだろうと思うものがあれば、逆にこれは事務局にお尋ねをしたいなと思いますけれども、そういうことがないのであれば、そういう経験の中で対応を進めていくのも一つの方法なのではないかなと思ったので発言をいたしました。
○山本座長 どうぞ。
○宮島構成員 ありがとうございます。
今のに別に反対とか、そういうわけではないのですけれども、私はほかの部署でもデータ利用についての議論をしていることがあるのですが、今、データは物すごく使われ方が割合うっかりとか、そんなに趣旨がなくても漏れていたり、二次利用、三次利用というふうにすごくネット上とかにされやすくなっていて、そして、されたときの影響は結構大きいのだけれども、手が打てなくなる状態がいろんな局面によって、みんなの悩みの状況になるかなと思っております。
なので、先ほど私は座長がおっしゃった、たった今はこれでいいけれども、今後いろんな方が、しかも悪意を持った方が出てきたときに、それをしっかりとめる手法を持っていないと、せっかくのデータ利用のスキーム全体を後ろに引っ張ってしまうことになるなどということはすごく恐れています。
なので、今の累積か1回かということは直接、私としてはそんなにどっちというのはわからないのですけれども、いわゆる、そろそろいろいろ広げるからに当たっては、悪意の人が出てくることを、ある程度、前提にしていかないと、一発アウトみたいな感じになってしまう可能性があるなと思って、今後はデータ利活用は進めるけれども、すごく悪意がある人が来たときにどうやってガードするかという考え方も必要かと思っていて、特に今の段階ではもちろん、利益が出た場合とか、そういうものは放出することにはなっているけれども、実はその利益だけではとどまらない悪影響を及ぼすことも世の中にはあり得るのではないかと思っていて、今後の大きな議題だと思っています。
今回の違反の内容の公表に関しては、私はもしかしたら、内容の公表をすることが、その人がやろうとしている研究を露出してしまう可能性があるかどうかというのはちょっと気になったのですけれども、もしそういう可能性が罰則以上にあるのだったら、もしかしたら考慮する可能性があるかどうか。それは専門家の方に伺いたいと思うのですが、ある程度、歯どめはしっかりきつ目にしたほうがいいかなと思っております。
○山本座長 ありがとうございます。
結局、こういう事態が起こらないとは思っていますけれども、もし起こった場合は、やはりここで対応して、きちんと審議をするのでしょうね。宮島先生がおっしゃるように、本当に本人のオリジナリティーのある内容が全部露出してしまう可能性はゼロではないと思うのです。その場合は、そこだけ外して違反行為だけを出すとか、多少、調整は要るのだと思います。ただ、個々のケースに関しては多分、事前には難しいので、そんなことはないとは思いながら、もし起こった場合は皆さんでしっかり議論していただかないといけないと思います。
あと、制度整備ができることによって、そもそもの申請とか利用の手続をもうちょっと簡略化できるかもしれないわけですね。今、契約で縛らないといけないので、物すごく用意周到に調べないといけないところがありますから、その点も含めて、将来の課題として、これは考えていかないとと思います。
ほかはいかがでしょうか。
田尻先生、どうぞ。
○田尻構成員 すごく基本的な、素人が聞くような話で、きょうの構成員の先生方で笑われる人がおられるかもしれないけれども、この不正利用というものは、どのタイミングで、誰がどう気がつくのでしょうか。
例えば、アクセスしたログが残りました。そのログをずっと誰かが監視しているのか。もしくは、それをもとに申請以外の要素を持った、発表した、それをもって初めて気がつくようなことがあるのか。今、いろんな構成員の先生方のお話を聞きながら、ふと、すごくプライマリーな疑問を生じたものですから、思い切って尋ねてみました。
○山本座長 私が答えることではないと思いますけれども、別のデータベースの仕事でやっているときに、そういう検出をどうするのかというのはかなり問題になるのです。
本当にちょっとやっただけというのはわからないのですよ。そのこと自体が表に出ていく、例えば何らかの利益を求めて売るとか、そういったことがはっきりすればわかりますけれども、本当に興味本位でどんどん調べているみたいな範囲だと、これはログをいちいち見なくても全然データベースの稼働状況が違ってきますから、そこはかなりの確率で異常として判定することができて、それがわかった時点でログファイルの解析をするとか、あるいはビデオで監視していますから、その行動を見るとかということを多分やるのだと思うのです。
なかなか、これは一概にどうやってというのは難しいのだと思います。本当にがんがん調べ出すと、それはわかるのですけれどもね。
どうぞ。
○石川構成員 今、田尻先生のおっしゃったことなのですけれども、大体、漏えいしてから気がつくとかということでは、これは重大なことになる。特に医療情報はです。だから、私はやはり個人情報がこの5月30日から変わったということもありますし、より機微性の高い医療情報については、プライバシー・バイ・デザインといって、かなり予見性を持って、先ほど宮島さんが言ったように、慎重に、予見性を高くして、漏れる前に手を打っていくことが大事だと思うのです。
だから、次のDPCのところに出てきますけれども、これはもっと個別性の高い重大なデータが流れるわけで、こういうものは慎重にやっていくわけです。だから、厚労省がきょう提案されるものをもっと石橋をたたいて、厚労省をたたくわけではなくて、石橋をたたいて、もっと後にしたらいいのではないかと言ったりすることが大事だと思うのです。
それは国民を守るだけではなくて、我々が今後、医療情報を、いろんなビッグデータを使っていく上で非常に大事なことで、今、つまずいたらだめなのですよ。そういうことだと思います。
○山本座長 ありがとうございます。
念のために申し上げますけれども、オンサイトセンターというものは相当厳しい環境で、一切、記録装置は持って入れませんし、そこからデータは全く出せないで、出すときは改めて内容を出して申請していただくということですから、覚えて帰るとか、あるいは違法に持ち込んだカメラで撮ってくるとか、そのぐらいしかできないのです。したがって、相当、事前の対策はしていると思うのです。それでも、やはりリスクはゼロではないので、それをどう対応するかというお話だろうと思います。第三者提供だと、データそのものが来ますから、これはよほど注意しておかないといけないのですけれども、オンサイトセンターの場合は持ち出せないのが大原則です。
ほかはよろしいでしょうか。
それでは、いただいた御意見を踏まえて、今度、ガイドラインの修正等の原案をまたつくって提示したいと思いますので、よろしくお願いいたします。
それでは、2つ目の議事は「 レセプトデータと特定健診等データの突合について(報告) 」ということで、御報告を事務局からお願いいたします。
○赤羽根室長 事務局でございます。
そうしましたら、資料2「 レセプトデータと特定健診等データの突合について(報告) 」をごらんいただければと思います。
表紙をめくっていただきまして、1ページ目に レセプトデータと特定健診等データの突合について、状況を御報告させていただいております。
かねてよりレセプトデータと特定健診等データの突合問題と言われているものがありました。これは、NDBは匿名化した情報であるのですけれども、匿名加工の際、被保険者番号等からハッシュIDを発生させて、同一人物のレセプトデータ、それから、特定健診等データを突合する仕組みになっているのですけれども、例えば一部の保険者では、被保険者番号がレセプトデータでは全角で、特定健診等データでは半角といった記載の揺らぎが生じていて、その結果、同一人物であっても異なるハッシュIDが発生して、突合ができなくなるといった事象が発生していたということでございます。
これに関して、平成27年9月に会計検査院からの指摘といったものもございまして、この中でNDBに収集・保存されているデータを十分に活用した適切な評価を行うことができるようにするため、データの不突合の原因等を踏まえたシステム改修等を行うなどの措置を講ずることとなっておりました。
これも踏まえつつ措置を、平成27年度に匿名化・提供システムの改修を行って、表記揺れに対応した新しいID3というものをNDBデータに付与するということをやっておりました。これで突合率の改善を図ってきたということでございます。このID3を付与したレセプトデータが、平成28年4月診療分から取り込んでおります。特定健診等データについては、ID3付与済みのものについては、平成27年度実施分から取り込んでおります。これは取り込み処理等々の関係で、ちょうどことしの前半に作業をしていたという状況です。
2ページ目に、どんなシステム改修をしたのかを少し絵で示させていただいております。
基本的には、この2ページ目の上のほうで、要はどういう記載揺れがあって、結果的に、違うハッシュIDが振り出されていたということを書かせていただいています。
下のところで、基本的にはレセプトデータも特定健診等データも、まず記号番号については両方全角にするという処理をして、時々、空欄に0なんかを入れられてくる保険者もありますので、そういう0については削除するといった処理もして、その上でハッシュ化をするという処理をしています。その結果、表記揺れを解消して、同じIDを振り出すことができるという仕組みになりました。
次の3ページ目をごらんいただければと思いますが、基本的にはレセプトデータであれば平成28年度分、それから、特定健診等データについては平成27年度分からは、この新しいハッシュID3というものを振り出して、付与して、格納していくことができるのですけれども、過去のものについては既にハッシュ化されていますので、新たに記号番号からハッシュID3を振り出すことはできないので、では、どういう対処をするのかというのが、この図で書かせていただいていることです。
具体的には、レセプトであればレセプト同士で過去にさかのぼって、先ほどのもともと表記揺れがあるID1で突合していくことができます。というのは、レセプト同士であれば表記揺れについても表記揺れのされ方が同じなので、大抵の場合、ID1で突合することができる。それから、特定健診等データについても同じで、要は特定健診等データであれば、やはり表記揺れの仕方が同じなので、過去にさかのぼっての突合ということはできます。
なので、最近の平成28年度のレセプト、それから、平成27年度の特定健診等データからは、新しいID3で突合する。それで、過去にさかのぼって、それぞれレセプト、特定健診で、ID1で突合していく。そうすると、同一人について結果的に過去から一続きでデータがつながるという処理ができますので、このつながったものについては、さかのぼってそれぞれレセプト、それから、特定健診等データについて、つながったID3も付与していくという処理をして、過去のデータについてもできるだけ突合率を上げるという処理をしております。
そういう形で、過去のデータについてもできるだけ突合率の改善を図っていくということで進めております。
次の4ページ目で、実際、システム改修をして、突合率がどのようになったかというのがこちらでございます。
平成27年度の突合率について、ID1でやった場合が上のほうのもので、大体言われているような25.7%という突合率になっております。これに対して、実際に改修をかけたID3を使った場合の突合率についてが下のもので、実際、全体として87.6%という非常に改善した突合率になっております。
それから、念のためということで申し上げさせていただくのですけれども、突合率がなぜ100%にならないのかというお問い合わせを時々いただくのですが、基本的には、この突合率の計算方法は、特定健診を受診して、特定健診のデータがある方の数が分母になります。それで分子が、それにレセプトデータがひもづく方の人数となるので、特定健診を受診しても医療機関にかからずにレセプトが発生していない方が一定数いらっしゃいますので、結果として100%にはならないという性質の数字ということで御理解いただければと思います。
一応、現状はこんな形でシステム改修をして、突合率が改善しているという御報告でございます。
事務局からは以上でございます。
○山本座長 ありがとうございました。
ただいまの事務局からの御説明に関しまして、御質問・御意見はございますでしょうか。
石川先生、どうぞ。
○石川構成員 この ID3 というやり方で突合することについての方法を考え出した方は大変切れる方だと思うのですけれども、このID3がこうやって実際に平成27年、28年でそれぞれ付与されていることについては、いろんなところでのアナウンスというものはちゃんとありましたか。
○赤羽根室長 はい。実際、このやり方については、以前、有識者会議で一度、御報告させていただいております。
○石川構成員 これなのですけれども、こういうものは例えば、この間、事前レクを受けた後に気がついたのですが、これは個人情報を2つ突合するということで、より個人の情報を突合することによって、こういう ID3 というものを使うと、 より個人に特定しやすい情報になると思うのです。
結果的に、いろんな情報に共通の符号を振ることによって、極端なことを言えば、個人情報が脅かされることがありはしないかということを考えるわけなのですけれども、これは何か法的に改めたりしなければいけないものかどうかということをお聞きしたいのですが、どうでしょうか。
○赤羽根室長 基本的には、このハッシュ化をして匿名化するという考え方は、そもそも、この NDB の格納方式を考える際に、当時の検討会の中で検討して、確実に個人を特定できなくさせる方法として言われていたもので、今回の方法も実際、記載揺れがあった場合にきちんと突合できるようにという処理をしているだけなので、それ自体、さらに新しい情報を含めて、個人の特定性を高めているという性質のものではないので、法的・制度的には基本的には問題ないものと考えております。
○石川構成員 よろしいですか。
お言葉ですけれども、例えば特定健診には体重だとか、そういったものは克明に載っていますね。それで、病気で極端に体重の多い人はID3を使うことによって特定性がより高まると思います。
この後、DPCというものも出てくるので、こうやって、当然、突合することがどんどん行われるときに、これは法的に何か変えなければいけないかどうかということを聞いているわけです。特定性は絶対高まると思います。特定健診のデータとレセプトデータを突合するのですから、レセプトデータにないものを特定健診のデータの中に入っているのですから、それは突合できるということは個人の特定性が高まるに決まっているわけですから、そういうことをやることを法的に何か手当てが必要なのではないかということを質問しているわけです。
○山本座長 そもそも、この ID3 をつくった理由が、本来、ID1がこういう仕様でなかったらいけなかったのですよ。本来、レセプトと特定健診は突合できるというのが、このNDBの仕様でありまして、我々がつくってきたガイドライン提供ルール、あるいはここでの有識者会議、分科会での審査も、それを前提に特定性の、個人が識別できる危険性を評価して、提供できる、提供できないというものを今まで決めてきたわけですね。それが思いのほか、突合できていなかったというのは青天のへきれきで、こんなに突合率が悪かったのかというのは本当に驚いたのですけれども、石川先生がおっしゃっている、例えばこのレセプトのNDBでいえば、これは提供に関するガイドラインが一番の文書だと思うのですけれども、その文書自体は突合できているという前提で書かれているのです。
したがって、今、特定健診だけ集めるときでも、例えば極端値が非常に目立つような分析をされる場合は、それはお断りしているわけですし、例えば先生がおっしゃるように、体重が極めて重い人だけを見つけてくるみたいなことは、そもそもデータ提供の基準から外れてきますので、これは提供できないことになりますし、特定健診とレセプトを合わせてというのも今まであったかと思うのですけれども、それもそういう意味でのリスクの評価を我々はやっていると思うのです。したがって、そういう前提でつくられたガイドラインですから、これが今、本来の機能に戻ったかなということで、特段、修正をする必要はないのだと私は考えています。
○石川構成員 よろしいですか。
だから、最初のところで特定健診とレセプトというものは、将来的には突合するというのはいいです。それをやってみたら、実際、なかなか難しい問題があって、 ID3 という方法を付与する、付番するわけですよ。それによって、そういう技術的に後で加わったものに対して、法的に何かつけ加えることは必要ないのですかということなのです。
○山本座長 どうぞ。
○赤羽根室長 山本座長からもございましたが、基本的にはまさにこれが本来想定していた NDB の姿で、これまでの制度とかガイドラインの仕組み全体も、これをむしろ前提として、想定してつくられているので、現在、基本的にはこれについて何らか新たに仕組みであるとか、そういうものをつけ加える必要はないと考えています。
○山本座長 どうぞ。
○藤田構成員 基本的に山本座長と同じ考えをしておりまして、そもそも、このIDの付与の仕方自体が(特定健診とレセプトとで)同じ方法であって、突合ができるように付与しているということなので、当然、そもそもの設計として多分、突合されるようなものとして考えられているのだろうと思っております。
ただ、石川先生のおっしゃることは非常に理解できまして、行政機関個人情報保護法における非識別加工情報であったり、個人情報保護法の匿名加工情報の考えからいくと、そもそも、それを予定していないものに関して突合して再識別することに対しては、確かにプライバシーのリスクを考えて、しないようにというふうになっているので、今回とは話は違うのだと思うのですけれども、(個人の特定識別性の向上に対して)一定の配慮が本来は必要です。
ただ、最初のほうに話があったように、そもそも、この NDB データの提供等に 関する法的な根拠という部分の問題も多分にありまして、例えば第三者提供においては、前回の有識者会議で事務局から御説明がありましたけれども、行政機関個人情報保護法の例外規定を読み込むことによって個人情報も提供できるという考え方をとっていることに鑑みますと、必ずしも匿名加工の部分をそこまで法的手当てしなければいけないという考えには(今のところは)立っていないのではないかなと理解しております。
○山本座長 ありがとうございます。
ほかはいかがでしょうか。
高橋先生、どうぞ。
○高橋構成員 少し教えてほしいのです。4ページなのですけれども、これは特定保健指導等で効果が出てきたら、すなわち元気になっていったら突合率が低くなる。そういうふうに読んでもいいのですか。
○赤羽根室長 基本的には、ただ、必ずしも特定健診だけで見ているような疾病だけではなくて、例えばアレルギー性鼻炎とか、そういうもので例えば受診される方もいらっしゃいますので、一概にはっきりとは申し上げられないのではないかなと考えております。
○山本座長 どうぞ。
○三浦構成員 このレセプトデータ、健診データの突合に関しては、本来目的で保険局の特定保健指導の効果検証のワーキンググループに私は参加していますので、突合できなかったときに一番困ったのが我々のワーキンググループなのですけれども、それで、本来の突合をきちんとできるようになるということで、大変いいなと思っております。
突合したときにいろいろ困ったこともあったので、この機会に提案させていただきたいと思うことがあります。今、突合率が結局88%ぐらいなのですが、あと12%ぐらいは誰かといいますと、結局、健診は受けたのだけれども、1年間、医療機関を受診していない方になるのです。レセプトが出てきていない方になるわけです。
この NDB の分析をしていて、問題だなと思ったのは、健診を受けた人のデータは入っている。それで、医療機関に何らか行かれた方のデータもレセプトの出ている方は入っている。でも、分母がわからない。健診も行っていないし、その年、医療機関も受けていない方が何人いるのか、わからないというのが限界になっています。ワーキンググループのほうで、健診を受けること自体がよかったのかどうかということを分析しようとしましたが、健診を受けていない方の分母がないので、分析できなかったのです。
結局、加入者の分母のリストのファイルがないものですから、健診も受けない、医療機関に受診もしていない方がすぽっと抜けてしまうので、そのあたりが非常に、このデータの限界になっています。この機会にそういうことがわかったと思いますので、これからいろんな研究に活用するなどのときも必ず、分母がわからないというのが限界になってしまっていて、NDBのつくり方自体のところで、そのあたりをクリアしていくと非常にいろんな活用の仕方ができるだろうと思いますので、この機会に申し上げさせていただきました。
○山本座長 ありがとうございます。
なかなか難しいです。
どうぞ。
○棟重構成員 突合率に関連して思い出したのですが、当初健保組合の突合率は0.3%でしたので、それに比べると突合率が高くなったのですが、単年度では高まったとしても、過去にさかのぼったときに、その人がずっと同じ保険者に所属しているわけではないので、保険者が変わったときに、それをどういうふうにデータをつなげていくか将来的に検討をお願いしたいと思います。
○山本座長 ありがとうございます。
医療とIDの課題で、今後検討されるのだと思います。
ほかはいかがでしょうか。よろしゅうございますか。
それでは、次の議題に進みたいと思います。3つ目は「 DPC データの提供について 」ということで、事務局から説明をお願いいたします。
○中谷課長補佐 保険局医療課でございます。
資料3-1をごらんください。「 DPC データの提供について 」ということです。
おめくりいただいて、2ページ目で、きょうお諮りする内容の背景としましては、この平成22年6月22日に決定された、新たな情報通信技術戦略の工程表で、DPCデータの第三者提供を進めるということで、こちらの有識者会議に DPC データの提供に関するガイドラインを諮らせていただいて、試行的に国の行政機関に対してのデータ提供を行っており、また、第三者提供を広く進めるためにDPCデータベースの構築も行っておりました。
今年度、このデータベースの構築に伴いまして、第三者提供を実施することにしておりますので、2ページ目の中ほどを見ていただきたいのですが、国の行政機関以外にも広く第三者提供を進めるに当たり、一度、こちらで見ていただいたガイドラインにつきましては、NDBのガイドラインを踏まえて、一部修正をさせていただきたいと思っております。
具体的な内容、変更点としては、まず提供する範囲を国だけではなく都道府県や市町村等々に広げる。それから、提供するのは、DPCデータについては集計表単位での提供ということですが、最小集計単位につきましては「患者数100未満」とありますものを、NDBデータを参考にしまして、人口2,000人未満の場合についてはといった内容に修正をさせていただきたいと思っております。
修正後の案につきまして、資料3-2 で「 DPC データの提供に関するガイドライン(案) 」の平成29年8月ということでおつけしておりますので、主な修正点としてはその部分でございますが、あとは細かなところ、日付の更新ですとか、あと、試行期間の仕様になっているところは、そのような文言について削除するといった内容の修正をさせていただきました。
資料3-1の2ページ目に戻っていただいて、今後のスケジュールとしましては、本日、ガイドラインについて見ていただきまして、御了承いただければ、第三者提供に係る受け付け等を行いまして、今年度末ぐらいまでには、申請がありましたら、こちらの会議での審査を経て提供開始をするようなスケジュールで考えております。
説明は以上でございます。
○山本座長 どうもありがとうございました。
DPCの検討、少し時間がたっていますから、若干復習しておきますと、ワーキンググループをつくっていただいて、御検討いただいて、それから試行した上で、 DPC に関しては本人特定性がかなり高いデータになるので、当面は集計表情報のみ第三者提供する。個票提供に関しましては、やるとしてもオンサイトセンターを使うとか、あるいはサンプリングデータにしてから提供するとかということを前提にして、決まったわけではなくて、もう少し検討を続けてはどうかという結論だったと思います。
その中で、この集計表データを提供するに当たっての提供範囲、最小集計単位等に関しまして、今のガイドラインを現状の NDB の第三者提供のガイドラインとそろえるといいますか、同じ基準にするという意味で、今、御提案があったところであります。
いかがでしょうか。 御意見ございますでしょうか。
どうぞ。
○石川構成員 資料3-1の8ページ目に「4.今後の対応(案)」というものがありまして、これを見せていただきますと「現状の整理」ということで、平成26年3月に有識者会議で議論した内容が書いてあります。
「現状の整理」の1のところで、 NDB データと比較したDPCデータ特有の問題点ということです けれども、私は、これは既に3番目の様式1において「診療情報等の個人特定性が高い濃密な情報が含まれる」。これに一番集約されると思うのですが、その上に「 DPC データを提出する病院は少ない」と書いてあるのです。準備病院も含めて約1,800病院ということなのですけれども、これは全部の入院患者割でいきますと、1,800は大変少ないなどということは全然言えなくて、かなり多いのではないかと思うのです。
その辺のところで、DPCデータは日本の入院医療のどのぐらいを占めているデータだということの御認識なのか、ちょっと教えてもらいたいのです。
○中谷課長補佐 今、細かい数字は手元にございませんが、ざっくりと急性期と言われる一般病棟、入院基本料を取っている病棟に入院している病床のベースで言うと、半分弱ぐらいが DPC です。
○石川構成員 急性期病院で言うと、大変大きいデータですね。それで、この様式1で個人特定性が高いということですので、非常に慎重にやらないといけないだろうと思います。
○山本座長 ありがとうございます。
ほかはいかがでしょうか。
この最小集計単位に関しましては、この変更でよろしゅうございますか。患者数100未満、それから、人口2,000人未満の市区町村については患者数は表記しないということで、集計表ですから、1枠について何人というものがあるわけですけれども。
○中谷課長補佐 もしよろしければ、最小集計単位につきましては、資料3-2の28ページ目をごらんいただければと思います。28ページ目の2番の(1)に最小集計単位の具体的な記載がございます。
○山本座長 どうぞ。
○石川構成員 もう一つ、資料3-1の10ページ目の、これは平成26年3月20日の「集計表の提供の方向性」というポンチ絵なのですけれども、この提供時における匿名化というものがA、それから、公表時における匿名化というものがBと書いてありますが、これは技術的にどうこうというふうな、何かありますでしょうか。これは例えばMIDNETだとか、それに匹敵するぐらい、結構、個人特定性の高いものになるのですけれども、この匿名化について、技術的に何か、ここに単に「匿名化」と書いてあるだけなので、何か技術的にあるかどうかなのですが、今、いろいろなところで研究されていると思いますけれども、どうでしょうか。
○中谷課長補佐 特にこれだけに適用している特殊なものではなくて、今、一般に行われている匿名化の暗号化といいますか、そういうソフトウエアを渡して、医療機関さんのほうでそれを使って匿名化していただく手法をとらせていただいております。
○山本座長 どうぞ。
○石川構成員 13ページ目に「 DPC データとレセプトデータの違いのまとめ」というものがあるのですけれども、これなんかを見ても、こうやって比較しているので、レセプトデータはハッシュ関数、2~3回掛けるとかということでいろいろおやりになっているということで、ただ、DPCデータの場合に問題なのは、提供時における匿名化をどういうふうにするかなのだと思うのです。
そこのところは明確に方法論的に少し、多少、皆さんがわかるような形での御説明だとか、それから、既にいろんな細かいことで有識者会議で話してはいますけれども、そういう技術的に何か、この匿名化に対して、こうやってやるのだという方向性がはっきりしたら、これは明示したほうがいいと思います。
○山本座長 石川先生、提供は集計表だけですから、個票は出しませんから、レセプトと同じような方法は使わない。要するに集計表ですから、最小集計単位にさえ注意すれば、完全匿名化ですので、特段、何か特別な方法を用いるとか、そういうものではないと思います。個票をもし提供するような状況になったら、これは結構大きな問題で、相当考えないといけないことはたくさんあると思いますけれども、現状は集計表に限って提供ということです。
○石川構成員 では、いいですか。
今、そういうお話なのですけれども、これはかなり研究が進みますと、この DPC データを用いるということでいろいろと研究者の方たちに手法だとかそういったものが行きますと、必ず個票のところまで行きたいということが出てくるので、そういう点でそれに注意していただきたいというのが私の次の話なのです。
今、座長がそういうふうにおまとめになったので言うのですけれども、今は集計表でやるとか、そういうものは我々の今までの常套のやり方なので、そういう段階を経てやっているのですけれども、だとしたら、この提供時における匿名化について、技術的にしっかりやっておいてくださいというのが私の要求でございます。
○山本座長 どうぞ。
○中谷課長補佐 御指摘ありがとうございます。
資料3-2の3ページ目、第4の部分が、今、集計表単位でございますけれども、情報を提供するときの匿名化に関してということでの処理、例ということですが、この真ん中あたりの黒ポツのところで、個人の特定等々、識別情報を削除する等々はさせていただく。また、個票ベースということを、もし提供する、しないに当たりましては、またこちらの有識者会議での御審議いただく内容でございますので、まずはこの集計表単位のことについて、このガイドラインベースでやってみて、また御要望等が上がってきましたら、こちらで御議論いただければと思っております。
○山本座長 ほかによろしいでしょうか。
棟重さん、どうぞ。
○棟重構成員 ちょっと確認ですけれども、この市区町村というのは患者住所地なのか、医療機関住所地なのか、両方あり得るのか。そこだけ確認させてください。
○中谷課長補佐 NDB と同様に、医療機関住所地という形になると思います。
○棟重構成員 DPCだと患者住所地もありますね。
○中谷課長補佐 では、申請者の定義でという形になります。
○棟重構成員 では、両方あり得るということですね。
○山本座長 どうぞ。
○野本構成員 2ページの提供範囲についてで、都道府県、市町村、国保中央団体等とございますけれども、実は広域連合、各県に1つずつございますが、これは一つの自治体でございます。これは都道府県、市町村という形の中に読み込めるのかどうか、あるいはそれは対象としていないのか。そこをお聞かせください。
○赤羽根室長 済みません。 NDB の読み方と同じ扱いになりますので、都道府県、市区町村でありますので、基本的にはそこで読むことになるのではないかと考えております。
もう少し言わせていただきますと、これはもともと市区町村と入っていなくて、以前、自治体は都道府県だけだったのです。そのときはどういう形を想定していたかというと、保険者の中央団体ということがありますので、要は健保組合さんであれば健保連なのですけれども、国保さんであれば国保中央会を通じてということが想定されておりましたので、当初の想定を踏まえると、国保中央会を通じてというのが話になってくるかなとは思います。ただ、そこら辺の整理は少し確認をさせていただければと思います。
○山本座長 よろしいですか。
○野本構成員 はい。
○山本座長 ほかはいかがでしょうか。よろしゅうございますか。
それでは、今回御提案の DPC データの提供に関するガイドラインの修正は、先ほどの後期高齢者等の読み方の曖昧さは少し検討の余地がありますけれども、それ以外のところはお認めするということでよろしゅうございますか。
(「異議なし」と声あり)
○山本座長 それでは、そのようにさせていただきます。
引き続きまして、 NDB オープンデータについてということで、まずは概要の説明をお願いいたします。
○赤羽根室長 事務局でございます。
そうしましたら、資料4の「 第3回NDBオープンデータについて」というものをごらんいただければと思います。こちらのほうで、第3回NDBオープンデータの作成をキックオフするという御報告をさせていただければと思います。
1ページ目でございますが、 第3回NDBオープンデータの作成のスケジュールをお示しさせていただいております。
この集計要望の把握・まとめ等々は今月始めておりまして、実際の集計作業を来月から始めていくという流れでございます。こうして作成を年度の後半から来年度と進めていきまして、来年度に今度は3回目のオープンデータを公表していくという流れで考えております。
2ページ目のところで、この3回目のNDBオープンデータに向けましていただいている御要望について、対応方針案をまとめさせていただいております。
少しざっと御紹介させていただきますと、1つ目が従前からいただいているものでございますが、英語版をつくってほしいという御要望で、こちらについては対応可能な範囲でやっていくということで考えております。
2つ目は、二次医療圏ごとの集計ということで、より詳細な集計ということなのですけれども、こちらについては、まだ現時点ではここまで細かい集計をしていくのはなかなか作業量的に難しいということで、引き続き課題として検討とさせていただいています。
3つ目の話としては、集計・公表方法の説明の充実ということで、こちらについては可能な範囲で着手していこうと考えております。
4つ目ですが、全てのデータを一括ダウンロードできないかという御要望をいただいております。これは1つのファイルにしますとかなりファイルサイズが大きくなりますので、どういうやり方があるのかというのは引き続き課題として検討していこうと考えております。
5つ目で、こちらもより細かく集計してほしいということで、都道府県別ですとか性別・年齢階級別のクロス集計というもので、こちらについても3回目での対応は難しいので、引き続き課題として検討ということで考えております。
6つ目でございますが、こちらも一月ごとの集計ですが、やはり細かい集計になってきますので、今後の課題として引き続き検討させていただければと思っています。
7つ目の加算項目についての集計は、2回目のオープンデータで今回対応いたします。
8つ目でございますが、特定保険医療材料料の集計ということで、こちらも作業負荷がなかなか大きくなってきますので、今後の課題ということで、こちらについては第3回のオープンデータでできないかという方向で検討したいと思っております。
9つ目でございますが、病院と診療所を分けたサブグループ集計で、こちらについてもかなり細かい集計になってきますので、こちらは今後の課題として検討ということかと思っております。
それから、10番目以降は薬剤についてかなり細かく出してほしいという話になっております。今回、第2回目のオープンデータでも、第1回目では薬剤については30位までの公表だったのですけれども、今回、上位100位まで拡大するということで、2回目のオープンデータで対応する予定ですので、基本的には2回目のオープンデータで出させていただいた後で、また状況というか、そこら辺を見させていただいて、どうするかを検討させていただきたいと思っております。
12番とか13番についても、同様の対応ということです。
11番については、やはりこちらもかなり細かい集計になってきますので、これは今後の課題ということで、引き続き検討。
14番については、注射薬の最小集計単位をどうするのかというのは1回目のオープンデータの ときから課題になってまいりましたので、今回、3回目の NDB オープンデータをつくっていくに当たって、一度、これは有識者会議で御検討いただければと思っております。
15番、16番については、こちらもやはり細かい集計になってまいりますので、引き続きの課題とさせていただければと思っております。
それから、17番については、eGFRを出してほしいということなのですけれども、そもそも、現在の特定健診の必須の項目としてはクレアチニンは入っておりませんので、現時点での対応はできないのですが、今後、第3期の中で実施されるところがございますので、それを踏まえて、今後、オープンデータでも対応を考えていくということかと思っております。
18番については、質問票については、まず都道府県別集計を2回目のオープンデータからやってまいりますので、こちらで公表させていただいていて、引き続き対応を考えたいと思っております。
最後の19番ですが、尿タンパクについては第3回のオープンデータで集計させていただく 方向で検討したいと考えております。
事務局からは以上でございます。
○山本座長 どうもありがとうございます。
第3回、これからつくる NDB オープンデータですけれども、これに関して、ただいまの事務局からの説明に対して、何か御意見・御質問はございますでしょうか。
どうぞ。
○棟重構成員 5番の都道府県と性・年齢階級別のクロス集計については、以前もできないかということを私自身も発言させていただいて、全部は無理というのはよく理解できました。ただ一部、個別には検討の余地があるとおっしゃっていただいたかと記憶しているのですけれども、第3回に向けて、個別に今後要望させていただくか、あるいは公に要望させていただく機会があるのかどうなのか。その辺を確認させていただければと思います。
○赤羽根室長 オープンデータの作成に取り込めるタイミングでいただければ、その中で対応可能なものは検討したいと考えております。基本的には、3回目のスケジュールの中で対応できるものについては3回目の中で、その先でないと難しいものについては、また4回目以降で考えていくということになるかと考えております。
○棟重構成員 了解いたしました。
○山本座長 ありがとうございます。
基本的には、要望はいつでも受け付けているのですね。
○赤羽根室長 おっしゃるとおりです。
○山本座長 他はいかがでしょうか。
どうぞ。
○頭金構成員 確認なのですが、10番の質問に関して、薬剤の公表範囲を上位100位までということなのですけれども、これは薬効群ごとで上位100ということでよろしいですか。
○赤羽根室長 はい。おっしゃるとおりで、薬効分類ごとです。
○頭金構成員 そうしますと、現在、臨床使用されている薬についてはほとんどカバーできるのではないかと思います。そうなりますと要望の11とか15も、それをもとにデータを利用する側が集計すれば集計できると思います。
○山本座長 消えている升がなければ割と正確に集計できるのですけれども、比較的少なくなってくると横棒になってくるところが結構あって、わからない、実数が見えないところはあるかと思います。でも、100位までやるとかなりのことは見えてくると思いますから、ここに出ている御要望の幾つかは多分、自分たちでやれるみたいなことになるのではないかなと思います。
いかがでございましょうか。
先日、某統計処理の研究会に行ったときに、第1回 NDB オープンデータを使った論文が出ていまして、うれしかったです。ちゃんと使っていただいて、たしか、その大会で論文の優秀賞をとっていたのですよ。きちんとやっていただけているのだなと思いました。
いかがでしょうか。よろしゅうございますか。
それでは、またこれ以外にも構成員の先生方からも要望がございましたら、いつでも要望は受け付けておりますので、ぜひ要望していただければと思います。
それでは、次の話題で、第2回NDBオープンデータの公表についてというものがございますけれども、これは公表前のデータを御審議いただきますので、申しわけありませんが、ここからは非公開の審議とさせていただきたいと思います。
今回、有識者会議のほうで御用意した議題は以上でございますけれども、何か特別に発言はございますでしょうか。よろしゅうございますか。
それでは、これで議事は全て終わったということになりますので、事務局から何かお知らせがありますでしょうか。
○赤羽根室長 ありがとうございました。
それから、次回の有識者会議の日程については、また追ってお知らせをさせていただきます。
事務局からは以上でございます。
○山本座長 どうもありがとうございました。
それでは、特段御意見がないようでしたら、これで第38回「レセプト情報等の提供に関する有識者会議」は終了とさせていただきます。
どうも、お忙しいところ、ありがとうございました。
ホーム> 政策について> 審議会・研究会等> 保険局が実施する検討会等> レセプト情報等の提供に関する有識者会議> 第38回レセプト情報等の提供に関する有識者会議 議事録(2017年8月10日)