ホーム> 政策について> 審議会・研究会等> 保険局が実施する検討会等> レセプト情報等の提供に関する有識者会議> 第17回レセプト情報等の提供に関する有識者会議 議事録(2013年12月19日)




2013年12月19日 第17回レセプト情報等の提供に関する有識者会議 議事録

○日時

平成25年12月19日(木)10時00分~12時00分


○場所

厚生労働省専用第22会議室
東京都千代田区霞が関1-2-2


○議題

1 レセプト情報等の利活用の促進について
1.1 説明会参加者、データ利用者へのアンケート結果
1.2 利用者ヒアリング(敬称略)
(特別抽出)
国立がん研究センター がん対策情報センターがん統計研究部診療実態調査室 室長 柴田 亜希子
申出内容:レセプト情報等を利用したがん患者数計測に関する研究
(サンプリングデータセット)
独立行政法人 国立精神・神経医療研究センター精神保健研究所 社会精神保健研究部 部長 伊藤 弘人
一般財団法人 医療経済研究・社会保険福祉協会 医療経済研究機構研究部 研究員 奥村 泰之
申出内容:向精神薬の処方パタンの探索的分析

2 第三者提供における運用上の課題について
2.1 提供するデータの特性とセキュリティの確保について
2.2 サンプリングデータセットにおける公表基準の適用について
2.3 データ提供における利用場所・利用者等の重複について
2.4 DPC 機能評価係数におけるレセプト情報等の活用について

3 基本データセットについて

4 その他

○議事

○山本座長 それでは、定刻より少し早いのですけれども、猪口先生を除いて参加予定の委員の先生方全員お揃いですので、ただいまより第17回「レセプト情報等の提供に関する有識者会議」を開催させていただきます。
 構成員の皆様には、歳末のお忙しいところお集まりいただき、御礼を申し上げます。
 会議に先立ちまして、本日の構成員の出欠状況等について、事務局から報告をお願いいたします。
○佐久間室長 事務局でございます。
それでは、本日の構成員の出欠の状況につきまして、御報告させていただきます。
 欠席の御予定としていただいてございますのは、印南構成員、新保構成員、頭金構成員、宮島構成員から御連絡をいただいております。また、猪口先生におかれましては、15分程度遅れるという御連絡をいただいてございます。
開催要件に関しましては満たしてございます。
以上でございます。
○山本座長 ありがとうございました。
 それでは、開催要件を満たしているとのことですので、早速議事に入りたいと思います。今日もなかなか盛りだくさんですので、できれば効率よく進めていきたいと思っておりますので、どうぞ御協力よろしくお願いいたします。
 まず、本日の議題「1 レセプト情報等の利活用の促進について 1.1 説明会、データ利用者へのアンケート結果」につきまして、事務局から説明をお願いいたします。
○佐久間室長 それでは、御説明申し上げます。資料1の方をお手元に置きながら御説明をさせていただきたいと思います。
 経緯なのでございますけれども、9月に開催されました前回の会議におきまして、レセプト情報等の利活用の促進を検討するに当たりまして、利用者などからのヒアリングを行って、また、海外におけるレセプト情報等の利活用の状況を参照しながら、具体的な利活用の促進策などを検討していくということを確認させていただいてございます。
 また、説明会の参加者の方々に対するアンケートを実施するとされておりまして、今回は、このアンケート結果につきまして御報告をさせていただき、説明会の参加者、利用者の方々からの御意見を御紹介したいと考えてございます。
それでは、資料1を1枚めくっていただきまして、2ページ目「1.1 説明会参加者、データ利用者へのアンケート結果」を御覧ください。
アンケートの概要でございます。
まず、説明会参加者の方で特に申出に至らなかった方々に対しまして、申出に至らなかった理由の把握ということと、データの利用者の方々に対しまして、利用の手続とかデータの質等に関する意見の聴取のために、メールによりアンケートを行いました。
対象としては、説明会の参加者、第3回、第4回に参加されましたが、申出に至らなかった方々。利用者の方々は実際のレセプト情報等の提供を受けた方々で、サンプリングデータセットにつきましては、前回アンケートをさせていただいていますので、こちらの方は対象から除いてございます。
質問の内容といたしましては、「申出を行わなかった理由」「手続きに関する意見」「データに関する意見」等々でございます。
回収の結果は、説明会参加者8名、利用者7名から回答を得てございます。
主な意見・要望でございます。下の点線の枠の中の左側を御覧ください。
説明会参加者の御意見、御要望でございます。こちらは主なものを抜き出してございます。詳しいものについては、3ページ以降にございますので、こちらを御参照ください。
まず、「申出を行わなかった理由について」でございます。
「セキュリティ要件を確保することができなかった」ということ。
「手続きや医療データの解析を行える人員を準備できなかった」ということで、主に研究環境とか研究の体制のことが多かったというふうに思います。
「利用環境の整備について」というところですと、先ほどのセキュリティのことでございますけれども、「専用の部屋を確保するのが非常に難しい」とか、御要望として「基盤の弱い施設の利用者に対し、要件を満たす施設を設けてもらい、データを活用する道を開いてもらえると有り難い」というような御意見もございます。
「データについて」は、「データの構造がわからず、どのような分析ができるか自信がない」。
「その他」でございますが、「レセプトデータはニーズも高く、いつか利用できれば」ということをおっしゃっている方もいらっしゃいます。
2つ目のポツは、詳細な集計表の作成などについて、こういった利用ができればということで、御相談ができればありがたいというようなアンケート結果がございました。
こちらの方は説明会参加者の方々の御意見の主な事項でございます。
右側は利用者の方々、特に抽出のデータ、個票のデータを使われた方々の御意見、御要望でございます。実際に使われた方々ということでございまして、細かい御意見が多いのですけれども、御紹介させていただきます。
「申出手続き、審査について」でございます。
「審査基準があいまいである」とか、「添付すべき文書が多くて、煩雑だ」というような御意見。
また、同じ研究を再度申請する場合については、手続を簡略化できないかという御意見もございました。
「要求されているセキュリティ水準について」です。
「セキュリティ要件を満たすための準備に相当のリソースを要した」ということ。
また、条件自体が厳し過ぎて形骸化しかねないような過剰な制限がなく、個々が達成できる水準でのセキュリティ要件を示してほしいとか、こういう御要望もございます。
「データについて」でございます。
ハッシュ値の精度ですとか、あとは任意の入力項目がどのぐらい入力されているのかということについて教えていただきたいということ。
「その他」といたしまして、1つ目のポツで、データを実際に研究に使える形にするのに一定の時間が必要なので、利用期間について短いというような御意見がございます。
3つ目のポツ「利用者が、後進を助けることを義務化してもよいのではないか」とか、ほかのデータとのリンケージということで、「公的データとの連結は認めてもよいのではないか」という御意見がございます。
主な意見としては以上でございまして、細かいところについては、3ページ、4ページ、5ページにございますので、こちらの方を御参照いただければと思います。
以上でございます。
○山本座長 ありがとうございました。
 ただいまの御説明に関しまして、御意見、御質問がありましたら、どうぞよろしくお願いいたします。いかがでしょうか。では、大久保先生。
○大久保構成員 確認ですが、「データについて」というところでハッシュ値の揺れがあると書いてありますが、これは具体的にどういうことなのでしょうか。
○山本座長 事務局から説明されますか。
○佐久間室長 アンケートに書かれていることなので、想像の部分も入ってくるのですが、ID自体の揺れということで、IDをつなげるときにハッシュ値が必ずしも一致しない場合もあるということで、そこがつながりやすくなるようにという御要望だというふうに認識しております。
○山本座長 よろしいですか。
○大久保構成員 はい。
○山本座長 他にいかがでしょうか。
 次も実際に御利用された方のヒアリングがありますので、それとまとめて御議論いただいても結構かと思いますので、次に進めさせていただきます。
 それでは、「1.2 利用者ヒアリング」につきまして、まず事務局から説明をお願いします。
○佐久間室長 それでは、これからは実際に利用された方々から御意見を聞いてまいりたいと存じます。
まず、特別抽出でデータを利用された方、次にサンプリングデータセットでデータを利用された方について、御意見を聞いていきたいと思っております。
まず、国立がん研究センターの柴田先生より、特別抽出での利用経験からの御説明をお願いしたいと思います。
よろしくお願いいたします。
○柴田参考人 おはようございます。国立がん研究センターの柴田でございます。ちょっと風邪を引きまして変な声で、お聞き苦しい声になることを御了承ください。
 皆様のお手元の資料1-1について説明させていただきたいと思います。
 私は、第1回の決定申出として、がん患者数計測資料としてのレセプト情報等の利用可能性ということを目的として申出を決定していただいたものになります。
 こちらのことを目的としてレセプト情報等を利用させていただきたいと思いました背景としましては、私は、本業といいますか、いつもは、がんの統計を正確にはかるということを主にしております。
その中で、がんの罹患を正確にはかるということにつきましては、韓国では保健医療情報をがん登録のケースファインディングで使っているという事例がございます。また、これは北欧の幾つかの国でも同様でございます。
韓国のように、各都道府県ががん登録のケースファインディングとしてレセプト情報等を使える可能性はないかと以前から考えておりました。
それを考える以前として、レセプト情報とはどういう情報なのか、保存形式、利用手続について私どもの方が把握しておかなければならないということで、今回利用申出をさせていただいております。
目的として、がんの患者数、有病数の計測資料としてのレセプト情報の可能性について検討する過程を通じて、レセプト情報等がどういうものなのかということを分析させていただいたというところです。
がんの患者数というものは、実はよくわかっておりません。患者数、有病数というものは一般にそうかと思うのですけれども、一般的に患者数として利用されているものは、患者調査の総患者数、あるいは推計患者数で入院数と外来の数を足したものとか、そういうものかもしれませんが、あるいは罹患数と生存率から推計した5年有病数というものも患者数として代用されていることがございます。
今まで一般に利用されている既存の資料としましては、総患者数とか5年有病数というものがございますが、今回レセプト情報等から得られる数がどのような特性を持つのか、これらの既存資料との比較によって考察することを目的といたしました。
ページをお送りください。
 もう大分前になるのですが、私は、2011年5月10日、11日に開催された事前説明会に参加しまして、自分でデータハンドリングができそうかどうかを見きわめることにさせていただきまして、その際の感想としましては、私は日常的に100万件近い情報をデータリンケージしながら扱っておりますので、データそのものは扱えるかなと判断しました。
 セキュリティについては、地域がん登録事業を通じて個人情報の安全管理対策に関してかなり勉強いたしまして、その予備知識がありましたので、これもいけるかなと思いました。
マイナス材料として、自分自身は余りレセプト情報等について知識がないのです。ただ、これについては、診療報酬について詳しい同僚がいるので、助けていただこうということで、申請に踏み切りました。
実際に提供依頼申出手続において困惑した点が幾つかございましたので、御説明させていただきます。
 2点です。
 1番目はガイドラインの6ですが、提供依頼申出書の記載事項の中に「提供依頼申出者の氏名、生年月日、住所及び所属・役職、連絡先」とあるのですが、「その代表者又は管理人の氏名、生年月日、住所、役職、連絡先を記載する」とございます。
 こちらは、そのとおりに読むと、私の所属する国立がん研究センターとしましては、理事長のプライベートな住所や電話番号を記載するような形に受け取りました。これは公開されていないので、結局、突き詰めることはなく、公的な情報を記載して申請に使わせてもらっております。
 2点目としましては、本人確認情報の一環として所属機関の確認がございます。それは「所属機関の登記事項証明書又は印鑑登録証明書」ということだったのですが、国立がん研究センターのように公に認知されている組織でも、この組織の存在証明というものが必要なのかどうかということは非常に疑問に思いました。
次に進みます。
 申請したデータの抽出要件は、以下のとおりになります。
自分がどの程度扱えるのか全くわからなかったものですから、非常にシンプルな申請にさせていただきました。
これらの抽出条件に基づいた情報の提出を受けまして、利用している最中に一番困った点としましては、中間生成物の扱いでございました。
 中間生成物の定義としましては、「レセプト情報等から作成される全ての生成物」ということに伺っております。
運用管理規定を事前に策定する段階においては、中間生成物として作成したファイルや中間生成物の一部を打ち出した紙媒体は、ナンバリングして全て管理台帳で管理ということで申請をさせていただいております。
中間生成物のファイルの台帳管理は規定の用紙に手書きで行うことにしていたのですけれども、これがなかなか煩雑でして、中間生成物として作成するファイルをつくるのをなるべく限定するという方向になってしまいました。
また、1日の作業終了時に作成したファイルをパソコン上の画面キャプチャーで一次記録して、それを印刷するような形で管理台帳の代用としております。
 また、共同研究者との打ち合わせのために、中間生成物の一部を打ち出した紙媒体を利用したいときもあったのですが、通常作業を行う場所から持ち出す際に、中間生成物の中でも個人情報とは言えない内容にまで持ち出し規定が適用されるのが煩わしくて、打ち合わせを限定する方向に走る結果になってしまいました。
次にお進みください。
以下は分析した結果になりますが、最初にやった手順のとおりに並べてあります。
まず、2010年4月から2011年3月分の12カ月分のレセプト提供をいただいたのですが、月当たりにどのぐらい件数があるのかというのを数えまして、大体安定していそうな後半の8月から3月までの8カ月分を結局使用させていただきました。
これは最初にいただいたレセプトの8カ月分です。
がん傷病名レコード総数はこのとおりです。
修飾語コード“疑い”を除くと、これで40%減になりました。
対象Cというのが修飾語コード“疑い”を除いたものなのですが、それの中での同一部位重複というのをカウントしまして、それを除きますと対象Eの方になります。
 対象Eの中でICD-10コード“D”というのが、上皮内とか良性脳腫瘍等が含まれているのですが、ここを扱う自信がなくなってきましたので、これをちょっと除かせていただきまして、最終的にはICD-10で言えばCコードだけの集計になっております。
 さらに、対象Gというのを解析対象にしようと思ったのですが、対象Gの中で1つ以上のがん傷病名を持つレセプト件数が全体の約34%を占めておりまして、この差には「真の多重がん」と「重複カウント」が含まれているのかなと考えております。
次のページに進みます。
行った分析もシンプルなのですが、まず、年齢階級別に既存の統計資料である総患者数、5年有病数と今回のレセプト件数というものを調べております。
部位別も、レセプト件数は余り少量のものを集計するのは許されておりませんので、数が少なくなり過ぎないようなものということで選んだ部位として、胃、肺、膵、膀胱、中枢神経系、白血球に代表させてグラフ化しておりますが、このような解析を行っております。
 得られた結論ですけれども、がん患者数・有病数に関する指標として、データソースとしては、今の日本には患者調査、がん登録、レセプト等があるのではないか。
ただ、それぞれ調査対象が違いますし、実測なのか、推計なのかというのも違いますし、それぞれ数えている対象も違いますし、それらによってそれぞれの指標に特徴があることがこの分析を通じて私自身は理解できました。
 最後に、レセプト情報等への期待を申し上げます。
日本に現存する唯一のadministrativeな、悉皆的な(全数調査の)疾病データベースのようなものであると私は理解しております。
がんについては、同一人物の連結後の月平均レセプト件数は、リンケージエラーによる誤差を含んでいましても、一般の人がイメージする患者数に近い数を選んだのではないかと思っております。
特に標本調査である患者では推計が難しい、数の少ないがんの統計資料としての期待が高いのではないかと考えます。
本利用における成果物、4~5指標の集計表しかつくっていないのですけれども、それを得るために本ガイドラインに基づくレセプト情報等の利用申出を行うのは、確かにデータ量やデータの管理においてハードルが高いなというのが実感です。
がんを初めとして、需要のある一部の疾患については、こちらの提供側の方で同一人物の連結をあらかじめ含んで定式化・標準化を行った上での集計結果の提供等、ほかのレセプト情報等の提供とは別の提供の仕組みの構築に期待させていただきたいと存じます。
以上です。ありがとうございました。
○山本座長 柴田先生、どうもありがとうございました。
 ただいまの御説明に関しまして、御意見、御質問がありましたら、どうぞよろしくお願いいたします。いかがでしょうか。
 確かに代表者の住所は不要ではないかと思いますね。
どうぞ。
○加藤(源)補佐 この8月にガイドラインと申出に当たっての様式一式を改めたのですが、そちらの方では、住所に関しては、特に所属機関の代表者に求めることは改めさせていただいており、申出者の方からしても幾ばくかは書きやすい書類に修正をさせていただいております。
○山本座長 ほかにいかがでしょうか。
それ以外に、柴田先生の方で御指摘になっている特に困惑した点等で既に改善されている点はあるのですか。そこだけですか。
○加藤(源)補佐 そうですね。中間生成物に関しての扱いという点では、まだ我々の方で手をつけてはいない問題でございます。
○山本座長 ありがとうございます。
 府川先生、どうぞ。
○府川構成員 ただいまの御説明の一番最後のページの2点目なのですけれども、御説明ですと、このレセプトデータで、最後レセプトの件数をカウントされていますが、例えば患者調査ですと、1日の調査ですから人数ベースですね。レセプト件数から人数に換算して、患者調査と大体同じぐらいの数が得られたという結論に達したということでしょうか。
○柴田参考人 今日、説明を急がせていただいたのですが、私どもは、もともと持っている資料として患者調査の総患者数と罹患率から推計する5年有病数というものがあるのですけれども、それがもともと2倍近い開きがあるのです。2倍近い理由について、なぜ起こるのかというのもわかっていなかったのです。
勝手な想像で、患者調査はサンプリングなので、全然よく数えられていないのではないかとは思っていました。なので、真の値というものは、まだ誰にもわからないと思います。
定義次第によって患者数というものが変わりますので、今回、最後のページで曖昧な言い方をさせていただいていますが、一般の人がイメージする患者数に近いものはどれなのかということで言うと、多分患者調査の総患者数はそうではないと思っています。
○山本座長 ほかにいかがでしょうか。
 セキュリティ要件の中で中間生成物の問題というのは、柴田先生の御研究のような単純なデータの中間生成物であれば、確かにそれはもう少し緩めてもいいかなという感じにはなるのですけれども、ただ、そうとは限らないので、そういう意味では、中間生成物を例えば紛失するとか、漏えいすることによって深刻な事故が起こる可能性もあるのですね。だから、そういう場合分けをするというのはかなり難しいですね。状況によって変わってしまいますので。むしろ運用上で工夫をしていただくような、そういう実例をどんどんオープンにして、研究者の方が参考にされるようなアシストをしていくのが一番いいのだろうと思うのですが、今日お話しいただいたような経験を踏まえて、そういう事例集をつくってやっていくということになるのでしょうね。
 ほかに何か御意見ございませんでしょうか。
 それでは、柴田先生、ありがとうございました。参考にさせていただいて、これからの取り扱いを検討させていただきたいと思います。
引き続いて、サンプリングデータセットの方に行きたいと思います。
ヒアリングをさせていただく方の御紹介を事務局からお願いいたします。
○佐久間室長 それでは、サンプリングデータセットの利用者でございます国立精神・神経医療研究センターの伊藤先生、医療経済研究機構の奥村先生より、利用経験を踏まえた御意見を御説明いただきたいと思います。
それでは、どうぞよろしくお願いいたします。
○伊藤参考人 本日は、このような場で発言させていただく機会をいただきまして、ありがとうございます。
御提示いただきました環境を整備しまして、データをお借りし、そして短い時間ではありましたが、研究論文を公表させていただきました。
これまで指摘はされていたのですが、有志の病院での調査ということもありまして、今回のサンプリングデータセットは全国データの分析ということで、我が国では初めての分析ということもありまして、新聞等で取り上げていただき、このデータのインパクトの大きさを拝察しております。
なお、我々国立精神・神経医療研究センターでは、こういう状況を鑑みまして、いかにシンプルな抗精神病薬の処方をしていくか、それを支援するようなガイドラインを並行して臨床研究しておりまして、そのガイドラインをこの10月に公表しまして、このデータの分析の結果と、どういうふうにゆっくりと減らしていくかというガイドラインとセットで今、研究を進めておる次第であります。
レセプト情報は二次利用でありますからデータには限界がありますが、その中で何ができるかを考え、学術的、社会的なニーズに応じた分析ができるようになったということでありまして、政策研究者の一人としましては、関係者の御理解と御高配に感謝を申し上げております。
また、次のステップとして何が課題かを建設的に御検討いただきたいという思いもありまして、本日このような機会を設けていただき、大変光栄でございます。
サンプリングデータセットを活用させていただいた経験、そして今後広く活用されるという観点から幾つか御提案を申し上げます。
具体的には、実際分析環境を整備し、分析し、論文化しました奥村研究員から説明をいたします。奥村研究員は、本年3月まで当センターの研究員という立場でこのデータセットの分析に関与してきました。4月から所属が変わりましたので、3月までの経験に基づくとともに、その後の専門家としての経験を加味してお話をしていただきます。
よろしくお願いします。
○奥村参考人 医療経済研究機構の奥村と申します。本日は貴重な機会をいただき、ありがとうございます。
 資料1-2を御覧いただければと思います。「サンプリングデータセットの利用経験:匿名性の高いレセプト情報の利用環境向上に向けて」というタイトルでお話しさせていただきます。
先ほどお話がありましたように、私どもは昨年10月末にサンプリングデータセットの承諾をいただきまして、分析を進めてまいりました。その後、ことしの7月に「臨床精神薬理」という雑誌に論文が掲載される運びとなりました。
その結果の概要でございますが、下の資料の左下の図を御覧いただければと思います。
この研究では、統合失調症の患者さんの抗精神病薬の処方状況を見ております。その結果、出来高の病棟と比べると、包括の病棟の方がよりシンプルな処方ができているという結果が得られました。
また、入院と外来を比較いたしますと、入院の患者さんの場合は、約4割の方に3剤以上の抗精神病薬が処方されているという現状が明らかになりました。そうした結果が右下の図にありますように、新聞に掲載されるような運びとなっております。
次のスライド、3ページ目を御覧いただければと思います。
こうした経験を踏まえまして、私どもがサンプリングデータセットを使わせていただいている過程で気づきました疑問点を御紹介いたします。
第一の課題といたしまして、母集団の定義の均一化が必要ではないかと思っております。
具体的にはレセプトの区分によって母集団の定義は現状では異なる状況でございます。
医科入院-DPC-調剤に関しましては、母集団がレセプト件数となりまして、人ではない数が母集団となっております。
一方、医科入院外の方はハッシュ値1の総数が母集団になっておりますので、こちらは人数に近似している値が母集団になっております。医科入院-DPC-調剤の方も、ハッシュ値1に母集団を統一していただくことができるのであれば、人数に近似いたしますので、母集団の定義としてきれいな形ができるのではないかと思っております。
次に、4ページ目のスライドを御覧いただければと思います。
「標本抽出理論の利用可能性の向上について」でございます。
サンプリングデータセットは、ランダムサンプリングされているデータでございますけれども、そのデータから標本抽出理論を適正に使うことができれば、ある統計的な推測のもとに母集団の状態を推測することができます。ただ、その場合は、標本抽出法の具体的な名称を開示していただくということと、その重み、ウエートの情報も開示していただくということ、この2つが合わさって初めて我々利用者の立場からは母集団の情報を推測することができるようになります。
続いて、5ページ目でございます。
サンプリングデータセットは匿名性が非常に高い状況でございますけれども、有用性の高い情報も同時に匿名化のために削除されているものがございます。
具体的には、都道府県と施設特性に関しましては、この2つの情報がありましたら地域差や病診区分の分析が可能となりますので、より政策に密着した研究ができるようになるのではないかと思っております。
今までが現在のサンプリングデータセットの構造上の課題について、お話しさせていただきました。
続いて、今後別枠のデータセットがつくられるのであればという前提のもと、お話しさせていただきます。6ページ目を御覧いただければと思います。
現状では単月のレセプトでございますので、10月の診療分に限定されております。
こうした状況下で、治療継続の状況を検討できないという点、あと、仮に治療中でも、たまたま10月に未受診の方は欠損になってしまいます。
例えばサンプリングされた基底集団に関して、6カ月分のほどの情報がありましたら、より有用性の高いデータセットになるのではないかと思っております。
続いて、7ページ目を御覧いただければと思います。
教育用の公開データセットの必要性が高いのではないかという雑感を持っております。
具体的には、レセプトの分析のための教育の資財を開発するためのベースとなるデータとか、データハンドリングのプログラムを研究者間で共有できるようになるという目的のために使えるのではないかと思っております。
そのための要件といたしましては、いかに皆様が利用できるような環境を整備するかということが重要になりますので、オンラインで入手可能であるということ。一定の容量があるということ。実際ハンドリングはかなり難しいですので、ハンドリングの難しさを実感していただく程度の容量のある教育用データセットがありますと、こうしたデータセットを分析できる人材自体がまだ少ない状況でございますので、そうした人材を育成する土台となるのではないかと考えております。
最後に、8ページ目でございます。
高度なセキュリティ要件の必要性について雑感を持っております。
現状では、サンプリングデータセットは、個人の識別可能性が非常に低い状況で作成していただいているかと思っております。
抽出率は、入院ですと10%、入院外ですと1%、高額レセプトは母集団から削除されている状況でございます。
希少傷病名、希少診療行為に関しては匿名化されております。
こうした状況下で、かつ対照表もございませんので、連結不可能匿名化された情報とみなせる可能性が高いのではないかと雑感を持っております。
以上でございます。ありがとうございました。
○山本座長 どうもありがとうございました。
ただいまの伊藤先生、奥村先生からの御発表に関しまして、御意見、御質問がありましたら、どうぞよろしくお願いいたします。
ここで御指摘いただいた点のサンプリングデータセットの扱い等に関しましては、議事の2つ目でこれから少し議論をしていただくことになるかと思いますので、今の御発表の中身の方に関しまして何かありましたら、どうぞよろしくお願いいたします。石川先生、どうぞ。
○石川構成員 今の発表を聞いて、大変有用だと思うのですけれども、8のスライド「高度なセキュリティ要件の必要性」というところがありますが、こういう評価をされていると思うのですけれども、一方で、5番目のスライドにありますように、匿名化されて、御自分たちの研究にとっては少し幅が狭まるという御発言もあったと思うのですが、今後、8ページのセキュリティ要件の高さということを維持しながら、多少の狭さはあっても日本のいろんな研究に使えるものだという感想といいますか、そういうものがあるかどうか。研究者としての今後の方向性みたいなものについて、感想みたいなものは何かありますか。これは使えるとか、これは使えないとか、ここら辺はちゃんと改善するべきだとか、それはどうでしょうか。
○奥村参考人 ありがとうございます。
 今回思いましたのは、統合失調症の患者さんというのは、比較的患者数が多い分析でありますので、現在の抽出率で何とかなったという感があります。
仮にもう少しメジャーではない疾患に着目してしまうと、恐らく今回の抽出率ではなかなか難しかったのではないかという雑感を持っておりますので、抽出率の数がもう少しふえると、より多くの研究者の方にとって役立つ可能性が高いと強く思っております。
○山本座長 どうぞ。
○伊藤参考人 今のことについて私の観点からお話ししますと、抗精神病薬もありますし、抗不安薬、睡眠薬、こういった向精神薬系というのは比較的広く使われていますので、こういったところの分析、また、いわゆるコモンディジーズ、医療機関が特定されるというよりは、地域で考えていくような分析に即するような領域においては、今、御指摘いただいた2つをある程度バランスをとっていけば可能なのではないかなと思います。
○山本座長 ありがとうございます。
 ほかにいかがでしょうか。大久保さん。
○大久保構成員 今のことに関連しますけれども、「高度なセキュリティ要件の必要性」というところに関して、こういう条件で抽出されているので、「連結不可能匿名化された情報とみなせる可能性が高い」ということで、これは高度なセキュリティ要件を緩和してもいいという意味ですか。今あるセキュリティ要件をより緩和してもいいという御意見のように聞こえるのですが、そういうことでないのですか。
○奥村参考人 おっしゃるとおりでございます。
○大久保構成員 「高度なセキュリティ要件の必要性」というタイトルは、緩和してもいいという意味のタイトルですか。
○奥村参考人 はい。
○大久保構成員 わかりました。
○山本座長 ほかにいかがでしょうか。石川先生、どうぞ。
○石川構成員 今のこの御報告は、その研究に至るまでのいろいろな経過の中での感想だと思うのですけれども、1ページ目の下のところに新聞の記事が載っています。これが出たときに、実際には医療界の中ではえっというふうな感じがありました。
事務局にもお聞きしたいのですが、発表のところでのプロセスについても私たちは一応チェックするということがあったと思うのですが、この会議はもう17回にも及んでいますので、こういう研究をされて発表が出たところの我々の点検の度合いだとかそういったものについて覚えていれば、もう一回反すうしていただきたいと思うのです。
これは大変インパクトがある研究だったわけです。我々はどういうふうに作用したかということについて、ちょっと。もちろん、セキュリティの問題とか個人情報ということを言っているわけではなくて、ナショナルデータベースを使った研究で発表すると、社会的にはこういうふうにいろんな作用が起こる。そこでの我々の途中のチェックはどうだったかということについてはどうでしょうか。
○加藤(源)補佐 奥村先生、伊藤先生の御研究というのは、新聞に掲載される前に、何かの雑誌に投稿されていて、その投稿された論文を見た記者の方がお書きになられた記事であったと聞いております。
実際に論文を書かれたときに、公表形式に関しては基準を満たしてはいたのですが、恐らく有識者の方、座長に確認をおとりしており、そのうえで論文として上梓されていたと記憶しております。ただ、発表された論文がその後、報道されるということに関しては、この有識者会議で報告してはおりませんでした。
○山本座長 どうぞ。
○石川構成員 これは、実際に医療をやっている人間からすると、いわゆる薬漬けという批判的な側面が出てきたみたいなところがありまして、我々にとってはインパクトがあったのです。ですから、事前にそういうことが予想できたか、できなかったかということをちょっと思ったのです。今後もナショナルデータベースでいろんな影響が出てくると思うので、私たちはそういうのもちゃんと見ていかなければいけないということの実例だと思います。どうもありがとうございます。
○山本座長 見ていくと言ってもなかなか難しい問題がありますけどね。
 ほかにいかがでしょうか。
練習用ツールというか、練習用のデータセットは、随分前からこの名前があって、何回か議論をした覚えがあるのですけれども、これはやはりあった方がいいのでしょうね。それなりの規模のものを用意して、実際にさわっていただいて、研究のイメージをまずつかんでいただいた上で、申請をしていただくというのがスムーズだと思うのです。
これはどうしますか。つくるのは、データサイエンスの観点で言えば、識別性をほとんどゼロにするようなつくり方というのは幾らでもあると思うのですが、実際はそれを誰がどのタイミングでやるかということになると思うのです。
レセプトの場合は、改定があると形式が少しずつ変わってくるので、1個出しても、それで本当にやれるのかという問題は確かにあるのです。そのたびに少しずつ変わった形式に関してつくるのかということも考えないといけないと思うのですが、何か御意見ございますでしょうか。どうぞ。
○松田構成員 目的に応じてデータセットの形が変わってきてしまうので、今までの申請をある程度類型化して、それに合った形のものをつくっていかないといけないと思うのです。結局、もとのものをそのまま出しても、多分ほとんどの方はできないと思うのです。今はもとのやつから例えばIRとかSBとかSYとかを抜く形で、それをフラットのテーブルにしてお出ししているということだと思うので、そのフラットなテーブルを研究の類型別につくるというレベルでやるのか、あるいはもとのレセプトに近い形のものを提供するのかによって、多分つくり方が違ってきてしまうと思うのです。そこは研究者の方がどのレベルでのデータセットを要求されているのかということに合わせてつくるということなので、なかなかしんどいなとは思うのですが。
○山本座長 個別抽出に関しては、無制限に場合の数がふえてくるのですけれども、サンプリングデータセットに関しては形式が決まっていますので、これの練習用のデータセットみたいなのがあると、よりアプローチしやすくなるというのは確かだと思うのです。
まずはサンプリングデータセットと今日今日3番目の議事にある基本データセットみたいなものも、本物でない、公開してしまえるようなダミーデータセットがあった方が、利用の促進という観点からはいいように思いますけれども、これは後でまた議論をいたしましょうか。
ほかに何かございませんでしょうか。どうぞ。
○稲垣構成員 1点質問ですが、6ページ目の「単月レセプトの限界」ということで、サンプリングデータセットを最初設定したときからこの辺は課題として限界があることは明確だったのですが、これを拡充する、複数月にするとか、そういう方向はあるのでしょうか。
○山本座長 どうぞ。
○加藤(源)補佐 この後に満武先生から御報告いただく、研究班でつくっていただいている基本データセットは、もともとのコンセプトが、一定程度の期間を紐付けたデータセットとして準備したいということでつくっていただいているところでございます。
細かい話になるかと思いますが、含まれている項目サンプリングデータセットと異なるのですが、用途に応じて使い分けていただくということをまずしていただくことかなと思っています。
例えば期間を延ばす場合、3カ月にすべきか、6カ月にすべきか、あるいは1年にしたときは、せっかくつくっていただいた基本データセットとのすみ分けをどうするのかという問題がございますので、まずはそういった方向での御提案からになるのかなという印象を持っております。
○山本座長 よろしいですか。
○稲垣構成員 はい。
○山本座長 ほかにいかがでしょうか。
それでは、伊藤先生、奥村先生、ありがとうございました。参考にさせていただきます。
2番目の議題「第三者提供における運用上の課題について」ということで、説明を事務局からお願いいたします。
○佐久間室長 それでは、御説明申し上げます。
資料2を御覧ください。
「第三者提供におる運用上の課題について」ということで、1枚めくっていただいて、「2.1 提供するデータの特性とセキュリティの確保について」ということで、これは個人の特定可能性のリスクと利用者に求めるセキュリティの要件について、シェーマをつくったものです。
縦軸に個人の特性可能性で、上に行くほど匿名化処理をしていなくて、リスクが高い。横軸の方は利用者に求めるセキュリティ要件ということで、右側に行くほど厳しい。こういった表でございます。
現在、提供させていただいているものは、実線で囲ってある右上のところに書いてございますが、「特別抽出」「サンプリングデータセット」「集計表提供」ということでございます。
例えば特別抽出、個票のデータの取り扱いは、匿名化の処理を特にしているわけではございませんで、セキュリティ要件については、一定のセキュリティ環境と利用者の環境の実地の監査を行うとか、こういった要件を課してございます。なので、一番右上にございます。
その下のサンプリングデータセットについては、一定程度の個人の特定性を下げるような匿名化の措置をしているのですが、現行ではセキュリティ要件に関しては、特別抽出の方と同じ要件を課しているということでございます。
集計表についても、さらに匿名性が高くなっているということでございますが、現行では、セキュリティ要件については、明確な定めがないということもありまして、実行上、特別抽出の並びになっているという状況がございます。
課題として挙がってくるところで、まずはサンプリングデータセットと集計表のところでございますけれども、サンプリングデータセットについて、匿名性を考慮した場合にどの程度のセキュリティ要件が適当なのかということが課題になるというふうに認識してございます。
集計表の提供についても矢印で書いてございますが、こちらは審査の手続の関係もございますが、セキュリティ要件はどの程度のものが適当かということで、どの水準のものを求めるべきかというのが1つの課題として挙がってきているところでございます。
 後ほど議題3のところで説明があると思いますが、基本データセットは点線で書いてございまして、これはまだ提供しているものではないのですけれども、これは年度単位で患者を紐付けたデータセットになってございまして、どの程度のセキュリティ要件が必要かということで、これも議題3で御議論いただこうと思います。
 左下の隅に「定型表」と書いてございます。定型で公表できるようなものをということでございますが、これもアンケート結果の御要望と、先ほど柴田先生の方からもお話がございましたけれども、こちらの方の課題として、研究者が自由に各種分析に活用できるようなものについて集計する項目、どのようなものが適当か。こういったものが課題に挙がってくるというふうに認識してございます。
 今回は、特にサンプリングデータセットと集計表の提供のところについて御議論を中心にいただきたいと思います。
 1枚めくっていただきまして、3ページを御覧ください。
 「サンプリングデータセットの利用環境のあり方について」でございます。
1番目の矢印は、サンプリングデータセットの説明をしてございます。単月分のデータから一定の割合で抽出して、傷病名や診療行為の患者情報について、少ないものに匿名化処理を行っているデータセットということでございます。
先ほど申し上げたとおり、これまで特別抽出と同じようなセキュリティ要件を求めていますけれども、前回のアンケート、今回ヒアリングをさせていただいた奥村先生の方からも意見がございましたが、セキュリティ要件の緩和を検討できないかという話がございまして、前回の有識者会議において検討をしてはどうかということでお話をいただいているところでございます。
具体的にどのような匿名性の処理をしているかということを整理したのが次のページでございます。
4ページを御覧ください。
こちらは、レセプトの原票とNDBに入っているレセプト情報等のデータ、サンプリングデータセットについて、それぞれどういった処理がされているかというのをシェーマにしているものです。
まず、レセプト原票の方を御覧いただいて、医療機関情報ですと、これはもともと原票ですので、都道府県の情報とか、医療機関コード、医療機関名、電話番号等も入っているものです。
属性情報についても、レセプト番号とかカルテ番号、生年月日、氏名、性別等々が入っています。
保険者情報も、保険者番号、被保険者証等の記号、番号もそのまま入っています。
傷病名、診療行為、医薬品ももちろん含まれております。
表の真ん中のところがNDBに入っているデータについてでございます。
医療機関名、電話番号は削除してございます。
カルテの番号も削除してございます。
個人の生年月日の「日」については削除。
また、氏名は匿名化をしている。
保険者情報についても、被保険者の記号、番号等は匿名化をしてございます。
コメント等々のテキストの情報は削除している。こういった個票のデータです。
次に、サンプリングデータセットの方でございますが、これに加えまして、都道府県情報等は削除しています。
医療機関コードも削除。
属性情報については、単月分のデータで1%または10%の抽出データ。
保険者番号についても削除。
傷病名とか診療行為等々につきましても、希少なものについては匿名化処理をしてございます。
また、高額のレセプト等、個人の特性可能性がありそうなものについては削除する。
こういったデータセットになってございます。
こういったことを鑑みますと、サンプリングデータセットの個票データは、十分に個人の特定可能性を下げる処理をした匿名性の高いデータとして位置づけられるのではないかということをまとめてございます。
一方で、データの取り扱いについても総務省の検討会で議論されたものがございますので、ちょっと御紹介させていただきます。
5ページをあけてください。
総務省の「パーソナルデータの利用・流通に関する研究会」の報告書がことしの6月にまとめられてございますが、ここでパーソナルデータ(個人に関する情報)の個人の識別性についての条件が提示されてございます。
具体的にどういうことかと申しますと、点線の枠内でございますが、米国の連邦取引委員会の考え方等を踏まえて、こういった考え方はどうかということで、下の1、2、3に該当する場合については、実質的な個人識別性はないと考えられるということでございます。
具体的にどんな要件かと申しますと、1適切な匿名化措置を施していること。
2匿名化したデータを再識別化しないことを約束・公表すること。これは管理者の方の話でございます。
3匿名化したデータを第三者に提供する場合は、提供先が再識別化をすることを契約で禁止すること。
この条件に該当する場合については、実質的な個人識別性はないと考えられるということでございます。
翻りまして、これをサンプリングデータセットに当てはめてみますと、1については、先ほど整理したところでございますけれども、個人の特定可能性の高いデータとして位置づけられるのではないかということでございます。
2につきましては、ハッシュ化をして匿名化した情報でございまして、個人を特定することは極めて困難なデータでございますが、我々厚労省が匿名化したデータを再識別化しないことを約束・公表することは、差し支えないのではないかと考えられます。
3については、申出が承諾された際に申出者が提出いただく利用規約及び誓約書の方に既にこの趣旨のことは盛り込まれてございます。
こうしたことを考えてみますと、サンプリングデータセットを実質的な個人識別性がないデータとして整理できるのではないかということを整理してございます。
こうした場合に、どのような利用形態とセキュリティ要件が必要かというのが課題になると思います。
1枚めくっていただきまして、6ページを御覧ください。
「サンプリングデータセットの利用形態について」ということで、左側が現在の利用形態。これは抽出データと同じでございまして、四角で囲ってございますが、利用場所が施錠されていて、入退室の管理もする。また、インターネットとの接続も禁止してございますし、持ち出しについても原則禁じているということでございます。
こういった要件を課していますが、これは事務局からの提案でございますが、サンプリングデータセットにおいては、こういったものでいかがかということで、一例を挙げているものです。
まず、入退室に関する制限はなし。
パソコン等、データ管理自体は、ID等によりまして端末の利用管理をする。ただし、インターネットとの接続は禁止をする。
利用者間の共有については、基本的に認める方向。簡単に申し上げると、スタンドアローンのパソコン、PCで管理できるような形でいかがかということでございます。
こういったところでございますけれども、案として挙げさせていただいてございます。
もう一枚めくっていたきまして、要件が定まってきますと、手続、書類の関係でございますが、必要な書類が変わってくる可能性があるということで挙げてございます。
申出をいただくときには、別添1から別添9までの書類を全て出していただいてございますが、例えば別添2は運用フロー図とかリスク分析・対応表、運用管理規程、自己点検規程等々ございますが、こういったものが必要になるのかどうか。
また、別添7、倫理委員会の承諾書を出していただくことになってございますが、先ほど個人識別性が実質的にないということもございまして、ここについて必要なのかどうかということ。
また、別添9、詳細な公表形式の方も必要になるかどうか。こういったところについて御議論いただきたいと思ってございます。
ここまでがサンプリングデータセットの関係でございます。
1枚めくっていただきまして、8ページでございます。こちらは集計表の情報についての手続とセキュリティの要件についてでございます。
1と2と挙げてございますが、1の方が手続の関係です。
1は、集計表情報の審査については、総務課、事務局による審査により代替するということで、有識者会議の確認を得るとされておりますけれども、実行上は、今、有識者会議による審査を全て受けていただいているような状況でございます。ガイドラインの規定との整合性が図られていないというところがございます。
2のところは、先ほどのサンプリングデータセットのセキュリティ要件と同じでございますが、集計表の情報については、セキュリティ要件は審査に当たって問われないこととなっているということでございますけれども、書類等は求めているということがございまして、セキュリティの水準について不明確になっているということが一つございます。
こちらについては、1手続の関係でございますが、集計表情報そのもの自体は、個人を特定することはほぼ不可能と考えられますけれども、他のデータと照合することによって特定される可能性が否定できないということもございますので、現行のガイドラインの規定とは一致しないのでございますが、これまでの運用どおり、有識者会議による審査を受けることとしてはどうかと考えてございます。
今回ガイドライン改定時に盛り込まれておりませんので、次回改定時に有識者会議の審査について新たに盛り込んだらどうかということでございます。
2については、サンプリングデータセットの方の御議論をいただいてからのものだと思いますが、セキュリティ要件の基準の一つとして、サンプリングデータセットの利用と同じような手続、利用形態について適用することとしてはどうかという提案をしてございます。
2.1については以上でございます。
○山本座長 ありがとうございました。
事務局からの説明につきまして、御意見、質問がありましたら、お願いいたします。石川先生、どうぞ。
○石川構成員 4ページ目の「サンプリングデータセットの匿名性について」、大変わかりやすい表でいいのですけれども、医療機関情報のところで、真ん中の「レセプト情報等データ(特別抽出)」の部分については、医療機関コードについて触れていないわけです。もう一つ、昨日行われましたデータベースの基盤整備事業だとかそういったところでは、これは10医療機関というふうに医療機関が定められていますから、医療機関はわかるわけですけれども、ナショナルデータベースについては、医療機関コードは原則提供しないということになっていると思うので、それはきちんと明記しておいていただいた方がいいと思うのです。
というのは、今後はレセプトについてのいろいろな問題が生じてくる可能性がありますので、そこのところはここでちゃんと明記しておいていただいた方がいいのではないかと思います。
○山本座長 そこはガイドライン上に明記されているわけですね。
先生、ここは本来レセプトデータベースの持っているデータ構造の話ですので、医療機関コードがあるということが1つの問題なわけですから、そこはガイドラインにしっかり記載してあるということでよろしいでしょうか。
○石川構成員 はい。
○山本座長 ほかに御意見はいかがでしょうか。
サンプリングデータセットの非常に厳しい、つまり、特別抽出と同じセキュリティ基準で運用していただいているということをより使いやすくするために、今、これを議論しているわけですが、スライド6にありますような、今までの専用の場所とか、入退室の管理とか、そういう制限を外して、スタンドアローンのPCを使って研究を行うこと、そのPCの端末の利用管理をしていただくということでいかがでしょうかというような御提案です。
あと、細かいところで7ページの書類等の問題は、また少し詰めないといけない点があると思います。
こういうことを専門にしている立場から言うと、FTCの原則、3要素と呼ばれていますけれども、実はFTCがある企業の法律家から質問があって、それに答えた文書というのがFTCレポートとして公表されているもので、この3つがあるわけです。匿名化ではなくて、「合理的な識別性の低下」と書いてありますけれども、合理的な識別性の低下が施されていることということで、ただ、FTCにはFTC Actという法律があって、アメリカの場合はFTCの指示に従わないと罰則が来るのです。
我が国の場合、今のレセプト、データベースの提供に当たって、これを守らなかったらといっても、契約違反にしかならないのですね。それが若干気になるということがございます。
セキュリティ要件というのは、我々は審査のときにいつも確認していることですけれども、研究者が悪用するとは考えていない。つまり、研究者のことは信頼を申し上げている。したがって、特別抽出などの場合には、やろうと思えば個人が特定できるかもしれないようなデータも提供するわけですが、問題は、そのデータが盗まれたとか漏えいしたとなると、その先がコントロールできなくなって、非常に大きな被害を及ぼす可能性があるということを防止したいという意味での安全管理なのです。
ですから、安全管理の大部分は、研究者の皆さんには使いにくい思いをしていただいていますけれども、我々がそのデータを提供するときに想定している範囲から出ない、つまり、安全に管理されているということを担保するための措置なのです。
したがって、サンプリングデータセットをどう考えるかというと、このセキュリティ要件を緩めるということは、紛失とか漏えいの可能性が高まるということなのです。高まっても大事だというふうに我々が確信できるかどうかというところが一番重要だと思いますので、そういう意味では、4ページ目の項目等で書かれているサンプリングデータセットのこれだけの処理をしているので、仮にこれが不幸な事故、そういったことで一時的に一目にさらされるようなことがあっても、これで個々の医療機関、個々の患者さんにプライバシーの侵害等が起こる可能性は著しく低い。そういうふうに判断できれば、6ページ目の利用形態の一例という方向に進めるかと思うのです。
座長の立場でこんなことを言うことはよろしくないと思いますけれども、私個人的には、昔からサンプリングデータセットは公開してもいいというぐらい安全だと思っていますので、全く異論はないのですが、構成員の方々の御意見をお聞きできればと思います。大久保先生、どうぞ。
○大久保構成員 今のお話で、6ページ目の確認ですけれども、スタンドアローンのパソコンでの処理であればいいということの御説明だと思いますが、そうすると、スタンドアローンのパソコンの場所はどこでもいいということ。今までですと場所が決められていましたけれども、今の案は持ち出し可能とかと書いてありますし、どこでもいい、条件緩和という理解でよろしいですか。
○山本座長 そうですね。御提案の6ページの案はそういうことだと思います。ただし、ほっておいてもいいというわけではなくて、PCは管理していただかないといけませんけれども、特別にあらかじめ届けられた部屋の中でしかだめとか、そういうのではないということなのです。
○大久保構成員 わかりました。
保守的な立場から言うと、入出管理までできなくても、少なくとも場所ぐらいの特定はしておいた方がいいのではないかなという気がしますけれども。
○山本座長 研究を実施する場所という意味ですね。
○大久保構成員 はい。
○山本座長 どうぞ。
○石川構成員 私は、保守的と言われるのは大変嫌いなのですけれども、これはちょっと守らざるを得ないと思っているのですが、例えばサンプリングデータというのは、これからサンプリングデータの設計があると思うのです。それによっては有用性が非常に高い業種といったものが発生する可能性もあります。今までの漏えいの事故とかそういったものを見ますと、可搬性のあるメディア、ポータブル機の盗難、そういったもので漏えいするということも十分にあり得ます。サンプリングデータセットであっても、例えばそれが漏れたらインターネットで流通してしまいますので、それは大変気持ち悪いので、やはりログがとれる場所といいますか、その後、利用者の履歴がきちんと残るような形での使い方。それは複数であっても、場所が設定されているとか、そういう形で鍵をかけていただきたいなと思います。
○山本座長 ほかにいかがでしょうか。
 ここで論じているサンプリングデータセットは、現在のサンプリングデータセットだけの話で、今後つくられるであろう基本データセットは、もう一度3のところで御議論をいただきたいと思います。ですから、スライド4のサンプリングデータセットです。
入院は10%、外来1%で、年齢は5歳刻みで階層区分をして、元データの年齢別の構成比率を保ちながら抽出している。傷病名、診療行為、医薬品は0.01%でしたっけ。出現頻度が0.1%だったか、0.01%に達するまでの項目は全て。
どうぞ。
○加藤(源)補佐 事務局からです。
資料2の17ページにその詳細がございます。例えば傷病名ですと、数の頻度の少ないものから消していって、延べ数の傷病名の0.1%に達するところまで匿名化を行うとしますと、結果的に病名としては0.1%しか消していないのですけれども、傷病名コードとしては、棒グラフにありますように、59%が見えなくなっています。こういう仕組みで、そのほか診療行為ですとか、医薬品ですとか、DPCデータでしたらDPCデータ、調剤レセプトでしたら調剤レセプトに関しても同じような処理を施し、少ないものでも3割以上、多いものだと6割近くが匿名化されております。
○山本座長 ありがとうございます。
 というサンプリングデータセットの取り扱いに関してでございます。だから、一般的な疾患に関してはある程度使えるという御報告がありましたが、もともと希少な疾患は、サンプリングデータセットは無理で削除されていますから、レコードは残っているのですけれども、その項目はダミーに置きかわっているということです。
どうぞ。
○大久保構成員 6ページのことですが、先ほど奥村委員がセキュリティの緩和のことをお話しされましたが、こういうことを聞いていいのかどうかわかりませんが、奥村委員のイメージというのは6の右側と同じというふうに考えてよろしいのか、もうちょっときつくてもいいとお考えなのか、いかがなものか。座長権限ではないですけれども、お聞きしてよろしいですか。
○山本座長 もしよろしければお答えいただきたいのですが、実際にやられた感覚として、6ページの右側の状況、あるいはそれよりももう少し厳しくてもいいとか、これでも厳しいとか、そういうことがあれば、どうぞおっしゃっていただければと思います。
○奥村参考人 発言の機会をいただき、ありがとうございます。
 先ほど先生方からおっしゃっていただいているように、場所に関しては明確化された方が安全かと思います。
次に、データを格納したハードディスク等の媒体に関しましては、暗号化処理する等の条件をつけると流出のリスクがかなり下がるのではないかと思っております。
 以上でございます。
○山本座長 ありがとうございます。これにもう少し付加的な要素があっても大丈夫という感じですね。
○奥村参考人 はい。
○山本座長 ほかにいかがでしょうか。
 では、さすがに特別抽出と全く同じセキュリティ基準というのはオーバースペックだということに関してはよろしいでしょうか。
では、条件を緩めてというのは、今までの皆様の御議論と奥村先生の御判断とかを踏まえて、もう少しこの条件を整理して、次回にまたお諮りをするということにさせていただきたいと思います。
7ページの書類に関して言うと、例えばストレージメディアを暗号化するべきだとか、USBとかそういう可搬媒体の使用は相当慎重であるべきだとか、研究の場所自体はやはり明記をしていただいた方がいいということがございますので、この案では別添2というのが「(不要)」になっているのですけれども、これは不要ではなくて、それなりにモディファイしたものを用意するということにせざるを得ないのではないかと思います。
 別添9に関しましては、次の2.2のところで御議論をいただければと思います。
 倫理委員会は、これを出しても、恐らくほとんどの倫理委員会が審査の必要なしというふうに返ってくると思うのですけれども、武藤先生、いかがでしょうか。
○武藤構成員 別添7の倫理委員会の承諾書は不要だと思います。
ただ、これは機関の長が知る機会でもあるので、別の形で機関の長が把握をしている必要があるかどうかという点はちょっと確認が必要かと思います。
○山本座長 一応、サンプリングデータセットも機関長のあれが要るのですね。
○加藤(源)補佐 同じく7ページの表の別添1と別添2の間に「レセプト情報等を利用した研究に関する承認書(様式1-1)」というのがあり、これが所属機関における研究の承認を示す書類になっていますので、研究機関がこの研究を全く知らないまま進められるということはなく、ここで担保されていると考えております。
○山本座長 というふうに再整理をして、次回また。
冨山先生、どうぞ。
○冨山構成員 1点、6ページの右側の部分で、利用者が持ち出しも○ということになってございますね。基本的に「インターネット等との接続は禁止」というのは、ホストコンピュータであって、外部に持ち出したときも、共同利用者の部分のパソコンはあくまでもスタンドアローンということでよろしいのでしょうか。
○山本座長 もちろん、そうです。扱うところは全てこの条件を守るということになります。
 よろしいですか。
それでは、先ほどお話ししましたように、6の図をもう少しモディファイをして、7の案を修正した版を次回お示ししたいと思いますので、よろしくお願いいたします。
それでは、引き続いて、サンプリングデータセットにおける公表基準の適用について、事務局から説明をお願いいたします。
○佐久間室長 座長、すすみません、8ページの集計表のことの議論をお願いします。
○山本座長 すみません、忘れていました。
集計表は、現在のガイドラインでは明記されていないのですけれども、集計表情報から個人が識別できる可能性はほとんどないのですが、他の情報と照合する等でリスクがゼロとは言えないということで、その面も含めて有識者会議による審査を行うということを明確にしてはどうかということが1つ。
この集計表を扱うセキュリティ基準というのは、先ほど少し修正すると申し上げました6ページのサンプリングデータセットのセキュリティ基準と同じにしてはどうかという御提案ですけれども、この件に関してはいかがでしょうか。
よろしいですか。集計表と言っても、あくまでも御依頼があって提供する集計表で、研究者が公表する際の集計紙とは違いますけれども、これはそういうことで一応整理をしておいてよろしいでしょうか。
それでは、2.2の御説明をお願いいたします。
○佐久間室長 それでは、9ページを御覧ください。
「サンプリングデータセットにおける公表基準の適用について」ということで、こちらは前回の会議のときに利用者のアンケートでいたしましたが、特に公表基準の最小集計単位10以上というのを適用するのがあるのかという御意見がありまして、前回少し御議論をいただきました。
サンプリングデータセットは、先ほど説明申し上げたとおり、1カ月のレセプトデータを一定の比率で抽出したもので、都道府県ですとか保険者、医療機関といった情報は削除して、また、希少な疾病名等々については匿名化をしてございます。
また、医療機関情報自体はサンプリングデータセットから削除されておりますので、医療機関に関する公表基準は適用されることはございません。
患者数に関する基準についてでございますが、こちらはシミュレーションをしてみますと、例えば集計表上の1つのセルが仮に1人であった場合、どうなるかというのを下の表に示してございます。
医科入院10%、医科入院外1%の抽出率でございますので、真ん中の表にございますとおり、仮に1人であった場合、どの程度いるかということ、推定されるかということでございますが、例えば入院であれば、10%ですと10人、外来ですと、1%で100人ということで、DPC、調剤も同等と。
一般の公表の基準が10人未満の場合は公表しないということになってございまして、推定でございますけれども、この基準についてはそれぞれクリアされているという状況ではないかと考えられます。
ということでございまして、下の四角でございますが、サンプリングデータセットを用いた成果物の公表につきましては、公表基準の適用を求めないということでいかがでしょうかということと、あわせて、公表の際の事前の確認の手続でございますけれども、公表に関する事前の確認については、原則として事務局で行うこととして、特に必要な場合を除きまして有識者における事前確認は求めないこととしてはいかがかということでございます。
以上でございます。
○山本座長 ただいまの事務局の説明に関しまして、御意見、御質問をよろしくお願いします。
 今の御提案どおりということになりますと、先ほどの伊藤先生、奥村先生の論文については事前にしないということになるので、有識者会議に触れないまま論文として投稿されて、その次に新聞報道がされるという経過をたどる可能性があるわけですね。
 ただ、我々としては、正しい手法で集計されたデータに対して、何かコメントをつけることは基本的にはできなくて、これはプライバシー上のリスクがあるかないかという観点でしか判断できないということになりますので、そういう意味で言うと、9ページのスライドにありますように、推計ではありますけれども、そもそも特別抽出に関して定めている公表基準をどのようにしても下回ることはないのではないかということが推定されるわけです。そうすると、見せていただいたところで何か言うということはまずできないわけですから、そういう意味では、事前にそういうことをする必要はない。
ただ、私は、サンプリングデータセットにしろ何にしろ、使って何か成果が出たら、事後でもとにかく有識者会議に御報告は願いたいと思うのです。このデータベースを活用して有益になるように我々は活動しているわけですから、そのメリットが出たら、それを教えていただかないといけないということはあると思います。
いかがでしょうか。
では、この御提案どおりということで進めさせていただきたいと思います。
引き続きまして、「2.3 データ提供における利用場所、利用者等の重複について」ということで、事務局から説明をお願いいたします。
○佐久間室長 ここまでのものは参考資料でございますので、18ページを御覧ください。「2.3 利用場所・利用者等の重複の取扱いについて」ということでございます。
「これまでの対応」ということでございますが、ガイドライン上で、利用者の方々が複数の研究に参加する場合、基本的にはリンケージを行わないことといった規定がございますので、今まで1人の申出者、利用者に対しまして、同時に提供することができるレセプトの情報は1件までという取り扱いをしてきてございます。
また、物理的な問題といいますか、データセンター等の課題でございましたけれども、データの抽出作業等にも時間を要することもございまして、円滑なデータ提供に当たっての課題ということがございました。
現在の状況等々でございますが、データセンターの処理能力が向上してきたということとか、サンプリングデータセットとか、後ほど御報告がございます基本データセット等のデータセットの整備も進んできていること。
また、これらの事務的な作業は外部委託を我々の方でしてございまして、事務処理速度の向上が期待できてくるということ。
3つ目の矢印は、これまで利用者の方々がある1つの研究に関与している場合、仮に助言程度のかかわりの場合でございましても、ほかのレセプトの情報を用いる研究に関与することは認めてきていなかったということがございます。
ただ、この場合、レセプト情報の解析に関する治験を持たれている研究者の方々、限定された研究にしか関与ができないということがございまして、レセプトのこの分野の研究全体の質の向上が制約されるおそれがあるということがございます。
こうしたところがございますので、御提案として、下の四角でございますが、こういった運用状況等も踏まえて、利用者がレセプト情報等を用いた複数の研究に関与することを認めることとしてはいかがかという御提案をさせていただいてございます。
ただし、条件がございまして、もともとデータのリンケージが行われないといったことが前提になってございましたので、例えばデータの格納場所が全く同じとなっている場合ですとか、データの解析を主に行う方が複数の研究に関与しているといったことが申請時にわかる場合については、引き続き複数の研究に関与することについて慎重に対応するということでいかがかという御提案でございます。
以上でございます。
○山本座長 ありがとうございました。
 提供能力がだんだんと上がってきて、一方でかなり膨大なデータであることが多いので、分析研究自体に時間がかかるということもあって、データ処理にかかわる人の人材不足が起こってきて、複数の研究に関与することをお認めする方がレセプト等のデータベースの利活用の促進につながるのではないかということで、具体的には北海道大学の例とか、今までもあったと思うのですが、片方が終わるまで次が提供できない。両方ともいい研究で出したいのだけれども、それが期間的にとまってしまうとかというのがあったのを、複数の研究に関与することを原則としては認める。ただし、別々の課題で出されたデータ2つをリンケージされるみたいなことがあると、これは我々の審査の範囲のコントロールを超えてしまいますので、これに関しては、そんなことがないということが担保できるように慎重に審議をするという事務局からの御提案ですが、いかがでございましょう。どうぞ。
○大久保構成員 確認ですけれども、18ページの一番下の四角の下から2行目に「主に行う者が」と書いてあるのですが、主に行う者というのは、いわゆる主任研究者、研究代表者と理解してよろしいですか。
○山本座長 必ずしもそうではないですね。データ解析を非常に得意とする人が複数の研究にかかわるということもあり得ると思うのです。
○大久保構成員 わかりました。そうすると、主任研究者が同時に2つの研究を走らせても今回はいいのではないかという案ですね。
○山本座長 事務局はどうお考えですか。僕は、今のところそこまではちょっと行き過ぎかなという気はするのですけれどもね。何しろ扱いが難しいデータですので、ノウハウを持っている人の能力をできるだけ生かすという意味では、データの整形、クリーニング、あるいは適切なリレーショナルデータベース化みたいなことをやっていただく方の能力というのは、1つの研究が終わるまで、研究から戻るまでになってしまいますので、そこに縛りつけるのはちょっと不合理ではないかということだと思います。
○大久保構成員 私もその点は大変同意しますけれども、ただ、代表研究者が2つというのは若干疑問があるかなという気がします。
○山本座長 私もそれはおっしゃるとおりだと思いますけれども、皆さんはどうでしょうか。研究代表の方が2つ同時にというのは、どうしてもリンケージする目的以外に考えられないような気がするのですが、いかがでしょうか。松田先生、どうぞ。
○松田構成員 データをいろんな研究者が等しく平等に扱うことができるようにするためには、特定の研究者がこうやっていろんなところにかかわってしまうというのは余りよくないだろうと思います。
ただ、今までの実績を考えると、結局、僕らもそういうことのお手伝いをしていますけれども、特別抽出の場合、特にデータの抽出方法がわからないということで、研究者として私たちが入ることが結構あるわけですが、そうすると、共同研究者として入っていただくのではなくて、そういうスキルを持っている人たちをグループ化して、特別抽出に当たってそこに相談をする、アドバイザリーボードみたいなのを1つつくってあげれば、かなりの重複申請が防げるのではないか、ならないで済むようになるのではないかなと思いますので、ぜひそういうことも考えていただきたい。
特に都道府県からの申請などはそういうパターンが非常に多くなってくると思いますので、それをやっていただくだけで少し負荷は下がるのではないかなと思います。
○山本座長 ありがとうございます。おっしゃるとおりですね。
 猪口先生、どうぞ。
○猪口構成員 今、レセプトデータをどういうふうに使うと、どういう結果が導けるかということをわかっている研究者はまだ余りいらっしゃらない。松田先生は、まさに第一人者だと思うのですけれども、そういう方がいろんなところで、これはこういうふうにモデルをつくっていった方が、こういうデータを出せるよという指導的なことをしていただかないと、なかなか広がらない。その後はどんどんふえると思うのですが、現状では複数かかわっていただいた方が実質的にいいデータが出てくるのではないかなと思います。
○山本座長 ありがとうございます。つまり、御意見をまとめますと、例えばこうしたとしても、それは経過的な措置であって、しっかりアドバイザリーボードができる、あるいは方法論として十分普及するということになれば、この条件は外すといいますか、重複を認めないとしても、別に大きな問題はなくなるということを目指すべきだということですね。
○猪口構成員 はい。
○山本座長 どうぞ。
○小林構成員 私は途中から参加したので、研究者の方が複数の研究にお名前を連ねているということのみをもって、これについては保留されるとか、あるいは却下という方向というのは非常に厳しい制度かなという感想を持ちました。
 都道府県の医療関係部門の方に聞いてみますと、これを利用していくに当たってはハードルが高い。だから、それなりに専門の方に入っていただかないと、なかなか利用までは進まないのではないかという御意見がありました。そういう面では、原則としては認める方向で広く捉えていただいて、心配な部分については制約をかけていくというか、原則を広く捉える方向が望ましいのではないかと思います。
○山本座長 ありがとうございました。
 それでは、原則今の御提案を受け入れるとするのですが、その前提として、これが必要なくなるような仕組みを引き続き検討していくということでよろしゅうございますでしょうか。
(「はい」と声あり)
○山本座長 ありがとうございます。
 それでは、次の議題「2.4 DPC機能評価係数におけるレセプト情報等の活用について」、事務局から説明をお願いいたします。
○佐久間室長 それでは、19ページを御覧ください。
「DPC機能評価係数におけるレセプト情報等の活用について」ということで、【経緯】と示してございますが、ことしの12月13日、中医協の総会におきまして、傷病名コードに記載されている傷病名、いわゆる未コード化傷病名の使用率が一定の割合よりも多いDPCの対象病院に対しまして、保険診療の指数を一定割合減点をする評価方法を導入するという議論がされております。
 この評価方法の導入に当たりまして、各医療機関のレセプトの未コード化傷病名率の算出においては、DPCのデータでは算出することができないということで、各医療機関のレセプト情報(NDBデータ)を活用することが提案されてございます。
具体的にどんなものかというところでございますけれども、経緯等を含めて御説明いたします。
20ページをあけてください。
【背景1:適切な傷病名コードの利用の推進】ということで、これは、「規制改革推進のための3カ年計画」に基づいて、厚労省の方では傷病名コードに記載された傷病名を用いたレセプトにより請求するよう周知してございます。左下に事務連絡を出してございます。
ただ、未コード化傷病名の使用率というものも、全体としては減少傾向ではあるのですけれども、いずれにしても高い医療機関もあるということでございまして、これはDPC対象病院について、未コード化傷病名率のデータを出したものです。X軸の右に行くほど未コード化率が高いということで、例えば20%以上でも50程度の病院があるということでございます。
1枚めくっていただきまして、21ページでございます。
背景のもう一つとして【適切なICDコーディングの推進】ということで、DPCの対象病院でございますけれども、ICD-10コードで特に「部位不明・詳細不明コード」の使用割合の基準をクリアするためにあえて未コード化傷病名を用いて病名を入力する事例があるということも指摘されてございます。
下にございます「.9」コードというのが未コード化のコーディングなのですが、未コード化傷病名が一番下の欄にございますが、こちらについては任意に設定が可能となることで母数がふえるということです。このため、不明コードの使用割合が下がるということが起きていることも指摘されているということでございます。
こういった適切なICDコーディングを推進する上で、未コード化傷病名の使用割合による評価方法を導入することが妥当。これが総会の方で議論されてございます。
もう一枚めくっていただいて、これはDPCの方で収集しているデータにこういった未コード化傷病名の情報がないということを示してございます。
DPC対象病院で包括部分の医療内容は、データを提出してございますけれども、ICD-10をこの項目は整備されてございますが、傷病名を記載するような項目がないということでございます。
こういったところでございまして、現状こちらのデータの方に入っていないということでございます。
公表の活用のイメージを参考で挙げてございます。23ページを御覧ください。
NDBのデータからデータを提供して、例えば未コード化傷病名率が20%以上の医療機関に対して減算対象ということで、公表のイメージは、データそのものを出すということでなくて、係数として表示をするというふうに聞いてございます。こういった活用の仕方ということでございます。
ここまでが背景等々でございます。
24ページを御覧ください。
今回の課題ということでございますが、医療機関ごとのデータを算出するということで、医療機関コードを提供することについての是非が一番の大きなポイントになると考えてございます。
「これまでの取扱い」でございますが、こちらの方はガイドラインがございますけれども、こちらの審査基準に抵触するということで、実質上は承諾されていない。今までは提供してございません。
規定上、医療機関コードの利用の制限を解除できる規定がございます。2つ目のポツでございますが、ローマ数字の1、2、3に該当する場合については利用制限を解除、使うことができるとなっています。
御紹介いたしますと、
1 提供されるデータが地域性の分析・調査にのみに用いる目的であって、その目的に照らして最小限の範囲内で利用される場合。
2 医療機関等の個別の同意がある場合等、有識者が特に認める場合を除き公表される成果物の中に特定の医療機関・薬局及び保険者を識別できる資料・データ等が盛り込まれていない場合。
3 上記2点に違反した場合には、利用者の氏名及び所属機関名を公表が行われることを利用者が承諾している場合。
また、有識者の審査の際に例外規定、特段の配慮ができる規定がありまして、「一方、有識者会議は審査の際に、申し出られた研究内容の緊急性を勘案し、早期に審査を行い、緊急に提供を行う必要性がある等特段の配慮を行うことができる」と規定がございます。
【対応】の方に書いてございますが、先ほどの例外規定、利用制限の解除のところですが、これは1のところに「地域性の分析・調査のみに用いる目的」として規定されてございまして、こちらは解釈がちょっと難しいだろうと思っております。
ということで、2ポツのAの方に該当するのは難しいと。
一方で、3ポツに書いてございますBについて、「『特段の配慮』として解釈される場合には、個別事例として有識者会議において提供を承諾することを妨げるものではない」と書いてございますけれども、「ある等特段の配慮」について今回の提案が該当するかどうか、ここは御議論いただきたいと思います。
こうした状況を踏まえまして、今回の提案に対してどのように対応するかということが課題でございます。
25ページは参考資料でございます。
説明は以上でございます。
○山本座長 ありがとうございました。
いかが取り扱いましょうか。石川先生、どうぞ。
○石川構成員 これは二次利用ということで、医療機関の評価に未コード化病名を使うということについては、研究に使うのではなくて、例外的な問題だということで、これをどうするのかなと我々医療機関としては思っております。
しかし、既にナショナルデータベースそのものが、高齢者医療確保法とか医療費適正化計画のもとで行われている事業であることから、今日は事務局の24のパワーポイントには書いていないのですけれども、これはやむを得ないことなのかなと思ったところもあります。
しかし、我々としましては、医療機関コードというのが医療機関の評価に使われるナショナルデータベースになるということについては、大変抵抗があるということは一応言っておきたいと思っております。
○山本座長 ありがとうございました。
 ほかにいかがでしょうか。どうぞ。
○大久保構成員 これを一旦認めると、次回以降、前例ということで、次から次へと出てくる可能性があるという意味で、ここの審査は時間をかけて慎重に行った方がいいと思います。この視点から申し上げますと、どうしてもナショナルデータベースを使わなければ把握できないのかどうかということを確認したいのです。
 例えば診療報酬で使うのであれば、それぞれの医療機関が独自に申し出て、自分のところはこうなのでという方法もなくはないかと思うので、これ以外のすべが本当にないのかどうかを確認させていただきたいのです。
○山本座長 事務局の方からお答えがありますでしょうか。
○佐久間室長 先ほど22ページで簡単に御説明申し上げたのですが、現行のDPCの対象病院で集めている情報については、ICD-10のコードを集めているということで、未コード化傷病名の率については集めていないと。
 実質的にこれを収集するといった場合に、ファイルが幾つかありまして、そのファイルの1つに抽出することになるのですが、抽出するための例えばシステムの改修ですとか、手間が物すごくかかるということも背景としてあるように聞いています。
もし医療課の方で補足があるようでしたら、お答えください。
○山本座長 お願いします。
○保険局医療課 特段補足はございません。
○山本座長 どうぞ。
○猪口構成員 22ページにDPCデータとしてこれだけの主傷病名とか、入院契機の傷病名とか、2番目とか併存名、ここまでデータを出しているわけですね。なぜそれをまたレセデータの方から抽出する必要があるのか。
そもそも今回のナショナルデータベースの中からデータを引っ張り出すという目的自体がよくわからなくて、DPCデータで十分解析できているわけで、なぜこれをやらなければいけないのか。ましてや、ナショナルデータベースからそれを出すということは、目的外使用なのではないかと思いますけれども、いかがでしょうか。
○山本座長 では、これで今の目的が達せられない理由の説明をもう一度お願いできますか。
○佐久間室長 まず、データそのものがとれるか、とれないかというお話は、大久保先生、猪口先生からもございましたので、22ページのところでございますが、こういったICD-10のコードを使って収集しているということで、傷病名は出しています。ただ、未コード化されているもののデータそのものについては集めていないという記録になっています。ですので、これは医療機関の方からいただくということになると、システム関係ですとか、抽出するための区分が必要になるということが1つ挙げられると思います。
 目的外かどうかというところでございますけれども、もともとレセプトのデータは、医療費適正化計画の評価、作成のために使うということで、この場は第三者提供、それ以外の目的で使う場合の御議論をいただいています。
1つは、告示の方に規定がございますが、厚労省が政策の推進に資するものについては第三者提供の対象になってございます。この規定に基づいて行ってているので、目的外かどうかというのは御議論があるところだと思いますけれども、今、申し上げたようなものに基づいて御議論いただければと思っております。
○山本座長 ほかにいかがでしょうか。大久保先生、どうぞ。
○大久保構成員 私の質問は、医療課の本体の方で今、持っているデータではできないということですけれども、例えば医療機関自身が自分で調べて申告をする、それに基づいてDPCの係数をつけるという方法もできないのでしょうか。非常に困難であればやむを得ないかと思いますけれども。
○山本座長 何か事務局から。どうぞ。
○保険局医療課 保険局医療課でございます。
診療報酬の支払いということで、公平性が保たれる必要があると思いますので、医療機関が提出したデータよりも、客観的なデータであるナショナルデータベースに基づいて診療報酬の評価をしていくという方が適切ではないかと考えております。
○大久保構成員 わかりました。つまり、できるのだけれども、適切か否かということですね。
今、ほとんどの申請が届け出制になっているので、虚偽の届けをしたら、それは指導監査の方で注意をすればいいわけです。余り強く言うわけではないのですが、これを認めてしまうと、これから安易にどんどん出てきてしまうということになるので、そこを少し明らかにしたいという趣旨でお話ししています。
○山本座長 ありがとうございます。御趣旨はよくわかります。私もそれが非常に心配で、この手の審査をこの有識者会議でやると、政策上必要だと言われて、しかも緊急性があるということになると、全例オーケーにするか、全例だめにするかしかないのです。ですから、我々の今までのガイドラインに従う議論にはちょっとそぐわないケースになりつつあるので、今回はやむを得ませんので、先ほどの佐久間室長の方からお話があったガイドラインの特別な場合、緊急性を勘案しとか特段の配慮ということで対応することに私自身は反対ではないのですが、これを繰り返すのは問題かなと思っております。
高齢者の医療の確保に関する法律の中で医療費適正化計画に用いるという本来目的が若干狭過ぎるというところもあるのだと思うのです。これは国がその政策を遂行するためにつくっているデータベースであって、我々はそれを公益利用に提供することをやっているわけですから、制度の方も少し御検討いただいてということを条件にしておかないと不安だなと思っております。
稲垣先生、どうぞ。
○稲垣構成員 私どもとしては、未コード化傷病名を解消するというのが1つ大きなテーマというふうに認識しており、特にナショナルデータベースの内容の充実という観点でもこれはぜひやるべきなので、そのためにナショナルデータベースを活用するということは、ある意味では1つ線が引けるのかなという気はいたします。
翻ってみれば、むしろこういったものも本来目的というか、先ほどちょっとお話が出ていましたけれども、そういうふうに受けとめております。
○山本座長 どうぞ。
○石川構成員 そこまで行くと、ちょっとあれなのだな。
やはりレセプトの精緻性だとか、そういったものに触れてくるとなると、これは療担規則だとか、そこら辺の設定の問題になってくると思うのです。
今回、21のパワーポイントの説明というのは十分していなかったと思うのですけれども、御理解をどのくらいされたのかなと思っているのですが、今回これが一番の理由だと思いますが、21番目のパワーポイント、これをやりたいわけですね。そのためにどうするかということで、ここにはレセプトを発出している当事者が何人もいますので、これはきちんと議論した方がいいですよ。
先ほどのレセプトの精緻化という問題はまた別の問題として捉えたいと思います。それは僕らにとって大変負担になりますし、今のような診療報酬、保険の中では、どういう審査がされるかとか、そういった問題にもなってくるので、これはまた別の問題になってくると思うのです。
そうでなくて、21のところをどうやって理解していただくのか、どうなのかというところでちょっとやってもらいたいと思いますね。
○山本座長 どうぞ。
○稲垣構成員 今、御指摘があった精緻化ということで言えば、色々な課題があるわけですが、私どもとしては、傷病名については、ルールに基づいてつけていただきたいということだけでございます。
○石川構成員 レセプトに例えば病名がいっぱい並んでいるとか、そういうのがありますね。あれは審査の段階でどういうふうに査定されるかということの長年のところから出てきたりしているのです。
それがいっぱいになってきたりして、それから病名がつけられないということもいろいろありますので、そこのところはまた別の問題として議論した方がいいと思います。
これはレセプトのあり方問題ということで、ナショナルデータベースはどんどん正確なものを出したい、医療界はみんな協力しろということであれば、レセプトを発出する人間だって、きちんとその代価を求めていきたいと思いますし、そういうこともありますので、これはそこでは余り議論しない方がいいのではないかなと思います。
○山本座長 ほかにいかがでしょうか。近藤先生、どうぞ。
○近藤構成員 私もレセプトを発出する側としてですが、今、石川先生がおっしゃられたように、これは多分歯科医師会もそうだと思うのですが、DPCの話ですので余りあれかなと思ったのですが、疾病名でありますとか薬品名という具体的なことをレセプトから抽出されるということになると、話がちょっと変わってくると思いますので、このことだけということであれば理解はできるのですが、これが広くといいますか、ほかのところまで全て、一事が万事になりますとちょっと問題ですので、そのことについては少し警鐘を鳴らしたいと思います。
○山本座長 ありがとうございます。
 どうぞ。
○三浦構成員 この有識者会議の審査の範囲に関してですが、25ページの利用目的にも書いてありますけれども、研究目的であるというところが最初にあります。例えばこういった病院の割合、パーセントを出したりするのはその範囲内ではないかなと思うのですが、個別の病院名に繋がる検討となると、逆に言うと、研究ではなくて行政の執行というような話になってくると思いますので、有識者会議で審査する範囲をちょっと超えている事項ではないかなと思っています。本来の法律の目的の範囲内でできるような仕組みを考えていくのが適切ではないかと思っています。
○山本座長 ありがとうございます。
御議論はいろいろあると思いますけれども、今回のこの目的に関してということであれば、しようがないかなというふうな御意見が多数だと思います。
一方で、このような利用を有識者会議で毎回議論するというのも、ちょっと抵抗がある話ですので、今回は緊急性を勘案し、特段の配慮ということでお認めをしたいと思いますけれども、今後このような行政利用に関しては、本来は法制度上できちっと議論をした上で、認められた範囲で利用するというのが筋だと思いますので、その辺は御検討をいただくと。
それから、これは前例にはしないということで進めたいと思いますけれども、それでよろしゅうございますでしょうか。
(「はい」と声あり)
○山本座長 ありがとうございます。
どうぞ。
○佐久間室長 高確法上の規定の中の1つで、ちょっと読み上げさせていただくと、「厚生労働省、その他の国の行政機関、地方公共団体等が、法令に定める所掌事務の遂行に必要な限度で、かつ、医療サービスの質の向上等を目指した正確な根拠に基づく施策の推進のために利用する場合であって、当該データの利用が公益性が高いものとして厚生労働大臣が承認した場合」というものが使える規定の一つにございます。これについても有識者会議の方の御意見を伺うという形にはなってございます。ただ、先生方の御指摘のように、いろいろな状況がございますので、御意見は承っておきたいと思います。
 以上でございます。
○山本座長 ありがとうございます。
 それでは、そのようにさせていただきます。
 少し時間が迫ってまいりましたけれども、それでは、議題の3番で、満武先生においでいただいておりますので、進めたいと思います。基本データセットについて、よろしくお願いいたします。
○佐久間室長 それでは、現在、厚労科研の研究班で作成中の基本データセットについて、そのデータ形式が具体化してきたところでございますので、研究班の満武先生の方から御説明をいただきたいと思います。
よろしくお願いいたします。
○満武参考人 研究班の満武でございます。
昨年度、本年度行っている研究の進捗状況について、説明させていただきます。
 まず、下の「研究の概要について」というスライドは、本年6月7日の席でも発表しておりますので、ここでは研究の概要としましては、タイトルのとおり、汎用性の高いレセプト基本データセットの設計・作成を目的とするということで、次のページに行かせていただきます。
まず、昨年度の結果、そして現時点での進捗でございますけれども、1つ目の・で、我々はNDBからデータをいただきまして、以下、調剤のレセプトをいただきました。いただいたデータがどのようなデータかということで、レセプト情報等解析システムというのを我々の研究班で構築しまして、幾つかデータ検証をしました。
かなり大きなデータをいただきまして、そのデータのレセプトごとの集計値と国民医療費、統計情報部で公表しているデータと比較したところ、レセプトごとの医療費の構成比に関しましては同様な傾向を示しました。また、疾病別の医療費というのも国民医療費の方は公表してございます。それに関しましても同様の傾向を示しました。
疾病はどのようにとったかというのは、次のスライドの方で説明させていただきますが、その次にIDに関しましても幾つか検証いたしました。ただ、IDに関しましては、同一の被保険者にもかかわらず、揺れ等の原因で複数発生している可能性が示唆されましたので、試行的にID1とID2の特性を生かして、複数ひもづくものに関しましては、我々研究班の方で同一人物と判断して、今、新しいID3というのを検討しております。
また、調剤レセプトに関しましては、外来レセプトに付随して発生するものですけれども、それに対応しないものがID1でもID2でも一定数存在したというところでございます。
現時点では、一定期間のレセプトを個人ごとに統合する等の処理をして、診療行為も含むデータセットを作成しております。
また、特定健診・保健指導のデータもありますので、それとのリンケージも行っております。
今回は主に入院に関する発表をさせていただきます。
また、主病名の特定化も、時間の関係上、簡潔にさせていただきますが、どのようにしているかと申しますと、基本データセットでは各レセプトに対して記載されている傷病名から主病名というものをつくりまして、その傷病名を入院、外来ごと、それぞれ1つずつを付与したデータセットをつくっております。
また、傷病名の選択方法としましては、主病名として格納されているものの中から最も新しい傷病名であり、なおかつ複数レセプトが存在した場合には、一番高い点数というものを付与するということを想定しております。
次のページのスライド4は、国民医療費と研究班データの疾病分類別医療費の構成割合の比較でございます。厚生労働省国民医療費公表値ということで、ICD-10の大分類ごとに出している割合と研究班のデータとほぼ同じような割合を示している。
スライド5の方は、上の方が国民医療費でございまして、下の2つが研究班のデータでございます。
左が外来、右が入院になります。白黒になっていますので、少し見にくいですけれども、入院、外来と分けても割合が同じようなものであるということになりましたので、正しいデータをいただいたと我々は判断いたしました。
次のページに参ります。
まず、基本データセット(案)の構成でございます。
本スライドの図に関しましても、6月7日のスライドと同様のものでございます。今回は左側の特にデータセットB、C、Dと言われているものに関しましては、レコードフォーマットをこのスライドの後に添付しております。
データセットAからDの説明をさせていただきます。
データセットAに関しましては、現在のNDBというのは、被保険者IDや個人ごとのそういったリスト、我々は「マスター」という言い方をしますが、そういったリストをつくっておりませんので、いただいたデータの個人ごとのリスト、マスターをデータセットAとして作成しております。
マスターAに関しまして、患者ごとに紐付けを行い、3年分のデータ及び単年度ごとのデータからなるデータセットを作成しまして、こういった属性に加えて、医療費、傷病名などの限られた情報のみのデータセットをデータセットBとしております。
また、データセットCに関しましては、1回の入院、あるいは一連の外来、これは月ごとを想定しておりますけれども、これを一まとまりの単位として整備したデータセットでございまして、これは診療行為ごとの医療費というものを集計してデータセットとして構成している。
データセットDに関しましては、データセットB、Cを含みまして、なおかつユーザーの指定した診療行為コード、医薬品コード等の情報を含む、そういったデータセットを付加して提供するということを現在想定しております。
基本データの枠組みとしてはデータセットEも書いておりますけれども、Eに関しましては、保険局の方と相談しまして、まず、個人の特定可能性の高いデータということで、今回、とりあえずデータセットA、B、C、Dということで提案させていただきます。
下のスライドに移りますが、入院データセットB、C、Dに関しまして、ファイル容量やレコード数、抽出患者、対象期間、キーになるID等を書いております。キーになるID等は、ID1、ID2に幾つかの特性を生かしてID3を作って紐付け、レセプト間、データセット間の紐付けが対応となるようなIDを作成して提供しております。
また、患者基本属性は、ID及び性別、5歳刻みの年齢階級のデータをいただいておりますので、それをつけておる。
また、項目に関しましては、ここに書いてあるとおりでございますが、データセットBに関しましては、「診療識別情報」と書いてありますけれども、これは診療行為別の医療費ということでございます。
また、データセットDに関しましては、データセットCに加えて、申出者の要望により、診療行為、医薬品情報、傷病名等の情報も提供するという構造にしております。
次のスライドに移らせていただきます。
次のスライドに1、2、3、4とありまして、抽出データとありますが、これは先ほど説明した個人ごとのマスター、リストになります。こういったリストをつくりまして、それぞれの患者さんごと、あるいは個人ごとの紐付けをこのように行います。現在では20%等の数パターンをつくりまして患者さんを抽出して、選ばれた方の情報を4として付与するということで、データセットB、C、Dをつくっていくというやり方をしております。
また、データセットDにおける医科診療行為、医薬品情報等の提供イメージでございますけれども、これはある一定数の医科診療行為、医薬品コードをイメージできる研究者の方に関しましては、御自分で幾つか点数やフラグ等を指定していただいて、こちらの方である程度集計をした形で提供するということが可能かなと思っております。
現時点では、少し前のマイクロソフト、エクセル等では、レコードのフィールド数が256行まで読むことが可能ですので、まず第一段階として指定できる数を256というふうに指定して提供していきたいと考えております。
時間も限られておりますので、以上で私の方の発表を終わらせていただきます。
○山本座長 ありがとうございました。
 ただいまの満武先生の御説明に御質問、御意見がありましたら、いかがでしょうか。
 事務局の方から追加でお願いします。
○佐久間室長 追加と申しますか、資料3「基本データセットについて」ということで、ホチキスどめになっているものを御覧いただきたいと思います。
 今、研究班の満武先生の方から御報告をいただきましたけれども、それに基づきまして、どういった対応をするかというのをこちらの資料にまとめてございます。
「厚労科研研究班による基本データセットについて」ということで、1ページ目でございます。
「今回提案されたデータセットについて」でございますが、「患者単位で、年度毎あるいは1回の入院エピソードを単位として、医療費や診療日数等の限定的な情報のみのものから、診療行為等の情報を含むものまで、申出に応じて一定程度提供できるものである」としています。
抽出率を考えますと、保険者レベルで25%、患者レベルで20%を行っていますので、全体で4~5%の患者数、抽出率となってございます。
データセットDについては、特別にいろんな傷病名ですとか、幾つかのものを付与することができるデータセットになっているということでございます。
また、今回提案されたデータセットは入院の事例に絞ったデータセットでございますが、これに加えて外来事例、特定の疾患等について整備したデータセットを準備中というふうに聞いてございます。
このデータセットそのものの提供について、どうしていくかということで、その下の四角に書いてございますが、現在提供しているサンプリングデータセットとは異なりまして、「年度単位で紐付けされたレセプト情報」「入院エピソードごとの情報」といった特徴がございます。これも、その他の情報を相当程度削除したデータセットと言えるということもあるので、今後順次利用者に提供するということとしてはどうかという提案をしてございます。
また、患者の抽出率は、先ほど4~5%とございましたけれども、こういったものであるとか、また、データセットDの付与情報の上限というところもございますが、こういった内容については、また利用者の方々からの御意見を集めながら、適宜変更を今後加えていくこととしてはどうか。
また、外来版、疾患別のものについても、準備が終了次第、提供を検討していくということでいかがかと書いてございます。
あわせまして、提供するとなった場合のセキュリティの関係がございますので、次の2ページ目を御覧ください。
今回、御報告いただいた入院データセットB、C、Dの利用に当たってのセキュリティ環境についてということでございます。先ほど御説明があったとおり、基本的に年度単位で紐付けられてはいるのですけれども、傷病名とか、かなり削除されたデータであるということ。データのセキュリティ環境について、どう考えるかということで、サンプリングデータセットとB、C、Dのデータセットを比較できるように並べてみました。
レセプトの属性情報については、性別、5歳刻みの年齢階級別というのがほぼサンプリングデータセットと同じで、抽出率も4~5%のものです。
ハッシュ値については新しいIDを付与させているということでございます。
保険者情報についても、サンプリングデータセットに加えて、食事療養とかこういった情報を削除しているようなこと。
また、傷病名についても、入院データセットの方がBであると、例えば傷病名1つだけの情報であるということ。また、Cであれば、入院エピソードごとに傷病名が1つだけとしている。Dについては、複数の病名が可能だということになっています。
診療・医薬品・特定器材コードは、B、Cについてはありません。Dについては設定が可能ということでございます。
こういったところでございます。
まとめてございますが、入院データセットB、Cにつきましては、サンプリングデータセットと比較しても相当程度診療情報が削除されているということでございますので、匿名性の高いデータとして位置づけられるのではないかということでございます。
データセットDについては、ある程度詳しい診療情報が設定可能としてございますけれども、入院エピソードごとにまとめられたデータでございますので、依然として匿名性が高いということが考えられると思います。
セキュリティ要件についてどういうふうに考えるかということでございますが、ここでは、サンプリングデータセットと同等のセキュリティ要件等を適用してはいかがかという御提案をさせていただいています。
サンプリングデータセットの方の要件も御議論の途中でございますが、こちらの方と同様のものでいかがかということの御提案でございます。
以上でございます。
○山本座長 ありがとうございます。
 御意見、いかがでしょうか。ちょっと時間が過ぎて申しわけありませんけれども、どうせエレベーターが混んでいますから、少しだけ延長させてください。いかがでしょうか。
ちょっと気になるのが、主傷病名が1つ入っているわけですが、この主傷病名が極めてまれな疾患である場合というのが含まれる可能性はあるわけですね。そうすると、サンプリングデータセットに比べると、その特定性がやや高まる可能性はあるということですね。
その辺は何かお考えがありますか。サンプリングデータセットほどではないにしても、もう少しそのリスクを下げる手段とか、何か御検討いただけるかどうかという点はいかがですか。
○加藤(源)補佐 事務局でございます。
 私は研究班の満武先生とコミュニケートさせていただいております。属性情報に関しては、性別、5歳刻みの年齢階級別ということと、あと抽出率が今のところせいぜい4~5%ということで、地域情報を入れているわけでもございませんので、ある程度リスクは下げられていると思われます。ですが、そういう御指摘があるようでしたら、こちらに関しては何か処理をということを研究班と検討して、例えば次の有識者会議などで御提案させていただくことはできると思います。
○山本座長 どうぞ。
○松田構成員 非常にいいデータセットだと思います。
個別識別性の話になってくるのですけれども、医薬品と特定器材とかは、ブランド名でやりますか、それとも一般名で集計しますか。ブランド名でやると、少し個人が識別される可能性が出てきてしまうので、もしそれを一般名で全部集計するのであれば、その方が多分安全だとは思います。ただ、これは使用目的によって違ってくると思うので、それは御検討いただけたらと思います。
○山本座長 御検討いただけるということで、よろしゅうございますか。
○満武参考人 検討させていただきたいと思います。ありがとうございます。
○山本座長 ほかにいかがでしょうか。
 それでは、今、御意見が出た点を少し検討していただいて、また御報告をいただくということでよろしゅうございますでしょうか。
 今日はどうもありがとうございました。本日予定されていた議事は以上でございます。
その他について、事務局の方から何かございますでしょうか。
○佐久間室長 本日は、御多忙の中、活発な御議論ありがとうございました。
スケジュールについては資料4の方にございますので、また御覧いただくとして、次回につきましては、1月9日に開催する予定でございます。
今回は利用者の方々から御意見を伺ったわけでございますが、次回につきましては、民間の組織の方々からのヒアリングを行って、レセプト情報の活用についての御意見を伺うということと、あと、個人情報に準ずる情報に係る情報提供の考え方について、本有識者会議の構成員の新保先生の方から話題提供を行っていただく予定としてございます。よろしくお願いいたします。
○山本座長 どうもありがとうございました。
年度末に結構会議が続きますけれども、どうぞ御協力よろしくお願いいたします。
それでは、今回はこれで閉会とさせていただきます。本日は、お忙しい中どうもありがとうございました。


(了)

ホーム> 政策について> 審議会・研究会等> 保険局が実施する検討会等> レセプト情報等の提供に関する有識者会議> 第17回レセプト情報等の提供に関する有識者会議 議事録(2013年12月19日)

ページの先頭へ戻る