ホーム> 政策について> 審議会・研究会等> 保険局が実施する検討会等> レセプト情報等の提供に関する有識者会議> 第26回レセプト情報等の提供に関する有識者会議 議事録(2015年12月9日)




2015年12月9日 第26回レセプト情報等の提供に関する有識者会議 議事録

○日時

平成27年12月9日(水)9時30分~11時00分


○場所

厚生労働省 専用第22会議室
東京都千代田区霞が関1-2-2


○議題

議事次第
 1.成果物の公表基準について
 2.サンプリングデータセットの内容充実について
 3.オンサイトリサーチセンターの進捗状況について
 4.「NDBオープンデータ」作成の進捗状況について
 5.「申出者向けマニュアル」の見直しについて
 6.その他

○議事

○山本座長 それでは、定刻となりましたので、ただいまより第26回「レセプト情報等の提供に関する有識者会議」を開催いたします。

 構成員の皆様には、年末の御多忙の折、お集まりいただき御礼を申し上げます。

 会議に先立ちまして、本日の構成員の出欠状況について事務局からお願いいたします。

○赤羽根室長 事務局でございます。

 それでは、本日の構成員の出欠状況について御報告させていただきます。

本日は、武藤構成員、印南構成員、府川構成員、宮島構成員、新保構成員、三浦構成員、猪口構成員、伊奈川構成員、松田構成員から御欠席の御連絡をいただいております。

 本日、構成員が9名御出席ということで、会議開催要件を満たしておりますので御報告させていただきます。

 また、本日の議事は公開とさせていただきますので、よろしくお願いいたします。

 以上です。

○山本座長 ありがとうございました。

 会議要件を満たしておりますので、早速ですが議事に入りたいと思います。

 本日の議題は1から5までとその他がありますけれども「1 成果物の公表基準について」を事務局から説明をお願いいたします。

○赤羽根室長 事務局でございます。

 資料1「成果物の公表基準に関する検討」をごらんいただければと思います。

2ページに、今回の検討の背景を載せさせていただいています。ことしの6月に閣議決定されました規制改革実施計画の中で、研究成果の公表に当たって、集計単位が市区町村の場合「100未満」になる集計単位が含まれないということが公表の基準になっているのですけれども、この妥当性について検討する、ということが書かれておりますので、今回、これを踏まえて御検討をいただければと思っております。

 実際、成果物の公表基準に関して、現在はどういう考え方でさせていただいているのかを改めておさらいという形で3ページ以降にまとめさせていただいています。

 4ページ「(参考)最小集計単位の原則について(1)」でございますが、現在は、原則として患者・受診者の集計単位が10未満となる公表形式は認めないこととしております。これは第6回の有識者会議の資料からの抜粋でございます。 例えば【事例(1)】をごらんいただきますと、C県の疾病(1)であると3人であるとか、D県であれば疾病(2)であると5人といった数字が出ているのですけれども、こういう10を下回る数については、基本的に「-」といった形で秘匿するという形の公表形式になっています。

 これは、例えばアメリカのCMSなどの「cell size suppression policy」で、成果物の公表において患者等の集計単位が一律10以下になってはならないといったルールなども参考にして、当時、有識者会議で議論されて決まった話でございます。

 5ページ目は、病院、診療所等の医療機関等に関する最小集計単位の原則でございます。

 【事例(2)】をごらんいただきますと、疾病Aの患者数ということで出させていただいているのですけれども、例えばA県について800床以上の病院で疾病Aの患者数が23人ということです。この数字自体の集計単位は10以上ということで、10以上という数字は満たしているのですが、実質上この23人が全て同じ医療機関にかかっているとなると該当する医療機関が1ということになるので、そこら辺の特定性が高まることもありますので、該当する医療機関が非常に少ないという場合には、これは公表不可としてはどうかということで、現在、原則医療機関が2以下という場合には公表不可という形で運用させていただいているということでございます。

 続きまして6ページ目は、先ほど医療機関が少ない場合の集計単位に関することを申し上げさせていただいたのですけれども、さはさりとて非常に小さい2次医療圏などで、基幹となる医療機関、がん治療等特定の腫瘍の医療等に関して一つしかないような状況が起こり得るのではないか。

 そういうどうしようもないというか、非常に難しい場合には例外ということで、例えば医療機関名を記載しないとか、最小集計単位の原則というあたりは遵守するということで、例外的に成果物の公表を認めることとしてはどうかということで、これも当時に御議論されたものでございます。

 7ページ目は、今回、御議論いただく話になるということで御提案させていただいているのですけれども、最小集計単位については、先ほど来10以上ということでお話しさせていただいているのですが、一般論として母集団が小さくなれば、特定される可能性が高まるのではないかというところがございますので、集計単位が市区町村となった場合には100以上という形で最小集計単位を設けてはどうかということで、当時議論をされたものでございます。

 こうしたことも受けまして、現在、市区町村については、最小集計単位を100以上という形で運用させていただいております。

 8ページ目からは今回、御議論いただきたい論点を挙げさせていただいております。まず、こうして現在運用させていただいている市区町村の最小集計単位なのですけれども、この100以上という数字が妥当かというところでございます。

 例えば、100より少ない数字を新たに設定することは可能かというところが一つあるかと思います。この数字といったこと以外で何らか公表に当たって配慮すべき事項があるかどうか。この機会ですので、市区町村という少し小さい単位の議論になってまいりますので、そのあたりも御議論いただければと思います。

 これとあわせまして、従前市区町村については、直接個別に市区町村が申出をするということにはなっておらず、申出者の資格の中に入っていなかったのですけれども、これを申出者の基準に入れることについても検討してはどうかということで、論点として挙げさせていただいています。

 続きまして9ページ目でございます。市区町村の集計単位について御議論いただくのですけれども、実際に市区町村の人口規模がどんな形になっているのかをざっと概観させていただいた表を載せさせていただいております。

 大まかに見させていただきますと、人口2万5,000人といったあたりで数としては半分半分くらいに分かれるのかなと。大体市区町村は1,740町くらいあるのですけれども、おおむね半分程度が2万5,000を下回る規模、残る半分が2万5,000を上回る規模という状況です。

 大体都道府県の規模が、人口60万人を超えていくというところかと思いますので、そういった規模になってくる市町村になりますと、例えば27程度という数になってくるという状況でございます。

10ページ目は、市区町村の規模というところがあるのですけれども、一方で、従来、最小集計単位10以上で運用してきました都道府県や2次医療圏については、規模がどのようになっているのかということを載せさせていただいております。

 一つが都道府県なのですけれども、これについては人口最小の鳥取県で、この約57万人という数字なのですが引用がちょっとずれておりまして、平成27年度総務省の人口推計から引いております。これが約57万人。平成22年の国勢調査時点に約59万人で、大体60万人弱で推移しているというところです。

 2次医療圏人口最小は隠岐医療圏で、約2万1,000人といったところになっております。大体、規模の小さい都道府県、2次医療圏はこういう状況です。

 こういう都道府県とか2次医療圏の人口規模も踏まえまして、例えばこれと同程度の秘匿性を維持しようと考えた場合、市区町村の最小集計単位をどのように設定すればよいのかという考え方が一つできるのではないかということで、御提案させていただければと思います。

11ページは、先ほどの考え方の延長ということで、秘匿性について少し考えたものをまとめさせていただいています。まず「母集団の規模の異なる最小集計単位を考える際の課題」ということで、事例を挙げさせていただきたいと思います。具体的には、人口2万人の医療圏で疾病Xの方が10人いらっしゃった場合と、人口2,000人のB町で疾病Xの方が10人いらっしゃった場合ということでございます。

 日本全国から見た場合は、A医療圏に属して疾病Xを有する方と、B町に属して疾病Xを有する方とは、これ自体はA医療圏とかB町の人口にかかわらず同程度ということが言えるかと思います。

 ただ、一般論として、A医療圏より規模の小さいB町で、個人特定性が高まるということが考えられるわけなのですけれども、これはどのように考えたらよいのかというところが課題かと考えています。

 これは少し計算をしてみたところでございます。矢印の下をごらんいただければと思うのですけれども、母集団の規模の違いによる個人特定性の違いというのは、恐らくいろいろな要因が関係すると思われますので、これらを簡単に定量的に評価するのはなかなか簡単ではないかなと思うのですが、参考としてこのように考えていましたということで、例えばA医療圏全員の中からランダムに選んだ10名の方が疾病Xを有する方と一致する確率Aと、これも同じようにB町全員の中からランダムに10人選んだ方が疾病Xを有する方と一致する確率Bを考えてみる。こういった確率が母集団の規模に応じた個人特定性をある程度反映しているということは考えられないものかどうかということでございます。

 このとき、実際に確率を計算してみて、先ほどの確率Aについては2万から10通り選び出すコンビネーションが分母で、それに対して選ぶのが1通りになります。数としては2.81553×1036 分の1という数字が出てまいります。

 確率Bについて同じように計算しますと、2.75899×1027 分の1という数字が出てきて、B町のほうが一致する確率が高いということがわかります。

 一方で、B町で一致する確率をA医療圏で一致する確率より低くするためにどうしたらいいかということで、選ぶ人数をふやしていくと確率が下がっていくのではないかということで、例えばB町で選ぶ人数を20人とすればB町の確率が低くなるのではないかということで、実際に計算をしてみますと、3.91816×1047 分の1という数字で、確率Aより確率Bのほうが低くなるということはできてまいります。

 こうしたことも参考にしながら、最小集計単位については、これも一つの参考という形で出させていただきますので、恐らくはいろいろな知見とかを今後も踏まえていく必要があるかと思うのです。御提案として、例えば当面人口2,000人以上の市区町村で20、そういうことを御検討いただいてはどうかということで御提案させていただく次第でございます。

 まとめて次も御説明させていただきます。12ページは先ほど挙げさせていただきました論点について、もう少し掘り下げさせていただいています。その他の公表に当たって配慮すべき事項で、例えば集計対象地域等への何らかの配慮等があり得るのかどうかを挙げさせていただいています。これは本当にいろいろな配慮事項で何かあればということを御議論いただきたいと思います。

 申出者基準で、従来は市区町村については市区町村国保が中央団体を通じて申出を行うことが想定された形になっていたのですけれども、仮に公表基準が見直されて市区町村単位の集計情報の公表がより容易になった場合には、恐らく市区町村がデータ提供を求める要望もふえるのではないかと予想しておりまして、そうした場合、今後は個別の市区町村の提供依頼申出も可能としてはどうか、ということで御提案させていただく次第です。

 事務局からは、以上でございます。

○山本座長 ありがとうございました。

 最初にこのレセプト情報等の提供のガイドラインをつくったときに、公表基準を皆さんで御議論いただいて、10のほうは、県あるいは2次医療圏単位で最小特定単位が10というのが、これは米国のCMSの「cell size suppression policy」や「current cell size suppression policy」と言われていて、これで彼らは随分長い間運用し、我々がこれを決める前に恐らく十数年間これでやってきて問題が起こっていないということで、それを根拠に10という数字を決めさせていただいた次第です。

 ちなみにCMSにいる人にこれは何で10なのかと聞いたら、「よくわからない。恐らくSSNの倍ではないか」と言っていましたが、10でとにかく運用できているということで、我々もこれは10にしようということで決めてまいりました。

 一方で、市町村の単位のときの100は、そういう根拠がなくて、始めるに当たってはとにかく安全側に振っておこうということで、十分大きな数として100に決めたという経緯がございます。

 しかしながら、100というのは相当大きな単位になってしまいますので、そもそも分析しても意味がないと判断されるかもわかりませんし、もう少し合理的な理由の数に変えたらどうかと規制改革会議から言われていたわけです。かなり運用してきましたし、いろいろな公表の実績もあることから、このあたりで一回考え直してみるのもどうだろうかということでございます。

 事務局案としては、市町村の人口分布を見て2万5,000人以上が約半分。2万5,000というのは少なくとも2次医療圏の最も小さなものよりは大きい数だということで、それが半数程度。それより小さいところをどうするかが問題になるわけですが、村まで入れると相当小さい自治体もあり、見渡して見える範囲はかなり特定性が高くなると思われます。特に外見上に特徴のある疾患になりますと、例えば小学校区ぐらいでは特定性が高くなるということで、この方法が本当に妥当かどうかは少し問題があるかと思いますが、大まかにはこれくらいの確率でどうだろうかというのが、2,000の場合でも最小特定数を20にしてしまうと確率的には2万人で10よりも下がるでしょう。

 これで言うと10の9乗くらい落ちているわけですが、2000以下になるともう小学校区に近いので、これは難しいかなという気がします。2,000人以下というのはそもそも対象外としておいて、ここでは仮に20としていますが、2,000人以上だったらどうか、あるいはもう少しきめ細やかにして2万5,000以上は10でもいいのではないかといった御提案がございました。

 この点に関して、いかがでしょうか。御意見がありましたらどうぞ。

 石川構成員、どうぞ。

○石川構成員 そこの市町村の人口だとかいったことももちろん大事なことだと思うのですけれども、現在、私なども地域でやっているいわゆる地域包括ケアシステムは、基本的には中学校区とされているわけです。それは全ての地域で守られているわけではないのですけれども、別に余り関係ないのですが、大体1万人というのが一つの水準になっている。

 例えば今、私は小児科ですから学会などの若い方たちの発表を見ますと、症例報告などがあったときに極めて珍しい疾患で外見にすごく特徴があるような病気がありますね。例えば歌舞伎メーキャップシンドロームなど歌舞伎役者の顔をしているようなことについても、全て発表の事前に個人情報をきちんと承諾を得ていますとか、個人がどこにいるかわからないように発表されていたり、この2030年の間に個人が特定されるような状況について、みんなかなり慎重にやっているということが一つあります。

 このレセプトのNDBの有識者会議も26回にわたってやってきまして、いわゆる集計表だとかデータセットだとかそういった利用の仕方も出ていますね。したがいまして、当時、最初に山本先生がおっしゃいましたようにかなり神経質に扱ってきたものから、我々が今、地域包括ケアシステムの中などでやっているときにはもっとぐっと小さくなってきた統計も必要になってきている。

 そうすると、この研究が本当に絞られてきて、どこに住んでいるかとか患者さんが特定されてしまって人権だとか権利を損なうような内容の研究でなければ、もっと絞られてきてもいいかなと。ただ、その辺は公表の仕方で、10で切るとかいうことでなくても、例えばレセプトからどこでどういうお亡くなりの仕方をしたかでは、地域包括ケアシステムはみとりの問題などがあるときに、もう少し少ない数になってきたりするのです。

 それはどちらかと言うと非常に微妙な問題ですけれども、例えば1万ぐらいの地域包括ケアシステムの中でやっても許されるのではないだろうかということもあるのです。

 したがって、内容によって有識者会議でどのような公表の仕方、発表の仕方をするのかということで、研究の内容によって変えることもできるのではないかと思うのですけれども、いかがでしょうか。

○山本座長 ありがとうございます。

 これはおっしゃるとおり、例えば医療機関の最小が3以下というのは、地域医療計画作成のためのデータではゼロの公表を一応認めたという経緯もあって、目的によっては少し融通をもってガイドラインを適用するのは、当然あり得る話だろうと思います。

 したがって、研究計画を見せていただいて何をするのかによって、最終的にはこの会議で判断をすることにさせていただいていいと思うのですけれども、そもそも応募していいかどうかの大まかな基準を決めておく必要があるだろうと思います。

 ほかに御意見はいかがでしょうか。

 どうぞ。

○頭金構成員 案としては人口2,000人以上なのですが、9ページ目のスライドを見ますと、大体2,000以上というと、これはどのぐらいをカバーするのでしょうか。事務局でデータをお持ちでしたら教えて下さい。

○赤羽根室長 ざっくりなのですけれども、逆に2,000を下回る自治体は恐らく100程度なのではないかと思いますので、かなりの部分をカバーできるのではないかと考えてございます。

○山本座長 ほかはいかがでしょうか。

 どうぞ。

○飯山構成員 私も今の石川構成員の御意見に賛成なのです。実際、機械的に判断できるものであればそれはもう何も桁を切る必要はなくて、その内容によってどうしたらいいかを本当にこの会議で議論すべきだと思いますので、そういう判断でよろしいのではないかと思います。

 数の問題についてはそういうことです。

○山本座長 ほかはいかがでしょうか。

 どうぞ。

○石川構成員 今、これは公表の数になっていますけれども、実はこの会議のずっと昔にいわゆる地図データと一致するような研究が出てきたことがありまして、私がよく覚えているのは、自治医大の公衆衛生の先生が自分の大学に通院している患者さんの地図データをやったときに、特に山間部から来られている患者さんなどで、極めて特定性が高いのです。

 今は数の問題でやっていますけれども、それだけではなくて、地図データなどとあわせることによって、非常に問題になるようなこともありますので、そういうことも含めてこの公表基準を考えていかないといけないかと思っています。

○山本座長 ありがとうございます。

 いずれレセプトに郵便番号が入るという可能性はありますから、その場合何桁で切るかなどというのは決めていかないといけないですよね。

 ほかはいかがでしょうか。

 どうぞ。

○飯山構成員 配慮事項でもよろしいですか。

 公表に当たって配慮すべき事項なのですけれども、今、石川構成員がおっしゃったように地図データの問題もありますが、あとはもともと病気というのは余り人に言いたくないものですから、どの病気だということはないのですが、特に社会的に差別が引き起こされるような疾病に関しては、公表に当たって相当慎重な配慮が必要なのではないと思います。

 それは特に、今のお話で地域とつながるようなことになってきますと、その地域の人たちに就職差別、結婚差別といった問題が起きかねないおそれがありますので、そういうところはぜひ配慮が必要だと思っております。

○山本座長 ありがとうございます。

 ほかはいかがでしょうか。よろしゅうございますか。

 今、いただいた御意見はいずれも貴重な御意見だと思いますので、一応の基準としては、2,000人以下の地区に関しては対象外として、2,000人以上の市町村の場合は20人としておいて、正しい研究内容公表形式によって有識者会議で、一つは、目的によってはもう少し下げてもいいかもしれないということと、もう一つは、不当な差別等につながる可能性がないかというような観点を慎重に審議して決めていくという形でよろしいでしょうか。

 もう一つ、例えば政令指定都市でありますとか大きな市町村の場合になってくると、もう都道府県よりも大きい市町村は結構ありますので、市町村の中で2万5,000を超える部分に関しては10ということでよろしいでしょうか。

 それでは、2万5,000に関しては10。2万5,000未満で2,001以上は一応の基準は20である。一応2,000以下は対象としない。それの例外的なことは検討する可能性があるので、研究計画にその趣旨をしっかり書いていただいて、それを見させていただくという形でガイドラインの修正にかかってほしいと思います。

 提供申請者の中に市区町村を加えるということはいかがでございましょうか。市区町村は、国保は持っているのですけれども被用者健保とかそれ以外のデータがないという意味では、このNDBのデータはかなり有用だと思うのですが、幸いシステムも多少早くなったようですし、審査体制も少しは強化されておりますので、事務局としては何とかなるということでございますか。

 これは「加える」でよろしいでしょうか。

(「はい」と声あり)

○山本座長 ありがとうございます。

 それでは、議題1に関しましては、そのように考えていきたいと思います。具体的にはガイドラインの修正が必要ですので、事務局のほうで準備をよろしくお願いいたします。

 それでは、議題「2 サンプリングデータセットの内容充実について」ということで、事務局から御説明をお願いいたします。

○赤羽根室長 資料2「サンプリングデータセットの内容充実について」の2ページ目は、これも検討の背景を載せさせていただいていて、先ほどと同様ことしの6月の規制改革実施計画でサンプリングデータセットの内容の充実を図る必要があると言われている状況でございます。

 3ページ目はこれまで提供されているデータの種類を載せさせていただいていまして、「特別抽出」「集計表情報」「基本データセット」「サンプリングデータセット」を提供させていただいているということでございます。こちらについては17件ということで、比較的たくさん提供させていただいているというものでございます。

 4ページ目はサンプリングデータセットです。平成2311月から平成2711月の間で提供された案件について少し見てみたのですけれども、データが提供されるまでの待機期間が3.6カ月ということで、通常より少し短くなっていますので、事務局側としても比較的迅速に提供しやすいデータセットになっておりますので、そういう観点からもサンプリングデータセットの内容を充実させて、NDBデータの利活用の推進などにもつなげていけないかというところがございます。

 5ページ目は、実際にサンプリングデータセットを使っていただいた方の報告からどんな課題があるのかを抜粋させていただいています。提供依頼申出者の全日本病院協会の吉田愛さんの報告書からの抜粋でございます。

 一つは、年齢が含まれないために、平均年齢を算出できなかった。75歳以上の患者が占める割合で代替することによって患者属性を推定せざるを得なかったとおっしゃっています。

 算定された全ての傷病名コードは含まれているのですけれども、主傷病名とそれ以外の病名の判別が難しいので、受診の契機になったような疾患の把握が難しかったという御指摘でございます。

 そういった意味で、研究上制約があることについて、何らか改善をすることができないかということで、少し事務局でも検討させていただきました。

 6ページ目で、まずは年齢についての御指摘なのですけれども、従来、年齢については5歳刻みのものを準備させていただいていて、85歳以上は85歳以上で丸めるという形になっていたのですが「年齢階級コード2」を用意させていただいて、小児については実際10歳を下回る年齢の方については1歳刻みで見られるようにしてはどうか。

 高齢者の方についても、85歳以上でまとめるのではなくて、それより上も5歳刻みということで、最終的にまとめるのは100歳を上回った方々にしてはどうかと考えております。

 これで年齢といったあたりを細かく見ることができるのではないかと記載しております。

 7ページ目は、疑い病名と主傷病に関して、フラグを入れさせていただいてはどうかということでございます。疑い病名については「8002」という文字が含まれて、これについて疑い病名というフラグを振ってはどうか。

 主傷病については、必ずしも診られた医師の方が主傷病と判断されたということではないのですけれども、ロジックによってこれは主傷病ではないかというものについて、一応フラグを立てるという形でデータセットの中で対応してはどうかということを考えております。

 8ページ目は、先ほどの研究者の方から御指摘いただいている点以外として、例えばサンプリングデータセットで季節性変動みたいなものも見られるようにしてはどうかということで、従来サンプリングデータセットについては10月診療分についてつくっていたのですけれども、そのほかに、冬と春と夏のそれぞれ季節性を表象するものということで、1月、4月、7月のもので、さらに3つ追加してはどうかということでございます。

 9ページ目からは従来の話ですが、サンプリングデータセットの匿名性については、レセプト情報等特別抽出のデータに加えて、さらに都道府県情報等を削除したり、当然抽出もしておりますし、希少なものを匿名化するといった処理もしておりますので、匿名性の高いデータセットになっております。

10ページ目は、公表基準についても、要は1という数字が出てきても、そのバックに10名、100名の方がいるということで、自動的に公表基準を満たす仕組みになっているということでございます。

11ページ目は、今回、御提案させていただいている内容をまとめさせていただいております。年齢階級コードの話、主傷病・疑い病名、サンプリングデータセットについて、新たに【春】【夏】【冬】を導入するというものでございます。

 公表基準については従来のものを継続するということで、また恐らく今後の検討課題では、歯科レセプトのサンプリングデータセットをどうしていくかがあるかと思っています。

 これはまだ事務局でも十分検討ができていないのですけれども、歯科レセプトの電子化もかなり進んでおりますので、いずれ来年度以降、何らか作成を検討してはどうかと考えております。

 事務局からは以上でございます。

○山本座長 どうもありがとうございました。

 今の事務局からの御説明に関して、御質問、御意見がありましたら、どうぞよろしくお願いいたします。

 どうぞ。

○石川構成員 年齢階級コードなのですけれども、今、サンプリングデータセットの話をしていますが、例えば集計表のところでもこういったものを使う可能性があるわけですか。

○赤羽根室長 考え方としてはおっしゃるとおりで、例えば子供については1歳刻みであるとか、そういったことは適用し得る範囲ということでございます。

○石川構成員 私は小児科ということもありまして、基本的には子供の場合には、小学校前もそうですし、小学校と中学校はいろいろなデータ的にもすごく大きな差があるのです。ですから「1014歳」というのは極めて意味不明なのです。

 どれでやっても、学校保健などの世界でも、1213歳の中学1年生から急にある疾病がふえるとかいうことがあるので、ここは全部細かくしろとは言いませんけれども、ある点では、例えばサンプリングデータセットのオーダーを出されるときに、少し前から年齢階級コードについては、そこら辺は研究者の自由にしていただかないと「1014歳」は全く意味不明です。

 「1519歳」というのも全く当たっているとは思っていないので、そういうことをお考えになったほうがいいのではないかと思うのです。全部1歳区切りでゼロから9歳までやっているというのは、余り意味もないのです。7歳から9歳ぐらいまでは本当に病気がないときなのです。

 そういうこともありますので、単純にこれをやるのではなくて、研究者がどういうことをやりたいのかも含めて、できればですけれどもバリエーションがあるような形にしたほうがいいかもしれないですね。

○山本座長 ありがとうございます。

 もちろん集計表のオーダーは研究計画に沿ってここで議論して変えていくのは簡単だと思うのですけれども、サンプリングデータセットの場合余り注文に応じてやっていると、サンプリングデータセットではなくなってしまって、また時間がかかってしまいますので、そういう意味では、この年齢階級コードにも、できればこの時点で一番合理的な形で決めてしまうほうが多分いいと思うのです。

 そういう意味では、例えば5歳までは1歳刻みで、あとは中学・高校生がうまく入るような形で3歳刻みぐらいで切っていくとか、そういうほうが現実に合うかもしれませんね。

○石川構成員 そういうことであれば、結構小学校の低学年と高学年の疾病構造は全然違うのです。もちろん、小学校から中学校のところでもある病気ががんとふえたりするということがあって、中高でも全然違うのです。

 そういう点では、5歳ぐらいまでのところと3歳刻みでもおもしろいかもしれないですね。

 ただ、恐らくサンプリングデータセットを使ってそういうことでやりたい人については、サンプリングデータ自体を使わないかもしれないですね。

○赤羽根室長 ありがとうございます。

 実はシステムのところがありますので、恐らく御指摘をすぐ踏まえるのは難しいかもしれないのですけれども、本当に重要な点だと思いますので、どういう形で対応できるかも含めて、案を考えたいと思います。

○山本座長 よろしくお願いします。

 あとはいかがでしょうか。

 どうぞ。

○頭金構成員 サンプリングデータセットはもともと抽出データで個人特定可能性が低く、探索的な研究に使えるというところで有用性が高いところがございました。

 一方、ただいま御指摘があったような限界があったのですけれども、そこら辺を少しずつ改善していただけるということで、研究する立場の者にとっても非常にありがたいと考えております。

 ただ、例えば主傷病名の決定フラグを導入するところは、どういうロジックでフラグを立てるのだろうかというところは研究者としては気になるところになりますので、概要だけでもお示しいただけるとありがたいです。

 以上です。

○山本座長 ありがとうございます。

 もしロジックで立てるのだったらロジックを公開しないといけなくなりますけれども、大丈夫ですか。

○赤羽根室長 ロジックについては、当然、研究者の方が把握できないものだと意味がないと考えておりますので、そこは御説明できるようにしたいと考えています。

○山本座長 例えば、ダミー化した病名に主傷病名がついた場合はどうするとか、そういうものもありますよね。多分病名コードで言えば7割ぐらいがダミー化されてしまうので、それも検討しないといけないですよね。

 どうぞ。

○小泉構成員 歯科なのですけれども、都道府県の健康増進計画とかいったところに12歳児の虫歯の本数とか、歯科のデータをとるときに1歳半、3歳、あと12歳が入っているのです。12歳はちょうど小学校から中学校に行く時期でありまして、今、すごく虫歯は減っているのですけれども、中学に行くと部活でスポーツドリンク等を飲んだりいろいろなことをして急激に虫歯がふえたりするのです。

12歳児で虫歯が減ってくると、その後治療したところがまただめになってという悪循環にはまらないので、大人になっても歯がいいままなのです。ですから12歳児は非常に重要視されているのです。

 ですから、そういったことも踏まえて大事な時期をとれるような形をお願いしたいと思います。

○山本座長 ありがとうございます。

 どうぞ。

○大久保構成員 これは確認ですが、この年齢階級コード1と2がありますけれども、これは1と2どちらを選択しても中身は同じということですよね。

 これによって変わるということではないですよね。

○赤羽根室長 おっしゃるとおりです。

○大久保構成員 わかりました。

○山本座長 ほかはいかがでしょうか。

 【冬】は難しいのですけれども、1月はお正月、12月と1月は年末年始のお休みが入るので、しかし4つに区切ると1月になるのでしょうね。

 ほかに御意見はございませんでしょうか。

 それでは、今日いただいた御意見を踏まえて少し検討を進めていただくようにお願いいたします。基本的にはふやすことは多分皆さん賛成だと思いますので、その辺で検討を進めていただくようお願いします。

 それでは、次の議題「3 オンサイトリサーチセンターの進捗状況について」を事務局から説明をお願いいたします。

○赤羽根室長 事務局でございます。

 資料3「オンサイトリサーチセンターの試行的利用の開始と本格利用に向けての進捗状況について」の2ページでございます。規制改革実施計画の中で書かれていることを挙げさせていただいていて、平成27年度としてはオンサイトの運用ルールの確立。平成28年度については、オンサイトの特性を生かした活用方策が書かれております。

 オンサイトについてはまず、東大と京大で試行利用を進めていくということで、御了解をいただいていたところなのですけれども、その状況について少し御報告させていただきます。

 3ページ目は、以前の有識者会議の資料でも出させていただいたもので、試行利用の際にどういった枠組みでやっていくかを図示したものでございます。基本的には規約を遵守した利用を誓約していただいて、それを踏まえて利用していく形を考えております。

 4ページ目は、オンサイトの利用規約と運用管理規程のそれぞれの内容を出させていただいております。オンサイトの利用規約は基本的に利用するに当たって条件を記したもので、運用管理規程のほうはもう少し具体的にどういう利用手順かとかを入れております。

 5ページ目は、もう少し細かい利用規約の話を書かせていただいております。試行的利用の中では基本的に提供依頼申出をしていただいて、それが承諾されれば利用するという枠組みで、従来の第三者提供に近い形をやらせていただいております。

 6ページ目は、運用管理規程についてですけれども、組織体制がどのようになっているのかを少し入れさせていただいておりまして、例として東大側のオンサイトの体制を出させていただいておりますが、協定実施責任者ということで医学系研究科長が入られていて、事実上のセンター長ということで施設管理者の方がいらっしゃる形になっております。厚生労働省、大学と協力して安全で適正なオンサイト利用を確保していきたいと考えております。

 7ページ目は、それぞれのオンサイトの準備状況を入れさせていただいております。東大と京大なのですけれども、東大については、今、最終的に学内決済の完了待ちという状況ですので、これが完了次第オンサイトの研究に着手していくということになると思います。

 京大については、規程等を厚労省でも検討しておりますし、大学のほうでも倫理審査等々をしているところでございまして、この双方が完了していくと、研究に着手できるということになりますので、東大のほうが少し進んでいるような状況でございます。

 連絡協議会をことしの8月に開催させていただいて、今後の運用等について意見交換を行っておりまして、来年の2月にオンサイトの連絡協議会を開催する予定にしております。

 8ページ目からは、24回の有識者会議で御審議いただいた模擬申出になります。東大、京大からこのような申出を出していただいた。このあたりの研究はまずオンサイトの試行利用が始まっていれば着手していくことになるということでございます。

10ページ目は、今後の検討課題を挙げさせていただいております。恐らく大きく4つの話があるのではないかということで、技術的なところでは、統計解析の環境とかセキュリティー環境。これは第三者が扱えるような形で整備していけるかということ。

 手続でいうと、試行については、試行のための運用管理規程といったあたりでやっているのですけれども、第三者に向けた形のものを整備していかなければならない。

 当然、情報提供で、利用希望者に向けて説明会等々を開催する必要がある。

 長期的な視野に立ってどういう形で運用の継続性を確保していくか、というところがございます。

 今後の検討課題ということで挙げさせていただいております。

 事務局からは以上でございます。

○山本座長 ありがとうございました。

 ただいまの事務局からの御報告に関しまして、何か御質問、御意見はございますでしょうか。

 どうぞ。

○小泉構成員 東大、京大にオンサイトセンターをつくったときに、3番の利用希望者向けの説明会というのは、ほかの大学の研究室でも自由に使えるということなのですか。

○赤羽根室長 試行利用は何が起こるかわからないので、東大、京大でやっていただくという形にしているのですけれども、第三者に公開ということになった場合には当然、ほかの大学の研究者の方が使えるということになってくると思います。

○小泉構成員 それはいつごろなのですか。

○赤羽根室長 それについては、試行利用の状況と、実際どういう枠組みでやっていくかをこの有識者会議で御議論いただきますので、その議論がまとまった段階でということになってくるかと思います。

○山本座長 大学とも限らないですよね。提供申出資格者であればいいということであります。

 ほかに特に御質問はございませんでしょうか。

 では、これは粛々と進めていただくことにさせていただきたいと思います。

 引き続いて「4 『NDBオープンデータ』作成の進捗状況について」を事務局から御説明をお願いいたします。

○赤羽根室長 資料4「『NDBオープンデータ』作成の進捗状況について」をごらんいただければと思います。

2ページ目でございます。これまで頭金構成員に座長をしていただきました民間提供に関するワーキンググループの中でも、汎用性が高くてさまざまなニーズに一定程度応え得るような基礎的な集計表を作成して公表していくことが適当ではないか、という御指摘をいただいております。

 規制改革実施計画の中でも、民間企業からの提案に基づいてNDBデータをもとにした集計表を作成する枠組みを構築するということが掲げられております。

 こうしたところも踏まえまして3ページ目は、以前、いわゆるNDB白書ということでずっと御報告させていただいたものが「NDBオープンデータ」という名前になりまして、事務局で準備を進めさせていただいているという状況でございます。

NDBオープンデータのイメージですけれども、3ページ目にございますように診療行為、検査等々について地域とか年齢といった区分で集計をしてみて、これを公表していってはどうかというのがざっくりしたイメージでございます。

 現在の想定としては、継続的にウエブサイトに公表していくことを考えております。当然ながら公表に当たっては、必要に応じて有識者会議の進捗等々を御報告させていただこうと考えております。

 4ページ目は、今回、NDBオープンデータの作成を進めさせていただくに当たって、どのように集計をやっていくかあたりも含めて調査分析のワーキングをつくらせていただいております。これに書かせていただいている構成員の方々、京都大学の加藤先生に座長をやっていただいて、有識者会議からは頭金先生、分科会からは健保連の松本構成員も入っていただいております。今のところ2回開催しておりまして、来年1月に次回開催の予定でございます。

 5ページ目は、まだまだ素案の段階なのですけれども、現時点でのNDBオープンデータの構成のイメージを挙げさせていただいております。

 具体的に本編の第1部と資料編の第2部ということで、2部構成で考えておりまして、中には一般向けと研究者向けにそれぞれNDBオープンデータの適切な読み方とか、実際に研究への活用とか第三者提供を受けようとしたときに、実際にどのようにしていったらいいのかというあたりも入れさせていただこうと思っています。資料編では本当に研究者の先生方にも使いやすいようにエクセル等をそのままウエブサイトに載せさせていただくことも考えております。

 今、念頭に置いている集計項目がこのあたりに掲げさせていただいているものでございます。

 6ページ目は、大ざっぱなスケジュールのイメージになります。実際、抽出条件の確定とか調査分析の実施といったあたりをちょうど今、やっているところでございまして、1月あたりでこれが大体落ちついてくると報告書の作成といったあたりになっておりますので、次回の有識者会議でも御報告をさせていただければと思っております。

 7ページ目、8ページ目は御参考ということでつけさせていただいております。

 最後の9ページ目に「今回の論点」とあるのが、議題1でもいただいた話かと思うのですけれども、公表に当たって何らかの配慮を要するかという点。広く一般に出していくということで、国民に親しまれるオープンデータにするためにどのような工夫が考えられるのかという点もわかるかと思います。

 事務局からは、以上でございます。

○山本座長 ありがとうございました。

 大分進んでいるようですけれども、今の御説明に関しまして、御質問、御意見がありましたらよろしくお願いいたします。

 白書と言ってしまったものですから、どうも違うとずっと思っていたので、個人的には白書がオープンデータになってほっとしています。

 どうぞ。

○飯山構成員 5ページの目次の本編の「第1章 NDBオープンデータとは」で構築の経緯とかレセプトの構造とかいろいろ解説もされると思うのですけれども、その中でNDBはいかに個人が特定されないように工夫をしているかというところ、セキュリティの問題もぜひ触れていただいたほうがいいのではないかと思います。

 もう一つは、データですから数字がいっぱい出てくると思うのですけれども、できるだけビジュアル化してぱっと見て傾向がつかめるとかイメージが湧くような工夫もぜひお願いしたいと思います。

○山本座長 ありがとうございます。

 ほかはいかがでしょうか。

 どうぞ。

○鈴木構成員 資料6ページで、このオープンデータは今年度内の完成と公表を予定しているということなのですが、5ページで「平成28年版NDBオープンデータ」と書いてあるのですけれども、これはどういうことなのですか。

○赤羽根室長 一応、平成28年に出るオープンデータということで、平成28年版という書き方をしているのですけれども、年度で打つのか年で打つのか少し整理をしたいと思います。

○鈴木構成員 それと、最後の9ページに今回の論点ということで、国民に親しまれる工夫を考えるということなのですが、国民がこの内容を知りたいということで、「NDBオープンデータ」という正式名称なのでしょうけれども、サブタイトルでもいいのですがもっと親しみのあるようなわかりやすい名称があるとより情報を見たいという国民がふえるのかなと思っています。

 以上です。

○山本座長 ありがとうございます。

○吉村補佐 事務局から補足いたします。

 その点につきましては、調査分析ワーキンググループのほうで、患者団体の方からの御指摘、御意見もいただいてございますので、親しみやすいサブタイトルについては検討してまいりたいと思います。

○山本座長 よろしくお願いします。

 ほかはいかがでしょうか。

 多分、公表されるオープンデータのエクセルシートとかグラフがそのまま直接引用されることもあるのでしょうけれども、恐らくそのデータをさまざま見やすいことに加工して使われる、あるいは研究に使われるということがあって、最終的に論文になったときに余り「国民が」というのは要らないのですけれども、例えば、報道されるときとかそういったときにちゃんとこれがNDBオープンデータをもとにしたのだということを宣伝してもらうのがいいと思うのです。

 そのためには、名前は「NDBオープンデータ」でもいいと思うのですけれども、少し格好のいいロゴを考えていただいて、必ずこれを見せろとか、そういうことがあったほうがより親しまれるのではないかと思うのです。

 最近は、テレビの番組などでもデータに基づいて何か解説するみたいなものがたくさんありますから、そのときにいつも厚労省の何とか白書からとか書いてありますよね。あのときにちゃんとNDBオープンデータというのがきちんとわかりやすく出るというが大事だと思います。

 もう少し具体的な像というのは、公表までにこの会議で出てくるのでしょうか。

○赤羽根室長 もう少し、当然具体的なものを提示させていただくことを考えております。

○山本座長 この1つ目の論点はもう少し具体的なところでもうちょっと確認したいと思いますけれども、それでよろしゅうございますでしょうか。

 あとは何か御意見がございますでしょうか。

 この継続できるというのはいかがなものでございましょうか。

○赤羽根室長 予算という意味で言うと、まずは毎年ちゃんと継続的にとりにいくということで考えております。ただ、長期的な視野でどういうやり方がいいのかは少し考えなければいけないかというのは、御指摘のとおりかなと思ってございます。

○山本座長 当面は、政府内でもしっかり宣伝をしていかないといけないですよね。よろしくお願いいたします。

 ほか、何か御意見はございますでしょうか。よろしゅうございますでしょうか。

 それでは、本日の議題の「5 『申出者向けマニュアル』の見直しについて」ということで、事務局から御説明をお願いいたします。

○赤羽根室長 資料5「『申出者向けマニュアル』の見直しについて」をごらんいただければと思います。申出者向けマニュアルは2013年に初版を発行しているのですけれども、そこから少し時間がたっておりますので、その見直しを今般させていただきました御報告でございます。

 2ページに申出者向けマニュアルの概要を載せさせていただいております。主な見直し点で1番から6番を挙げさせていただいていて、データベースに含まれる情報の話を少し更新させていただいたり、セキュリティー要件の話等を追記したということがございます。

 「2:提供に当たっての要件について」ということで、これは以前の有識者会議でも少し御議論いただいたのですけれども、AMEDが設立されたのに伴いまして少し申出者要件が変わりましたので、これを追加しております。

 3番目で準備すべき書類の整理についてもう少し親切な記載にしていることがございます。

 4番目については、申出者重複申請があった場合の留意事項というあたりを追記しております。

 5番目はほとんど字句の整理。

 6番目については、新しいシステムで点数等々の補完を行っておりますので、こうしたことの追記をさせていただいております。

 詳細は次からマニュアルをつけさせていただいておりますので、そちらをごらんいただければと思います。具体的に追記した箇所は赤字でお示しさせていただいております。これでまた更新したマニュアルで利活用をさらに推進できればと思っております。

 事務局からは以上でございます。

○山本座長 ありがとうございました。

 今の御説明に関して何か御意見はございますでしょうか。

 マニュアルに関して、実際に申出者から何か意見があったとか何とかというのはございますか。新しいものではなくて今までのものです。

○吉村補佐 事務局でございます。

 主に31ページ、32ページに「6:レセプト情報等の特徴について」という項目にかなり追記をさせていただきました。レセプト情報の特徴、内容につきましては、かなり把握が複雑なところもあって困難があるという声が寄せられておりましたので、図示を含めてこのあたりを追記というのが今回させていただいたところです。

 以上です。

○山本座長 よくわかりました。

 よろしゅうございますか。一応、事前に見せていただいて特に問題はないと思いましたけれども、もし何かお気づきの点がありましたら、事務局に直接御連絡をいただければと思います。

 特に御意見はございませんか。

 霜鳥構成員、どうぞ。

○霜鳥構成員 取り扱いに関する全体的な話になるのですが、課長が替わられるなど厚労省側の体制も変わったことを考慮すると、ニーズに対して実際の体制に非常にギャップがあるように思っています。

私の考えとしては、まず、厚労省内での体制をきちんとして、安全かつ安定した運営ができる人員配置をとっていただきたいということ。

また、行政目的での利用のほかに民間利用が始まってきたとき、体制、継続性からすると、将来的にはある程度手数料を取り、自主財源にする方が実態に合ってくるのではないかということです。

手数料をいただくと趣味的な変な閲覧も抑止されますし、遂行するには体制整備も必須と考えます。そういうことを検討する時期に入ってきつつあるのではないかと考えていますので、そういうことも新体制になったので是非お伝えしていただければと思います。

○山本座長 ありがとうございます。

 どうぞ。

○田尻構成員 今のお話を聞きながら、民間利用が始まった場合、例えばこれはどの程度の需要が、将来的に申出があるかということについてははどう考えておられるのか。国費でこれを運営していくのはもう限られた期間でしょうし、これを永続的に続けるのであれば、結局利用者負担という格好が基本になるのかなと思った場合に、そこら辺の何か将来的な需要見込みはどうなのでしょうか。お考えになっているのか。

○山本座長 難しい御質問ですね。

○赤羽根室長 田尻構成員がおっしゃるのは、まさに我々も頭を悩ませているところでございまして、民間という形で仮に門戸を開いた場合、どのくらいの負荷がかかるのかは我々もなかなか簡単に予想できないところではあります。

 そのほかにもいろいろ民間に関しては検討いただかないといけない課題がありますのであれなのですけれども、恐らく負荷というあたりも含めながら、現実的な答えというか、そこら辺を探っていかなければいけないのかなというのは我々も考えているところなので、逆にまたいろいろお知恵をいただければとも思っております。

○田尻構成員 ありがとうございます。

○山本座長 アメリカのCMSがやっているのは、研究者からもお金をとるのですけれども、年間利用料が4万ドルで、今の我々で言うところのオンサイトリサーチセンターの操作環境をもう少し安全側に振ったような、要するにデータを扱うデスクトップ化といいますか、それをVPNで1年間使わせてくれるのが4万ドルで、ただというのはないのです。全部お金が要るのです。

 ですから、研究費をとってきてそのお金を出すみたいな形で進めていて、年間利用者数は結構な数があったみたいですね。

 もちろん、その収益でまたペイしなくて、それこそCMS自体の分析があるので政策を決めたりとか何とかするための利用があって、プラスその収益で動いているとか言っていますね。以前よりは安くなったということでしたけれどもね。

 今までのサンプリングセットみたいなものは今でもあるのですけれども、本当にオンサイトリサーチセンターに近いような形で動かせるものが4万ドルなのです。日本で4万ドルはちょっときついですね。年間500万円払えと言われると、相当科研費をとってこないと払い切れないですよね。

 あとは、何回か有識者会議の報告書で書いていますけれども、高齢者の医療の確保に関する法律だけで運用するのは結構限界に近づいていると思うのです。きちんとした罰則をつけられないとか、先ほどの料金のことにしても、料金徴収の仕組みが全くないということですとか、そういう意味では厚生労働省もこれだけではなくてDPCのデータベースも構築されるし、厚労省にはないのかもしれませんけれども、全国がん登録のデータベースもできるわけですし、そういう意味ではなかなか難しい問題だとは思いますが、厚生労働省の扱うデータに関するきちんとしたルールを考えたほうがいいのではないですか。

 どうぞ。

○霜鳥構成員 私どもも同じ考え方で、セキュリティーに対し、それなりの体制をとってもらわないと、健保組合のデータを本当に使わせていいのかという疑問が我々に問われてしまうのです。

 体制整備がなされていれば使ってもいいという意味になると思われますが、それを確認しないままずるずる実施することになると、拒否反応が起きてくる可能性もあるので、考えていただきたいと思っています。

○山本座長 マニュアルに関しては、もし後でお気づきの点がありましたら、事務局に御連絡いただければと思います。

 今もう既に「6 その他」に入っておりますけれども、多少時間がございますので、何か全体を通じて御意見がございましたら、どうぞよろしくお願いいたします。

 今後のスケジュール等に関しまして、事務局からありましたらよろしくお願いをいたします。

○赤羽根室長 本日はありがとうございます。

 次の本会議の日程は調整の上お知らせさせていただくのですけれども、来年、できるだけ早目に開催させていただければと思っておりますので、よろしくお願いいたします。

 事務局からは以上です。

○山本座長 ありがとうございました。

 それでは、もし何もございませんようでしたら、これで終わりたいと思います。

 どうぞ。

○石川構成員 先ほど霜鳥構成員からあった話なのですけれども、実は6年ぐらい前にレセプトの統計をするということで、ほぼグレーゾーンなのですが、これを一部業者が分析して匿名化しているからということでホームページとかいろいろなところにそういった結果を出したということがありました。

 それは今でも続いている嫌いがあるのですけれども、NDBで一生懸命私たちが議論しまして、これだけ日本の全体のものが出て、それもサンプリング、データセット集計表という作業も経て使いやすくしているところで、要するに、レセプトのデータを横に流された方もいるわけなのですが、そういう一部の業者の方たちが利用していることについて、グレーと厚生労働省の方は言っていたのですが、この際にはそういったことはないように今後、していただきたいと医療界としては痛切に要望したいと思うのです。

 せっかくこういうものをつくって皆さんが個人情報をちゃんと守られた形で、政府もビッグデータを利用しなさいということを言っているわけですから、それをなるべく国民が安心して使っていただくような形で体制を整えているということを反映していただきまして、そういうものを厚生労働省のほうからいろいろと指導していただきたいと考えております。

 よろしくお願いします。

○山本座長 ありがとうございます。

 個人情報保護法の改正が実施されるところが一つのポイントだと思いますので、その辺はしっかり検討していただきたいと思います。

 ほかは特にございませんでしょうか。

 それでは、これで終わりたいと思います。

 きょうは、活発な御議論ありがとうございました。


(了)

ホーム> 政策について> 審議会・研究会等> 保険局が実施する検討会等> レセプト情報等の提供に関する有識者会議> 第26回レセプト情報等の提供に関する有識者会議 議事録(2015年12月9日)

ページの先頭へ戻る