第1回 匿名感染症関連情報の第三者提供に関する有識者会議  議事録

日時

  • 令和5年6月23日(金)13:00~15:00

場所

航空会館ビジネスフォーラム(B101号室)

議題

(1)本会議の経緯、今後の進め方、本日の論点等について
(2)具体的な事例について
(3)その他

議事

議事内容
○井上結核感染症課総括調整官 それでは、定刻となりましたので、ただいまから第1回「匿名感染症関連情報の第三者提供に関する有識者会議」を開催したいと思います。
 構成員の皆様方におかれましては、御多忙にもかかわらず御出席いただきまして、誠にありがとうございます。
 本日、事務局から説明をさせていただきます、厚生労働省健康局結核感染症課の井上でございます。
 まず、本有識者会議開催に際しまして、佐原健康局長より御挨拶を申し上げます。よろしくお願いいたします。
○佐原健康局長 皆さん、こんにちは。健康局長の佐原と申します。
 本日は大変お忙しい中お集まりをいただきまして、誠にありがとうございます。
 また、日頃より感染症対策の推進に御協力いただきますことを、この場をお借りしまして、厚くお礼を申し上げます。いつもありがとうございます。
 さて、昨年6月15日になりますけれども、取りまとめられました新型コロナウイルス感染症対応に関する有識者会議の報告書におきまして、感染症関連情報のさらなる活用の必要性について御指摘をいただきました。これを踏まえまして、発生届等の感染症の疫学情報について、匿名化した上での第三者提供やワクチン接種情報等との連結分析などを可能とする仕組みを整備することといたしました。
 そして、当該内容を盛り込んだ改正感染症法が昨年12月に国会で成立したことから、令和6年の4月1日から匿名感染症関連情報の第三者提供制度を創設することとなりました。その制度の具体化に当たり、匿名感染症情報の利活用に関する専門的な御意見を伺うべく、本有識者会議を設置したところであります。
 御参集賜りました構成員の皆様におかれましては、ぜひ御闊達な御議論をいただければと思います。どうぞよろしくお願いいたします。
○井上結核感染症課総括調整官 それでは、これ以降に関しましては、写真撮影、ビデオ撮影、録音等をすることはできませんので、傍聴の皆様におかれては、御留意いただきたいと思います。
 また、その他注意事項でございます。本日は、ウェブ会議で開催することとなっております。構成員の皆様におきましては、個別に発言される場合は挙手機能を用いて挙手いただきますようお願いいたします。あるいはチャットに発言される旨のコメントを記載いただくことで、その後、座長から御指名いただき、御発言をお願いしたいと考えております。また、ウェブ会議ですので、タイムラグが生じる可能性がございますこと、あらかじめ御了承願います。
 また、本会議について、参考資料1に開催要綱がありますが、本会議は、厚生労働省健康局長が参集する有識者会議として開催いたします。
 本日は、感染症対策、統計分析、臨床研究倫理、個人情報保護などの各分野に関する方々に御参集をいただいております。会議は必要に応じて構成員以外の専門家の方から意見陳述を求めることができることとなっております。本日は、東京大学の康永参考人にお越しいただいております。
 また、会議は原則公開とし、ただし、個人情報保護に支障を及ぼすおそれ、また、個人・団体の権利利益が不当に侵害されるおそれがあるなどの場合は、座長は会議を非公開とすることができることとしております。
 座長については、開催要綱にもございますとおり、厚生労働省健康局長が指名した方とされておりまして、健康局長の指名に基づきまして、座長を山本構成員にお願いしたいと思います。皆様、御了知のほどよろしくお願いいたします。
 次に、本日の出席状況ですが、今村構成員が御欠席となっております。
 また、本日の発表に関しまして、事務局から論点等を後ほど説明させていただき、その後、参考人としていらっしゃっております康永教授からデータベース間の連結解析の事例といったものを御発表いただくこととしております。さらに、山本座長から他の公的データベースの制度と運用に関する御発表をいただくこととなってございます。
 本日、最初の会議でございますので、まず、構成員の皆様方から簡単な自己紹介を兼ねた御挨拶をいただければ幸いです。山本座長から御挨拶をお願いし、その後、別途お送りしてございます構成員名簿の順に大曲構成員から一言ずついただき、また、本日お越しいただいております参考人の康永教授からも一言いただきたく存じます。よろしくお願いします。
○山本座長 ただいま座長に御指名いただきました、山本でございます。
 医療情報システム開発センターの理事長ですけれども、実はというぐらい臨床から遠ざかっている医師でございまして、もともと内科医で、病理医をして、それから医療情報の研究者になって、ずっと過ごしてまいりました。NDB、介護総合データベース、難病、小慢、DPCもそうですし、PMDAが実質的に運用しているMID-NETとか、いわゆる公的データベースに関して様々な経緯があっていろいろお世話をしてまいりました。その知見をできれば生かして、この感染症データベースと第三者提供もうまくいくような提言ができればと思っておりますので、どうぞよろしくお願いをいたします。
 大曲先生、お願いします。
○大曲構成員 国立国際医療研究センターの大曲貴夫と申します。よろしくお願いいたします。
 臨床医でありまして、感染症が専門です。臨床しながら研究開発にも関わっているのと、厚労省の事業で例えば薬剤耐性のリファレンスセンターを行っています。こうした活動の中で、国の保有するデータベース、NDB等を使って統計をつくるあるいは研究を行うということをやっている立場でございます。よろしくお願いいたします。
○山本座長 鈴木先生、お願いします。
○鈴木構成員 国立感染症研究所感染症疫学センターの鈴木基です。
 私は感染症疫学センターという立場ですので、感染症法に基づいて集められる感染症発生動向調査の発生届の情報を分析して還元をするという立場で仕事をしてきております。また、新型コロナのパンデミックの発生に際しては、いわゆる積極的疫学調査などを通して収集されたデータの分析にも当たってまいりました。今回の匿名感染症情報の第三者提供に貢献していきたいと思っております。本日はよろしくお願いいたします。
○山本座長 田辺先生、お願いいたします。
○田辺構成員 三重大学病院感染制御部の田辺と申します。
 私は以前厚生労働省で医系技官として勤務したり、あるいは三重県庁で地方行政の立場でも感染症分野で関わったことがございます。現在は大学病院で勤務しておりますので、ユーザー側としてどのようにこの感染症情報を扱っていくかということで検討させていただきたいと思います。どうぞよろしくお願いいたします。
○山本座長 戸部先生、お願いいたします。
○戸部構成員 慶應義塾大学の戸部真澄と申します。
 所属は法学部で、専門は行政法ですので、法律的な観点から何らかの貢献ができればと考えております。よろしくお願いします。
○山本座長 日置先生、お願いいたします。
○日置構成員 三浦法律事務所の弁護士の日置巴美と申します。
 私は平成27年の個人情報保護法改正で、匿名加工情報であるとか、個人識別符号、個人情報の明確化ですとか、そういったところを中心に担当してきまして、弁護士として登録した後は医療・ヘルスケア分野ですと、官民いずれの立場からも利活用の側面も含めて実務対応させていただいてきたという経緯がございます。本日はその観点からもお話をさせていただければと考えております。よろしくお願いいたします。
○山本座長 横野先生、お願いいたします。
○横野構成員 早稲田大学の横野恵と申します。
 専門は医事法学、生命倫理なのですけれども、現在主に研究目的での医療データの利活用、特にゲノムデータの利活用に関わっています。医学研究に関する倫理指針の見直しですとか、今ですと次世代医療基盤法の関係などに関わってきました。また、今回扱う情報に関しては、これまで私が接してきた情報とは少し性質の違うものになるのですけれども、できるだけこれまでの経験を生かしながら貢献できればと思っております。よろしくお願いいたします。
○山本座長 最後に、康永先生、お願いいたします。
○康永参考人 東京大学の康永秀生と申します。
 私は専門は臨床疫学、医療統計などでございます。様々な公的データ、民間のデータも含めていろいろなリアルワールドデータを分析することをふだん行っております。後ほど予防接種情報とレセプト情報の統合データなどの事例について御報告をさせていただきます。どうぞよろしくお願いいたします。
○井上結核感染症課総括調整官 ありがとうございました。
 以降の議事進行につきましては、山本座長にお願いしたいと思います。よろしくお願いいたします。
○山本座長 それでは、早速議事を進めてまいりたいと思います。
 最初に、資料の確認を事務局からお願いいたします。
○井上結核感染症課総括調整官 資料でございますが、事前に委員の皆様方には資料の入っているフォルダのリンクをお送りさせていただいていると思いますけれども、議事次第にございますとおり、資料に関しては1、2、3、4ということで、これまでの経緯、今後の進め方、主な論点と対応方針、そして、康永先生、山本先生の資料となってございます。それらに関しまして、皆様、御確認のほどよろしいでしょうか。
 ありがとうございます。
 それでは、山本座長、よろしくお願いします。
○山本座長 それでは、早速議事次第に従いまして、最初に「(1)本会議の経緯、今後の進め方、本日の論点等について」ということで、本有識者会議の設置の経緯、前提、主な論点と検討の視点等について事務局から説明をお願いいたします。
○井上結核感染症課総括調整官 説明申し上げます。
 まず、2ページ目でございます。先ほど局長の挨拶の中にもございましたとおり、昨年6月、内閣官房の有識者会議報告書におきまして感染症関連情報のさらなる活用の必要性が指摘されたことを受けまして、匿名感染症関連情報の第三者提供制度を可能とする内容を盛り込んだ感染症法等改正案、こちらを昨年秋の国会に提出し、昨年12月に成立、そして、当該制度に関しまして、令和6年4月1日から創設されることとなったものでございます。
 次、お願いします。昨年の有識者会議の報告書において具体的にどのような指摘があったか抜粋してございます。新型コロナウイルス対応においては、重症化リスク、治療効果、ワクチン効果などの分析が不十分であったことから、外部の研究者が活用することが困難であったこと、今後につきましては、安心して迅速に情報を提供・共有できる環境を整備し、サーベイランスを強化することが必要であること、あわせて、外部の専門家との連携が必要であることが指摘されています。
 次、お願いいたします。今ほど述べました立法事実と、感染症の基本理念から導かれる本制度の趣旨についてまとめております。まず、感染症法で収集する情報には機微情報が多く含まれるため、人権面に最大限の配慮が必要であること、また、新型コロナウイルス感染症への対応を踏まえれば、今後国民の生命、健康に重大な影響を与える感染症を念頭に、感染症の重症度、ワクチン・治療薬の有効性等の分析に資する調査・研究を促進することで、国民保健の向上に資することを目的とし、匿名化した大量の症例データを他の情報と連結解析することを視野に、第三者へ提供していくことが本制度の趣旨と考えております。
 次、お願いします。こちらのページは、感染症情報がこれまでどのように提供されてきたのか、また、次年度から創設される本制度がどこに位置づけられるのかを可視化したものでございます。縦軸に情報の提供速度、つまりは迅速性、横軸に活用できる情報量といった2軸で区分してございます。まず、左上でございますが、感染症法に基づき収集される発生届などの情報について、年齢・地域等の属性でグルーピングした情報を提供するオープンデータ、ここではコロナウイルスの場合を例として、「データから分かる」といったものがございます。また、国立感染症研究所が週次で公表しておりますIDWR、さらに、重篤な感染症などについて、個人特定に至らないよう配慮しつつ積極的疫学調査で得られた行動歴などの一部の情報を公表し、国民に注意喚起を図る公表基準に基づく公表制度といったものが左上に整理されるものと考えております。
 一方、右側でございますが、より詳細な臨床情報等を活用した分析・公表制度として、FF100(First Few Hundred)といったものがございます。あるいは予防法・診断法・治療法の開発を進める目的からREBINDといった事業、こちらが右側に位置づけられるものと考えております。そして、本制度、第三者提供制度に関しましては、臨床情報はこちらには含まれない形で考えてございますけれども、主に発生届等の情報について匿名化した症例ベースの情報の提供を予定していることから、これらの中間に当たるような場所が新たに手当てされるイメージと考えております。
 次をお願いします。6ページ目、7ページ目、こちらは今年の4月の感染症部会で報告した内容でございますが、内容は割愛いたしますが、1点だけ、次のページ、よろしいでしょうか。4月に御報告した際には、本有識者会議の名称に関しまして「匿名感染症関連情報の提供に関する有識者会議」となっておりましたが、今回から、制度の目的をより明確化する観点から「匿名感染症関連情報の第三者提供に関する有識者会議」という形で、形式的なところではございますが、名称を一部修正しておりますので、御了知くださいますようお願いいたします。
 8ページ目、お願いします。本会議での論点の全体像ということで提示をしてございます。先行する他の公的データベースの議論を参考に表でまとめたものです。左側には第三者提供の流れといたしまして、研究者からの申請、審査、匿名加工、データ提供等の項目を列挙しております。右側にはこれらに附随する論点をまとめてございます。本日につきましては、一番上の赤枠囲いのところになりますけれども、第三者提供に関する前提といたしまして、提供感染症の候補の考え方、連結データベースの候補、あとは提供項目の選定に関する考え方、これらに関して御議論を賜りたいと考えてございます。
 次、お願いいたします。今後の進め方ですけれども、令和6年4月1日施行を目指しまして、本有識者会議では月に1回程度のペースで3回程度御議論をいただくといったことを考えております。最終的には制度の具体化に向けた御提言をいただきたいと考えております。ただし、議論の進捗によっては、実際の議題であったり、追加の開催については、適宜検討させていただきたいと考えています。その後につきましては、こちらの有識者会議でまとめた提言を感染症部会に報告をし、そして、提言を踏まえて施行に向けた必要な政省令の整備あるいは審査、第三者提供に係るガイドラインを作成していくこととしております。
 続いて、資料2、お願いいたします。先ほど申し上げた論点3つに関して御説明申し上げます。
 論点1ですが、今後提供していく感染症の候補についての考え方について論点を挙げております。下のほう、事務局で提示している方針案でございますけれども、1つ目、本制度の趣旨を踏まえると、新型インフルエンザ等感染症など重大な影響を与えるおそれのある感染症を想定し、具体化を図ってはどうかといった点を挙げております。また、社会的なニーズを踏まえれば、新型コロナウイルス感染症については、当初から提供していくといったことではどうかといった点、さらに、その他の感染症につきましては、本制度の趣旨であったり、あるいは差別・偏見等につながりかねない感染症の特性、社会的なニーズ、また、連結解析に当たっての技術上の実現可能性、提供に当たっての費用対効果などを踏まえて検討を深めていってはどうかといった点を挙げてございます。
 論点2ですが、連結して利用できるデータベースの候補をどう考えるかといった点でございます。方針案でございますけれども、こちらもるる申し上げてございますとおり、本制度の趣旨たる感染症の重症度、ワクチン・治療薬の有効性等に関する分析を目的としていることから、その目的達成に資するデータベースとの連結をしてはどうかといったことを記載してございます。その例といたしましては、レセプト・特定健診等の情報が入るNDB、あるいは今後創設予定でございますけれども、予防接種のデータベース、そういったものが考えられるのではないかといった形で例示をさせていただいてございます。
 論点3ですが、こちらは提供項目を選定する際の考え方、どのような検討の視座があるかといった点でございます。4つの視点をこちらに記載しております。1点目は、重症度、ワクチン・治療薬の有効性等の分析に資する医療に関する情報を提供してはどうかといった点、2点目は、有識者会議でも指摘されておりますが、迅速な提供を可能とするような項目の選定が必要であることといった点でございます。3点目は、感染拡大防止のために保健所では積極的疫学調査を行っておりますけれども、そうした調査に関して、国民の協力・理解が得られるような配慮が必要ではないかといった点、最後でございますが、提供対象となる情報に関しまして、感染状況の迅速把握というサーベイランス目的で収集される情報が主でございます。この場合、実際の入力に当たっては感染状況あるいは医療機関や保健所などの業務逼迫を理由として、結果的にデータ精度がまちまちになっているといった点もございます。こうした観点から、分析に耐え得るデータの質が確保されているといったことも考慮すべきではないかといった点を挙げてございます。
 資料1、2に関しては以上でございます。
○山本座長 ありがとうございました。
 それでは、最後に御議論いただく時間を設けておりますので、議事の「(2)具体的な事例について」に移りたいと思います。
 まず、康永参考人よりHER-SYSとVRSの連結解析及び予防接種情報とレセプト情報との連結の事例について御発表いただきます。その後、私からNDBを含む他のデータベースの制度と運用について御説明をいたします。
 では、康永先生、お願いできますでしょうか。
○康永参考人 よろしくお願いいたします。改めまして、東京大学の康永秀生と申します。
 私からは「自治体における匿名感染症関連情報等を活用した研究」の事例紹介ということで御紹介させていただきます。
 次のスライドをお願いします。本発表なのですが、私が研究開発代表者を務めるAMEDワクチン開発推進事業がございまして、そちらにおける成果を幾つか御紹介させていただきます。主には自治体における匿名感染症情報を活用してワクチンの有効性や安全性を検証したという研究事例となります。
 スライドをお願いいたします。データのソースは、異なる2つの自治体、A市とB市です。具体名はここでは伏せさせていただきますけれども、A市からはVRSですね。ワクチン接種情報とHER-SYS、これは感染者情報ですね。これの連結をいたしました。B市においては新型コロナワクチンを含む各種の予防接種の情報と自治体の国民健康保険、後期高齢者のレセプト情報を連結して分析を行いました。
 スライドをお願いいたします。1番目、VRSとHER-SYSの連結データ分析ということですけれども、A市と東京大学で契約を締結しまして、倫理審査で承認を得た後、実際に連結データを作成しました。その際の連結の方法なのですけれども、個人情報ですね。氏名(漢字、仮名)、生年月日と性別を用いてハッシュIDを作成しました。そのハッシュIDを連結キーとしてVRSとHER-SYSを連結するということをやっております。連結できた人数は25万人余りですね。両方に情報があった、HER-SYSは実際にコロナに感染しないと情報が上がってきませんので、コロナに感染した人とVRS、ワクチンを接種した人を連結できたのは1万人余りということでありました。
 スライドをお願いいたします。実際にVRSですね。ワクチン接種記録システムに入っている情報というのは、個々の方の性別、年齢、いつワクチンを接種したか、2回、3回と接種するわけですから、それぞれの日付、そして、どのワクチンを接種したか、トータルの回数などの情報が含まれております。
 HER-SYSに関しては、これは感染者等情報把握・管理支援システムということで、まず発生届の情報、診断年月日であるとか、死亡年月日であるとか、問診関連情報、それから、重症度、基礎疾患の有無、入院情報などの項目がございます。ただ、先生方、お聞き及びかと思いますが、HER-SYSの入力が必ずしも十分になされていないという背景がございます。
 次のスライドをお願いいたします。実際にA市においてHER-SYSの入力状況、これは全国的にそうであるということではなくて、当該市においてこういう状況だったということで、一般化はできないのですけれども、診断年月日や入院年月日は正確に記入されております。それから、死亡年月日も記入されていて、研究に利用可能です。もちろん入院年月日や死亡年月日のデータの正確性、妥当性までは検証し切れていないのですけれども、研究には利用可能であるということですね。一方で、症状や重症度というのは、そもそもデータの入力の仕方でいつの症状なのか、いつの重症度なのかという時点が分かりませんので、これは研究という意味では利用可能性が低かったということですね。基礎疾患に関しては、それぞれの基礎疾患についてあまり入力されておりませんで、これは分析に耐える状況ではなかったです。喫煙も項目はあるのですけれども、ほぼゼロが入力されていまして、これも利用できないということですね。ICU入室やECMOなども、こちらは入力がないからといって実際に利用していなかったかと断定もできないので、この情報が利用できないということで、HER-SYSに関しては診断年月日や入院年月日や死亡年月日、この重要な情報が入手できたという点が非常に大きかったと思いますけれども、ほかの情報は入力状況があまり芳しくなかったので、利用はしていない状況であります。
 次、お願いいたします。HER-SYS情報とVRS情報を連結することによって一体何が分かるかということなのですけれども、この2掛ける2の表が描けるわけなのですね。未公開なので少しアスタリスクにしておりますけれども、この横軸ですね。これがVRSから引っ張ってきた1回接種とか2回接種とかの情報、横軸というか、行の情報ですね。列の情報、この人数とか、感染者数とか、入院患者数というのは、HER-SYSから引っ張ってきた情報です。これでクロステーブルが描けるということなのですけれども、結局個々の情報だけ、個々のデータベースだけだと接種回数だけが分かるとか、入院患者数だけが分かるというところなのですけれども、こういうクロスにすることによって、未接種、1回接種、2回接種、それぞれの人の感染者数や入院患者数等々が把握できるということになります。
 次のスライドをお願いします。集計結果をざっくりまとめたものなのですけれども、接種の状況であるとか、接種者の年齢の傾向であるとか、あるいは第5波とか、第6波とか、それぞれの時期によっても分かるわけですね。接種回数によらず第5波までは感染割合が非常に低かったのですけれども、第6波になると接種も大分広がってきて、接種回数が多いほど感染割合が低くなる傾向も明確に捉えることができました。
 次のスライドをお願いします。論文発表は、オミクロン株に対して1回、2回接種して、3回目の追加接種でどのワクチンを選択すればより効果が高くなるかを検証した論文が「Clinical Infectious Diseases」に掲載されました。
 次のスライドをお願いいたします。次に、予防接種の情報とレセプト情報の連結データベースについてお話をいたします。
 スライドをお願いします。こちらはB市のデータなのですけれども、予防接種の情報とレセプトの情報を連結しました。予防接種に関しては新型コロナワクチンだけではなくて、右下に接種コードのワクチン一覧があるのですけれども、それら全てについて自治体内に接種の情報が残っております。それをレセプトの情報とくっつけるわけですけれども、A市でやったのと同様の方法でハッシュIDを作成しました。そのハッシュIDで2つのデータベースを連結するわけですけれども、この「個人紐付け用番号」と称しておりますけれども、これはハッシュIDのことです。左下にあります宛名情報というのは、これはいわゆる被保険者台帳なのですけれども、ここで死亡情報なども捉えることができます。レセプトに関しては、実際に行われた治療であったりとか、薬剤であったりとか、処置や手術といった非常に詳細な情報をレセプト情報から得ることができます。
 スライドをお願いいたします。これは研究論文で「Vaccine」というジャーナルに掲載されたのですけれども、COVID-19のワクチン接種後に重篤な有害事象とか死亡がどれぐらい発生しているか、これはワクチンを接種していない人と比較した、コントロール群と比較した研究でありますね。対象18万人ぐらいで、結論を述べますと、おおむね安全である、接種によって重篤な有害事象と死亡の有意なリスク上昇は認められなかったという結果が得られました。
 次のスライドをお願いいたします。コロナワクチンに関しては、眼外傷が症例報告ではあるということなのですけれども、こちらもデータベースを使って検証したところ、ワクチン接種群と非接種群の間で眼の有害事象の有意な差は認められなかったという結果が得られました。コロナワクチン以外も、肺炎球菌のワクチンであるとか、インフルエンザのワクチン、特に高齢者のインフルエンザワクチンの接種についてなどの研究も、2つのデータベースをリンクすることによって可能になりました。
 次のスライドをお願いいたします。こちら、最後のスライドです。まとめなのですけれども、A市のVRSとHER-SYSのデータを個人単位で連結いたしました。ワクチンの接種回数や種類別の感染や転帰の状況を明らかにすることができました。B市においては予防接種情報とレセプトデータを個人単位で連結して、予防接種の有効性や安全性の評価が可能となりました。当然、これはレセプト単独ですと予防接種の情報がないので、例えばNDBだけでこういう研究ができるかというと、それはできないわけですね。ですから、ここにアンダーラインを付しているとおり、個々のデータベースを単独で分析してもなかなか得られる情報は少なくて、データベースを連結することによって、得られる情報は飛躍的に増加すると考えます。ただ、今回お話ししたのは、あくまでも1つの自治体のデータです。ですから、一般化可能性、日本全体に一般化できるかというと、それは非常に難しい。特にコロナに関しては都市部で非常に発生数が多いことは明らかですので、これは実は都市部ではなくて地方のデータなのですけれども、一般化可能性に欠けるところがございます。ということで、全国レベルの統合データベースが構築されて、広く利活用されることが重要であると考えます。
 発表は以上でございます。ありがとうございます。
○山本座長 ありがとうございました。
 引き続いて、私の御報告を発表させていただきたいと思います。最初に自己紹介で申し上げましたように、いろいろな公的データベースを世話してきた関係で、その経験を少しお話ししたいと思います。
 スライド、次をお願いします。レセプト、NDBですね。御存じかもしれませんけれども、NDBはこういう構造になっていまして、レセプト情報は医療機関から審査支払機関に行って、そこから出口のところで1回個人を識別する情報に関してハッシュ化されています。それから、厚生労働省が運用しているNDBのサーバーに入るときにもう一度ハッシュ化されると。どちらからも戻れないという状態で、個人識別情報が利用されない形になってきております。特定健診は特定健診事業者から代行機関あるいは保険者を通って、社会保険支払基金に入ってくるのですけれども、この入ってくるところで一旦ハッシュ化されていて、厚生労働省が運用している特定健診等情報サーバーに入るところでもう一度ハッシュ化すると。したがって、どちらのステークホルダーも戻れないということで運用されているデータベースであります。
 次のスライドをお願いします。NDB、DPCデータの提供の経緯ですけれども、検討を始めたのは2010年10月からなのですけれども、有識者会議を開催しまして、いろいろなデータベースの提供のためのガイドラインを第5回までで確定をして、その第5回以降、このデータ提供を始めたというところであります。その後、サンプリングデータセットという比較的安全なデータセットをつくってみたり、オンサイトセンターの整備を提言したりとか、22回目からはDPCデータも同じ有識者会議で提供を検討するのだということで加えています。25回目には民間の拡大というのも検討を始めています。
 ただ、御承知のように、2020年10月までは法的な裏づけがなくてこのデータを第三者提供してきたわけですけれども、高齢者の医療の確保に関する法律あるいは介護保険法等の改正が行われて、それぞれの法律の中でこのデータの第三者提供がきちんと定義をされ、罰則も定められたということで、それ以降は法律に基づく提供に切り替えています。ガイドラインは多少変わりましたけれども、大きな変更はなく運用されているのが現状であります。
 それから、介護情報とNDBは2021年の10月以降、突合して提供する、連結して提供するということが始まっておりまして、連結する場合は、今のところですけれども、現状、NDBの有識者会議、それから、介護情報のデータベースの提供の有識者会議両方の有識者会議でそれぞれ検討する、別々に開くのも非常に手間ですので、合同専門委員会を開催して、両方の委員会で提供の可否を検討することになっています。これは2つですからこれでいいのですけれども、これがどんどん増えてくると、このやり方でやっていくと本当に合同専門委員会ばかりつくらなくてはいけないことになるというので、若干考えていかなければならないところだろうと思います。
 次のスライドをお願いします。ガイドラインは、現状のガイドラインですけれども、利用者の限定はもともとは国、都道府県、研究開発独立行政法人、医師会等、あるいは国の研究助成金を受けている者に限定をしておりました。高確法の改正とほぼ同時にこの対象を緩めまして、私益を目的とせず公益性が確認できれば主体は問わないことになっています。ですから、最近は約30%が民間事業者からの提供申請になっています。
 では、公益性はどう確認するのかがいつも問題になるわけですけれども、何とか専門会議で検討してやっているところでございます。
 条件としては、必要最小限度のデータ要求、つまり、調査あるいは研究に必要なデータだけを要求していることになります。ただ、このために提供に時間がかかっている、つまり、データベースを抽出して提供しなくてはならないので、データ数が多いこともあるのですけれども、その手続に時間がかかって提供が遅れていることもあります。したがって、今、検討されているのは、一定の安全性を確保した全データセットを提供して、利用時にきちんとした誓約を求めまして、それ以外のデータは使わないということをお約束いただいた上で提供することが、NDBではまだ検討中ですけれども、介護情報データベースは既にこれの試行が始まっております。後でもまたお話が出ていますけれども、この2つだけではなくて難病、小慢もそうなのですけれども、提供する情報は必要最小限度である場合も、できるだけ研究調査に差し支えないことを大前提にお渡しをしています。
 ただ、これは両方とも法律できちんと規制された提供ですので、何か変なことをされたらきちんとした罰則を科すことができるということで、約束どおり使っていただくことがある程度保証されるわけですけれども、このデータベースを活用した結果の公表データの場合、先ほどの康永先生のお話にあった論文で発表するとか、そういう公表データは公表されますので、その後はコントロール不能になってしまって、公表されたデータを精力的に分析することによって個人の権利侵害に及ぶようなことがあっては困りますので、公表するときのルールをきちんと決めています。NDBの場合はレセプト件数で10以下に限定されるようなデータは公表できない、また原則として、医療機関数で3以下に限定されるようなデータは公表できないとしています。ただ、あくまでもこれは公益性との兼ね合いになりますので、それから、実際に権利侵害につながるかどうかは個々の項目によって変わってきますので、これをどうしても下回るようなデータで、なおかつ、公益性が高く、安全性が一応保障される場合は、個別に審査した上で公表をお認めするようなことにもなっています。
 それから、安全管理基準がかなり厳しいということがよく提供者、研究者の方から御不満が出ているところでありますけれども、これは最初の提供するときはできるだけ研究調査に差し支えないようにお渡しをしているのですが、これは利用の仕方を法制度によって制約できるからなのですけれども、一方で、これを利用者にお渡しした後、仮に盗まれるとか、どこかに忘れてくるとか、そういったことになりますと、第三者の手に渡ってしまうと制度で縛ることが難しくなります。そういったことが起こらないというのは、つまり、情報の安全管理になりますので、この安全管理に関してはかなり厳しく求めているところであります。
 その次のスライドをお願いします。これはデータ提供件数ですけれども、今、レセプトデータが、これは23年の5月末ですけれども、250億件なのですけれども、この1件というのは1レセプトですから、実はレセプトというのは非常に複雑な構造をしていて、1レセプトの中に10個近いレコードが存在して、そのレコードごとにCSVファイルになっているという非常に複雑な構造で、なおかつ、ボリュームが非常に多くて、多いレコード数、症例数が必要な請求をしていただくと、お渡しはできても渡された研究者が扱い切れないこともしばしば起こってきております。
 その次のスライドをお願いします。これは提供の数なのですけれども、現状400以上提供はされていて、その提供の割合ですけれども、右側のグラフにありますように、2020年9月までというのは、これは基本的には民間事業者には提供していなかったときですけれども、下の円グラフが2020年12月審査分からで、これは民間事業者も申請できるようになったということで、3分の1程度が民間事業者になっているところであります。
 次のスライドをお願いします。現状をまとめたものでありまして、今、お話ししたのは特別抽出データといって、要求に応じてデータ項目数を限定して、その項目だけを抽出したデータセットをつくってお渡しをしている。
 2つ目にあるサンプリングデータセットというのは、これは安全性を高めた出来合いのデータベースでありまして、外来を1%、入院を10%にサンプリングをします。1年の4か月分、1月、4月、8月、10月のデータを、調剤データに関しては医科、薬科の連結がございますので翌月分が含まれていますけれども、サンプリングをして、なおかつ、出現頻度が0.1%の医科の病名、医療行為は、その病名や行為をダミーに置き換えています。出現頻度0.1%の病名をダミーに置き換えるとどれくらいの病名がダミーに置き換わるかというと、今、病名マスター、レセプト用の病名のマスターファイルですけれども、その中のおよそ95%の病名がなくなってしまうと。つまり、5%の病名が99.9%のレセプトに振られていることになります。医療行為も大体それぐらいの割合になっています。
 次は、トライアルデータセット、これはデータセットを使うための練習用のデータセットですけれども、これはまだできていません。準備中で、サンプリングデータセットをさらに安全性を高めたものになります。
 サンプルデータセットというのは、これは誰でもダウンロードできる形で、レセプトデータというのはこういう構造をしているのだよというサンプルデータになります。先ほど安全管理が非常に厳しいと申し上げましたけれども、これはデータを媒体等で提供してお渡しをする場合の話でして、一つはオンサイトリサーチセンターというものを日本に3か所設けております。これは研究者に来ていただいて、そのセンター内でデータを分析していただく、その研究施設からデータを持ち出すことができないという環境で、持ち出す場合は改めて持ち出し申請をしていただくことになります。この場合は少なくとも物理的な安全性は完全に保たれておりますし、データも持ち出せないということで、相当程度安全な状態だということで、研究者、申請者に対する安全管理の要求はほとんどないことになります。
 もう一つは、準備中で試行中ですけれども、クラウドを活用した研究システムでありまして、この場合はオンサイトセンターのようにある場所に来ていただくというわけではなくて、自分の研究室で研究はできるのですけれども、研究の環境は完全にクラウド上にあって、研究室内は本当に端末を見ているだけという状況になります。こちらも特別抽出のデータを提供することに比べると、安全管理が非常に楽になるということになります。
 少し性質が違いますけれども、2016年からはオープンデータも公表しておりまして、これは集計表データですけれども、自由にダウンロードできるということで、これを使った論文も結構出てきているようであります。現在これら全てのところで提供に対して400以上の学術論文が既に発表されています。10年で400ですから、それほど多いわけではないのですけれども、一応成果は出ている現状であります。
 その次のスライドをお願いします。これはMID-NETで、少し性質が違うデータベースで、これはデータセンターにデータが集まってきているわけではなくて、データはそれぞれの各医療機関に存在をすると。この医療機関に存在するデータをコモンデータモデルと呼んでいますけれども、共通のデータモデルに変換した状態で利用できるように各医療機関内に分析用のデータベースをつくっています。この分析用データベースに対して、利用者は共通の処理言語、クエリ言語あるいはスタティック言語を投げると、それがそれぞれの医療機関で処理されて、その結果だけが返ってくるというのが本来の使い方なのですけれども、それの亜型として、中間生成物、中間抽出物だけをPMDAのデータセンターに集めて、多施設研究施設と呼んでいますけれども、そこへ集めてきて、それを分析することもあります。そのどちらかの方法で利用しているデータベースで、これはNDBのようなレセプト情報だけではなくて、電子カルテに入っている多くの客観的な情報のほぼ全ての情報が利用可能になっています。
 このデータベースはPMDAと厚生労働省の医薬・生活衛生局が運用していて、主にお薬の副作用の早期検出を目的につくられたものです。そのために非常に感度の高い検査結果等が必要になるということで、それぞれの医療機関でデータのバリデーションを相当お金と時間を充ててやっています。したがって、かなり正確なデータが出てくるというデータベースです。一方で、それだけの手間をかけることができる医療機関の数をそれほど増やすことができないということで、当初は23の比較的大規模な病院のデータが利用できました。最近これに国立病院機構のデータが少し加わってきて、施設数としては増えてきております。
 次のスライドをお願いします。MID-NETは申請をして同じような形で有識者会議による審査が行われて、オンサイトセンターを利用していただいて、利活用を終了するというのが典型的なことになります。オンサイトセンターをリモートデスクトップで、つまり、自施設から利用できる環境も今は用意されております。それ以外に、最近はあらかじめプリセットされたシグナル検出というプログラムも動いていて、オートマチックにずっと特定の新薬に関しては副作用のモニタリングをするような仕組みもできております。
 次のスライドをお願いします。これは事前審査なのですけれども、当然ながら目的が公益的であると。ある製薬会社が他社の製品と比べて自分たちのマーケティングに使うというようなことには使えないことになっています。それ以外はNDBとそれほど変わるものではありません。公表内容も同じように公表の審査が行われることになっています。
 次のスライドをお願いします。これまでお話ししたように、NDBは高齢者の医療の確保に関する法律、それから、介護総合データベースは介護保険法という法律にのっとって、法律に基づく利活用になりますので、個人情報保護法が直接関係するわけではないのですけれども、このスライドは個人情報保護法制度の変遷でございます。個人情報保護法制も本来本人の権利を侵害することなく、個人情報の利活用を推進することが目的ですので、整備を進めて、法律に基づかないデータベースであっても利活用が推進できないかということで検討が進められています。一番上にある次世代医療基盤法、緑のところですね。次世代医療基盤法が2018年にできて、現在3認定事業者が活動している最中でございます。
 次のスライドをお願いします。この2017年の改正で、要配慮個人情報、我々がターゲットにしている医療情報ですけれども、これの大部分が要配慮情報に指定をされた。当然ながら、医療情報というのはプライバシーに機微な情報であることは論をまたないところでありますけれども、個人情報保護法上の要配慮情報は個人情報保護法によって扱いが規定されています。その中でオプトアウトによる第三者提供が禁止されているのですが、これが研究利用に関してはかなり制約が強いことになります。いろいろな研究で取得されているのですけれども、オプトアウトというのは嫌な人は手を挙げてくださいという方式ですけれども、あまり多くの人が手を挙げない。それから、オプトイン、いいという人は手を挙げてくださいという法律ですと、あまり多くの人が手を挙げない。どちらもあまり多くの人が手を挙げない。それが2対8ぐらいだと言われています。そうすると、オプトインだと2割のデータが使える、オプトアウトだと8割のデータが使える。もちろんどちらにせよ個人の権利侵害があったら問題外ですけれども、それがないという前提であっても、データのサイズがオプトインだと2割、オプトアウトだと8割と。2割だと代表性にかなり問題があるということで、医学研究に多少問題が生じることが、この17年の改正の議論の最中、私もその改正の委員だったのですけれども、議論がされておりました。
 その次のスライドをお願いします。次世代医療基盤法がこの17年の改正が行われると同時に検討されていたわけですけれども、これは認定事業者を国が認定して、この認定事業者に対して提供する場合に限り、個人情報保護法のオプトアウトよりも若干条件の厳しい通知によるオプトアウトでデータを提供することができます。実際に通知によるオプトアウトでどれくらいオプトアウトされるかをやった研究がございますけれども、医療機関でオプトアウトを取った場合に、オプトアウト率が0.5%ぐらい。したがって、診療情報の99.5%の情報が普通は利用できるということが実測のデータとして出てきています。
 ただ、利用するのは、この認定匿名加工医療情報作成事業者への提供の場合だけで、この認定匿名加工医療情報作成事業者が何をするかといいますと、そのデータを利用したいという利用申請者、これの利用目的が広い意味で公益性があることを確認する、なおかつ、この医療情報を確実に御本人に迷惑がかからないように匿名加工をする、それから、この情報を完全に管理をするという3つの機能を持った事業者が認定事業者になるわけですけれども、この認定事業者が提供先の利用目的の公益性を確認して安全なデータにして提供しています。
 さらに、個人情報保護法は匿名加工して渡したら、提供元にはもう何の責任もなくなるわけですけれども、次世代医療基盤法は認定事業者が利活用者に渡してからも利活用者を監督しなければならないことになっています。提供したデータが正しく扱われて、なおかつ、利用が終了したら間違いなく消去されていることを確認する必要がございます。
 今年、この法律が改正されました。幾つかの改正点がありますけれども、大きな改正点としては、匿名加工医療情報だけではなくて、仮名加工医療情報の取扱いが追加されております。仮名加工医療情報の取扱事業者、認定事業者は別に認定を受けるわけですけれども、その認定を受けた事業者は、匿名加工ではなくて仮名加工医療情報も扱うことができることになります。ただ、この仮名加工医療情報は個情法でいう仮名加工情報とは少し違いまして、仮名加工の仕方自体は基本的には同じなのですけれども、仮名加工ですから元データに戻ることができるわけですけれども、この戻ることができるのは認定事業者だけで、なおかつ、この認定事業者に戻ることを指示できるのはPMDAだけ、つまり、一般の研究では元の個人情報に戻るという使い方はできないことになっております。
 次のスライドをお願いします。これが次世代医療基盤法と普通の個人情報保護法の違いですけれども、匿名加工の医療情報基準というのは、個情法での匿名加工情報基準に比べると若干厳しくなって、なおかつ、提供してからも監督しなければならないことになっています。
 次のスライドをお願いします。これは実際に次世代医療基盤法でやっているある事業者の匿名加工のつくり方ですけれども、最初にデータベースの特性を評価して、リスクを評価して、それから、匿名加工処理をして、それをさらにリスク評価して、リスクが残存する場合はこのサイクルを繰り返して、リスクが十分小さくなった場合に提供して、フォローアップするということになっています。匿名加工の方法自体は、こういう個情法の匿名加工の方法とそれほど大きな違いがあるわけではありませんけれども、きちんとリスク評価をして、なおかつ、最後に提供してからもフォローアップするというところが違っております。
 次のスライドをお願いします。次世代医療基盤法の匿名加工の方法で、医療情報に特化しているのでこういう分類がしやすいわけですけれども、情報を5つの類型に分類をして、それぞれに対してどういう加工をするかが定義されております。
 次のスライドをお願いします。次世代医療基盤法の匿名加工のガイドラインというものがございまして、画像情報あるいは遺伝子情報の匿名加工もガイドライン上記載はあります。ただ、現状、どの認定事業者も利用していない状況でありまして、これは個人情報保護委員会からリスクの確認ができないので少し待ってほしいということが言われているそうであります。いろいろ議論があるところでありますが、本論とは外れますので、飛ばします。
 次のスライドをお願いします。ゲノム情報ですね。これは次世代医療基盤法のガイドラインの記載でありますけれども、記載がありますけれども、今のところ、使われていないところでございます。
 次のスライドをお願いします。これまでお話をした主な公的データベース、次世代医療基盤法は民間データベースになりますけれども、全国がん登録、NDB、DPC、介護総合、MID-NET、難病、小慢等がございます。ここに感染症データベースが入ってくるわけですし、これ以外に予防接種データベースもこれから整備されることになろうかと思います。それぞれ多少違いがあって、まず、提供に関して制度がきちんと決められているのは、逆に言うと、難病や小児慢性疾患データベースは提供がきちんと法律で決められているわけではない。したがって、これは個人情報保護法にのっとった提供になりまして、一応同意を取っています。同意を取っているのは、データ収集時に包括的な同意を取っているということになります。それ以外のデータベースは法令で決められていますし、この後、皆様方に御議論いただく感染症データベースも感染症法の中にきちんと定義をされていることになるかと思います。
 用意したスライドは以上なのですけれども、これからの議論のたたき台に私から私案を提示させていただきます。感染症データベースは公益性が高い利活用が期待できるデータベースですし、極めてスピーディーに分析しなければいけないデータベースなのですけれども、感染症によってはかなりプライバシーに機微な情報に直接触れるようなことがあって、個人の権利侵害につながる可能性も高い。そういう意味で慎重に検討しなければいけないということは当然だろうと思います。
 これは感染症法に基づく提供ですので、提供先への規制はできるということになります。一方で、利用の結果として公表される情報はコントロールできない。これはどんなデータベースでもそうですけれども、公表してしまうと、もうコントロール不能になります。したがって、この感染症データベースでも、提供ルールと公表ルールは峻別して議論を進めるべきではないかと個人的には考えております。
 提供ルールは結果の導出を可能な限り制限しない方向性が重要であると。ただ、提供先から漏えいすることは前提にはできません。漏えいすることを前提にすると安全なデータしか渡せないことになりますので、データの安全管理というのは、まず、研究者の安全管理を審査するか、あるいは安全な利用方法を検討するかということになろうかと思いますけれども、これは検討する必要があります。
 公表ルール、これも公益性との兼ね合い、特に感染症の場合は公益性との兼ね合いが起こることが多いと思いますけれども、患者の権利侵害がないことに十分配慮していないと、例えば積極的疫学調査への協力が得られなくなるというような本来の感染症行政に大きな影響を与えかねないということでありますので、ここは十分配慮すべきではないかと思っております。
 これはあくまでも私の考えでして、これからの議論の際に少し参考にしていただければと思います。
 私の発表は以上です。どうもありがとうございました。
 それでは、議事の「(3)その他」として意見交換に移りたいと思います。
 意見交換においては、まず各構成員から事務局が提示をいたしました論点等を踏まえつつ、事例発表に関する御質問等がございましたらよろしくお願いをいたします。御質問のある方は挙手ボタンを押してお願いできればと思います。よろしくお願いいたします。いかがでしょうか。
 日置先生、どうぞ。
○日置構成員 ありがとうございます。
 康永先生、山本座長、ありがとうございました。康永先生にまずお伺いさせていただきたいのが、今回の研究の際のデータの加工のところで、ハッシュ値を用いたIDというものが、利用者側でデータを連結して、そこから必要なデータ、これをクリーニングしたりとか、あるいはこのデータは内容が正しいとを考えていいのかとか、排斥したりしながら使われていく、使えるデータにしていって活用する形だったと思うのですが、今回の感染症データベースのほうは、ある程度データベースを保有している側で加工が先に入る設定にならざるを得ないのかと考えております。このときに、山本座長のお話にあったようなサンプルデータですとか、安全性を確保して一定のデータを出来合いのものをつくってお渡しするとか、あるいは加工するというところで、制度運用上、利用できるようなデータが出てくるように制度設計するための御意見などをいただければと思います。
 山本座長にも1点ございまして、必要最小限のデータ要求であることというところで、介護データベースでは一定の安全性を確保した全データセットという話があったかと思います。このとき、いずれにしてもどの制度においてもそうなのですが、安全性とおっしゃっているところは、個人特定に至るか至らないかとか、そういったところを目線としてお持ちということでよろしいのでしょうか。これは規則であるとか、そういったところの基準策定にもつながると思いますので、お伺いしつつと思います。
 また、データベースの連結が前提となりますが、これは制度をつくるときに、各データベースがあることを前提に一緒になって基準をつくらなければいけないものなのか、また、合同専門委員会みたいな話もございましたけれども、運用としてスピード感を持って対応できるような座組みは可能なのか、こういったところをお伺いできればと思います。
 以上でございます。
○山本座長 康永先生、最初のほう、いかがでしょうか。
○康永参考人 御質問ありがとうございます。
 私がやったケースでは、単一の自治体と大学とで契約を交わして、そして、倫理委員会に審査してもらった後に、実際に研究班のグループが自治体に赴いて、自治体の実務者と綿密に相談をしながら慎重にやったという形なのですね。データの連結も契約の中でそういう形で、実際には研究者側が連結をやりました。個人情報は全て削除して、ハッシュ化したIDを付与したものを自治体の外に持ち出すということをやったのですけれども、でも、国でやる場合はそれとは全然違うと思うのです。要するに、あくまで法律に基づいて、そして、それぞれのデータからNDBと同様の仕組みでハッシュIDをつくって連結して、そして、どのような公表の形態にするかというのは、先ほど山本先生からお話があったような様々な形があると思うのですけれども、それはまさに今後有識者会議で御検討いただきたいというか、感染症のデータベースの内容に即した提供の方法が重要なのではないかと思います。歯切れが悪くて申し訳ございませんでした。
○日置構成員 ありがとうございます。
○山本座長 私からお答えですけれども、まず、安全性の確認なのですけれども、安全性はあくまでもデータを盗まれない、不当なアクセスを受けないという趣旨であります。個人が識別できるかどうかというのは、実は介護総合データベースもNDBも最初に御説明申し上げたように、そもそも厚生労働省のデータベースに入るときに匿名化されているという解釈なのですね。それが個人情報保護法にいう匿名加工の定義で、少なくとも個人の識別につながるような情報は全てハッシュ化されるというか、1方向に変換して元には戻れないようにしています。それが重要になってくるのは公表ルールの場合で、公表されるデータで個人が特定できる可能性、つまり、他のデータベースと突合したり、いろいろな知識と突合したときに、ある人が特定されるのではないかということを慎重に検討して、公表の許可をしている。許可というと大げさですけれども、公表に問題がないかどうかを確認させていただいているのが現状であります。よろしいでしょうか。
○日置構成員 安全性のところは大変よく理解できました。
○山本座長 結びつけるのは、NDBの場合ももともと発足当時から特定健診とレセプトを結びつけることに対しても相当程度苦労したということで、様々なIDをつくってID0、ID1、ID2、ID3、ID4、今はID5があるのですけれども、ID5というのは個人番号化された被保険者番号を使って作成したIDで、これは確実に個人が突合できる唯一のIDになります。それ以外は氏名と生年月日を使うとか、そういった方法になっていますので、僅かな確率ではありますけれども、違う人が結びついてしまう可能性がある情報になっています。
 実際に感染症データベースと予防接種データベースとを結びつけたときにどうするのかというのは、そもそも被保険者番号が入っているか入っていないかによっても変わってきますし、結びつけることは、私は確実に個人を結びつけることができたほうがいいと思います。結びつけた後で個人の権利侵害が起こらないかというのはまた別に考えたほうがよくて、そうしないと、勝手に結びつけられる可能性は常に存在するわけですね。したがって、そのリスクも踏まえた状態で評価していくほうがいいのではないかと思っております。
 お答えになっていますでしょうか。まだ何かありましたか。
○日置構成員 あとは、合同専門委員会を随時開催という形で、感染症、イスラエルのケースもあったと思うのですが、ある程度早期にデータが出てくることはニーズとしてはあるのだと思いますが、そういったところの任に堪え得るのかを御意見いただければと。
○山本座長 全部合同委員会をつくっていると、迅速性という意味では非常に大きな障害になるのだろうと思います。ただ、一方で、結合したことによるリスクの増大は常に存在しますので、どちらが代表してそれを評価するかをきちんと決めておかないと、つまり責任の範囲を決めておかないと、どちらも責任を取らないというところができてしまうと問題になるだろうと思いますので、そこは今後の検討だろうと思います。
○日置構成員 ありがとうございます。
○山本座長 引き続いて、横野先生、お願いいたします。
○横野構成員 ありがとうございます。
 2点ございます。1点目は資料1に関してなのですけれども、3ページ目等に当初の事情として「臨床情報を組み合わせることで、重症化リスクや、治療効果、ワクチン効果などを分析し対策に活かすことが期待されたが、個人情報保護法制の運用において本人の再同意なくして第三者への情報の提供が認められるケースが必ずしも明らかでなかった(後に改善)」という部分があるのですけれども、この辺りでどういう経緯や議論があったのかを共有していただくと、今後の議論の上で非常に参考になるかと思いますので、事務局にお願いできればと思っております。
 2点目は、先ほどの日置委員の御指摘とも関係するのですけれども、資料3で康永先生から御紹介いただいた例えば1例目のA市のケースではHER-SYSのデータが対象とされているのですけれども、今回の国の制度の中で利活用されるデータの候補に新型コロナウイルスの場合にはHER-SYSのデータがあると思います。このデータが国の制度の中で運用されるようになった場合も、自治体からこのケースで康永先生がされたような形で情報を得て利活用するということは、また別の枠組みとして存続すると考えてよいのでしょうか。その辺りの現状のイメージを確認できればと思います。
○山本座長 ありがとうございます。
 これはどちらかというと両方とも事務局ですか。事務局からお答えできますでしょうか。
○横野構成員 お願いします。
○井上結核感染症課総括調整官 事務局でございます。
 1点目の(後に改善)のお話でございます。こちらは令和2年の4月に個人情報保護委員会の事務局と厚生労働省で、コロナウイルス感染症の特にこれは医療機関間での個人情報の共有の際の扱いに関して、患者の同意が得られた上で、つまり、再同意をなくして、医療機関間ですけれども、情報の提供が可能かどうかに関して明確に通知を出したものでございまして、こちらでも本人の再同意を得る必要はないということを示したといったものでございます。
○山本座長 2点目はいかがでしょうか。予防接種のデータベースを国が整備した場合の手続に変わりがございますでしょうか。
○井上結核感染症課総括調整官 予防接種のほうの話でございますけれども、こちら、まさに予防接種法が改正され、法的な整備はできてございますが、具体の制度設計はまだ先の話でして、その辺りは内部での検討ということでございますので、具体的なことは今の段階だと申し上げられることがないかと承知してございます。
○横野構成員 1点目に関しては、私も令和2年のものに関しては把握をしていたので、それ以外にも何かあるのかと思ったのですけれども、それ以外に特に個情委との関係で何か整理がされたということはないということですかね。
○井上結核感染症課総括調整官 我々もこちらのことを意図してこの文章が入っているかと承知してございます。
○横野構成員 2点目に関しては、HER-SYSのデータは自治体が管理をするデータなのか、国が管理をするデータなのかというそもそものところが十分に理解できていないところがあるのですけれども、康永先生は自治体からこのデータの提供を受けて研究されたということで、国のほうで新たな仕組みの中でこのデータが利活用されるルートができた場合にも、自治体からの提供を得て利活用することも併存するような形になるのでしょうか。
○井上結核感染症課総括調整官 お答え申し上げます。
 感染症の情報収集に関しては法の12条に基づいて、まずは都道府県知事のところに医療機関、医師が発生届を提出するところが起点になって、最寄りの保健所を経由して都道府県に報告されるといった形になっております。ですから、法文上から申し上げれば、まずは医師の発生届の全データは全て都道府県知事が保有していることにはなると考えてございます。
 国に対しては、都道府県知事は発生届の内容に関して報告するといった形になってございまして、ここの内容は全ての情報、同じ情報が保有されることは実は想定されていないというところもございます。ただし、現状、電磁的な入力が、特にHER-SYSにおいては医療機関が直接入力することになってございますので、そちらに関しては共有は国にもされることにはなってございますけれども、まず、法文上の形としては都道府県が保有の主体になっていると理解しています。次年度以降に関しましては、まさにこの感染症DBの事業の用に供するために、それこそ連結キーの振り出しであるとか、そういうところでは活用する必要があるということで、国のほうも活用することになると理解してございます。
○横野構成員 ありがとうございます。了解しました。
○山本座長 引き続いて、鈴木先生、お願いいたします。
○鈴木構成員 ありがとうございます。
 3つ質問があるのですが、まず2つ康永先生にお伺いしたいです。本当にすばらしい研究を御紹介いただきまして、ありがとうございます。テクニカルな話ですけれども、1つ目ですが、氏名等を使ってハッシュ化してリンクをしているということですが、どれぐらいリンクできて、どれぐらいリンクができなかったのかを確認したいというのが1つ目。
 2つ目ですが、発症日や診断日のデータはあるのだけれども、基礎疾患などはデータの入力がなくて使えないといった御指摘がございました。これは実際のところ、法に基づく発生届の項目に絞って入力をするようにということが、2020年の10月頃からそういった方針になったということもあって、確かに発生届の項目はしっかり100%近く入力されているのだけれども、それ以外の背景状況ですとか、アウトカム、要するに、予後等の情報については入力率がまちまちであることを反映しているのかと理解しています。そのようなデータを使って分析をするときに、感染したかどうかをアウトカムとして使う分析は恐らく問題ないのだと思うのですが、それ以外の分析というのは、少なくとも新型コロナのHER-SYSに関しては難しいのではないかと私は感じているのですが、先生御自身は分析されてどうお考えになっているのか、御意見がございましたら教えていただければと思います。まずはその2点、よろしくお願いします。
○康永参考人 鈴木先生、御質問ありがとうございます。
 まさに先生のおっしゃるとおりでございまして、1点目のどれぐらいリンクできるかということについてなのですけれども、1つの自治体からデータを集めたということの限界がまずあります。VRSとHER-SYSをくっつけるときに、VRSは当該A市で予防接種を受けたとしても、実際に感染をしてほかの自治体の病院やクリニックにかかってしまうということがあります。そうなってくると、VRSとHER-SYSのデータはくっつかなくなってしまうのですね。そのような形で、要するに、越境という状態になっているとくっつかないので、それも合わせると恐らく76%ぐらいの合致率だったのですね。ただ、全国データですと、別に越境していてもリンクできるという形でしたら、その問題は恐らく解消されると思います。
 もう一つ、レセプトデータをくっつけるときの問題点としては、私は自治体からデータを提供されたのですけれども、結局自治体のレセプトデータは国民健康保険のデータで、健康保険組合や、要するに、会社で働いている人たちのデータがないわけです。ですから、例えば保険者が移行してしまった、国保から健保に移ってしまった場合はそこで観察が打ち切りになってしまいますし、逆に健保から国保に移ってきた人はその前のデータが得られないとか、それから、1つの自治体なので、転居をされてしまったりとか、あるいは別の自治体から転入されてしまった場合はデータが不完全になってしまうというのがあります。ただ、それでも予防接種の情報とレセプトの情報は、正確な数字ではないのですけれども、9割ぐらいはくっついたのではないかという感覚は持っております。
 2点目です。HER-SYSから重症度のデータが得られないということで、それは疫学的にいえば交絡という状態になるのではないかと。要するに、重症度をきちんと調整しないと適正なアウトカム、結果の評価ができないのではないかというのはまさにそのとおりで、ですから、HER-SYSの情報だけでは、要するに、発症日、入院日の情報だけでは不十分なのですね。その意味でも、レセプトの情報がくっつけば、病名の情報とか、追加の処置とか、治療の情報で得られます。レセプトには発症日の情報がないです。ワクチンを打ったという情報もないです。レセプトはあくまで治療の履歴と病名の情報ですので、ですから、理想をいうと、予防接種をしたという記録と、HER-SYSにおけるいつ発症したかというデータと、レセプトにおけるどんな治療の履歴があるか、あるいは併存症の病名があるかどうかを全部つなげられれば、非常に理想的なデータベースができると考えます。
 以上です。
○鈴木構成員 康永先生、ありがとうございます。
 もう一つだけ質問をよろしいですか。これはどちらかというと康永先生よりも事務局なのですけれども、今日、康永先生に御紹介いただいたB市のほうのケースは、予防接種データベースに相当するものとレセプトをリンクする話なので、直接的に今日の議題の対象ではないのではないかと理解しているのですが、そういった理解でよろしいでしょうか。
○井上結核感染症課総括調整官 鈴木先生のおっしゃるとおり、こちらは匿名感染症関連情報の話でございます。ですから、予防接種とレセプトといったところは直接的には関係性はないのですけれども、今ほど康永先生もおっしゃいましたとおり、レセプトの不完全な情報といったところのワクチンと感染症の発症であるとか、そういうところが補完され合うことによってまた新たな連結解析の意義が出るところをお示しいただくといったことで御報告いただいたと理解してございます。
○鈴木構成員 分かりました。ありがとうございます。
○山本座長 ほかに御質問、いかがでしょうか。
 それでは、田辺先生、お願いいたします。
○田辺構成員 資料2の論点でいただいたところで、対象とする感染症の候補が挙げられておりますけれども、今回の制度の趣旨を考えますと、いただいているように、新型インフルエンザ等感染症、指定感染症、新感染症がターゲットで、現時点で考えますと、今回のコロナを施行時から提供するということで良いのかと私は思いました。
 そこで、論点2で2つのデータベースの突合ということになるわけですけれども、康永先生のお話も聞いていて、なかなか1つのデータベースだけでは十分な結果が得られないので、2つのデータベースをつなげることを想定することになります。ここで山本先生に御質問なのですけれども、NDBを考えたときにも2回ハッシュ化、ID化されているということで、今回のHER-SYSを例えば突合しようと思ったときは、NDBと同じようなハッシュ化を2回することで、申請した研究者はその2つのハッシュIDは一緒という前提でやるのか、あるいは国のレベルで先につなげていただいたものをいただけるのかとか、その辺りの技術的なところが分からなかったので、教えていただければと思います。
○山本座長 私からお答えしますけれども、NDBのハッシュというのは、あれは保険者番号と生年月日と氏名と、氏名等は初めから除いてあるのですけれども、生年月日、性別等のハッシュ値で、これは2回ハッシュをかけていますので、なおかつ、そのハッシュのシードは秘密になっていますので、同じものをつくることは基本的にはできないと思っています。
 今、連結用のIDとしては、ID5というものがレセプトには格納されて、これは個人番号化された被保険者番号のIDで、被保険者番号を1回ハッシュしているだけでNDBに格納しているのですね。したがって、ハッシュの方法等はNDBに聞いていただければ同じハッシュをつくることは可能ですので、突合する側の情報、感染症データベースであれば、それの被保険者番号があれば確実に個人を結びつける方法ができると思います。
 それ以外ですと、例えば漢字氏名と生年月日でのハッシュを取る、あるいは片仮名氏名と生年月日のハッシュを取る。仮名氏名、生年月日、性別のハッシュというのはID4と呼んでいて、介護情報データベースとNDBと突合するのはこれが主流なのですけれども、というか、介護のほうに被保険者番号が入っていないので、それで突合するしかないわけですけれども、感染症データベースにもそのような情報があれば、それは突合が可能です。ただ、実際に今の状態でそれがあるかないかはよく存じ上げないので、そういうことを想定したデータの項目の選定は必要になってくるのだろうと思います。意外と突合は難しいとお考えいただいたほうがいいと思います。
○田辺構成員 ありがとうございます。
○山本座長 ほか、いかがでしょうか。よろしゅうございますか。
 次に、今後の進め方と論点、今、少し論点についてもお話をいただきましたけれども、議論を進めていきたいと思いますけれども、初めに、本日御欠席の今村構成員から御意見をいただいておりますので、事務局から代読をお願いいたします。
○井上結核感染症課総括調整官 今村先生から事前に御意見を頂戴してございますので、御報告を申し上げます。論点2と論点3に関しての御意見でございます。
 まず、論点2ですけれども、資料でNDB、予防接種DBを例示として挙げているが、新型コロナでは高齢者ほど重症者が多かったこと、コロナ後には後遺症含め介護が必要となる患者が多く出たことから、コロナ後の時系列変化を見るためにも介護DBも例示としてよいのではないかといった御意見でございます。
 論点3でございます。こちら、先ほど山本先生からも御指摘があった点と同様かと理解しておりますけれども、迅速提供のための実務上の重要なポイントといたしまして、NDB・介護DBは提供までに1年近くの時間を要するが、これは審査に時間がかかるだけでなく、元データから提供データの切り出しに膨大な手間・時間がかかっていることが挙げられるといった点でございます。このため、今村先生からは「元データから研究者への提供データの切り出し」が複雑にならないように特段の注意が必要であるとの御意見を頂戴いたしました。これに対しての案でございます。今村先生からは、提供データをある程度パッケージ化して用意しておき、研究者側で申請項目以外のデータは使わせないといった運用も考えられるのではないかといった御意見を併せて頂戴したところでございます。
 以上、御報告となります。
○山本座長 ありがとうございます。
 それでは、初回ですので、それぞれの先生方からこの論点に関して御意見をいただければと思います。
 最初に、大曲先生から御意見をいただけますでしょうか。
○大曲構成員 ありがとうございます。
 論点は3つありますが、1点目に関しては、現状では私も違和感なく受け止めております。これが公に説明するときも妥当なのかと思って見ています。細かいところはまた出てき次第挙げたいと思います。
 2点目ですけれども、データベースの候補というところなのですが、これは自分の頭の中がまだ整理し切れていない中で、現状ですので、申し上げると、例えば我々は厚労省の事業をやっています。その中には、物によっては医療機関から直接データをいただいているようなものがあります。検査室のデータだったりとか、あるいはレセプト情報、特にDPCからの情報、多くは加工されていますけれども、そういったもの、あるいは診療所のいわゆるレセコンから得られたファイルを加工した情報も入っています。そういうものは事業の性質上、帰属は僕は国になっていると理解しておりますけれども、そうしたものの扱いに関しても整理が必要ではないかという問題意識を持っています。もちろん突合ができるのかとか、技術的な問題は多々残ってはおるのですが、一方で、例えばAMRの薬剤耐性のアクションプラン等々に書かれていることでもありますけれども、これらを個人情報でどう結びつけていくのか。それによって分かることはたくさんあるわけでして、負荷を見ていくとか、そういうことを出していくことを考えれば、検討といいますか、それらも候補には入るのかという問題意識は持っています。ただ、技術的にそれが可能かどうか等に関しては、今日は準備不足でそこまでは自分の頭はまとまっておりません。
 3点目、提供する項目に関しては、たたき台に書かれたとおりであろうと思っています。ただ、これまでのコロナでの対応の経験という中では、ここに書かれているとおりで、患者さんの状態と予後ですね。予後を見ていくにも、結論としては、必要とされた医療の内容ですね。医療リソースをどれぐらいつぎ込んだかということが予後なりあるいは患者さんの状態を見ていく上での代替的な指標になることもよく分かりましたので、既にここに書かれていることではありますが、それらを中心に集めていくことになるのだろうと思います。また、それに関係しないような情報は、患者さん個人の保護という観点からも、開示には慎重であるべきではなかろうかというのが現状での意見であります。
 以上です。
○山本座長 ありがとうございます。
 次に、鈴木先生からお願いできますでしょうか。
○鈴木構成員 ありがとうございます。
 論点もですが、それに先立って、そもそもこれまでそれこそ今日御紹介いただいたようなNDBのようないわゆる医療系のデータのデータシェアリングあるいは第三者提供に比べれば、公衆衛生あるいは感染症領域のデータの共有が進んでいなかったというのが現状だと思います。ですから、今回の感染症法の改正に伴ってこれが進んでいくことは、非常に喜ばしいことであると考えています。
 その上で、論点についてそれぞれ私の現状の意見ですが、1つ目ですけれども、基本的にまず新型コロナウイルス感染症を対象としていくことに、私も賛成いたします。様々な理由はありますけれども、例えばそのほかの感染症に関しては非常に患者数、症例数が少ないので、第三者提供した場合の個人の特定可能性といった議論があり得ますが、新型コロナウイルス感染症に関しては数も大きいこともありますので、そうしたところはもちろん提供する際には注意しなければいけませんけれども、比較的クリアしやすい対象であること、何より今回感染症情報を第三者提供する意義を国民全体も理解しやすい対象であることが言えると思います。特に今日、康永先生にまさに御紹介いただいたような研究ですね。例えばワクチンの有効性を検証することが当初より望まれていたわけで、なかなかそれが難しかったといったことの反省も踏まえれば、新型コロナウイルス感染症をこれからやるというのは少し時間としては遅いかもしれませんけれども、少なくとも今後に生かすという意味では、まずは対象を新型コロナウイルス感染症にすることは十分正当化できると思います。
 2つ目に関しては、ここに書かれているもの、あるいは先ほど御指摘にあったような介護等も含めていくことについて、私は特にそれ以上追加の意見はございません。
 論点3に関してですが、こちらも感染症ならではの非常に注意すべき項目が多々あると思います。基本的にはここのたたき台に挙がっていることであろうと思いますけれども、例えばタイミングもそうですね。2020年1月あるいは2020年2月前半などといえば、武漢チャーター便で在留者が帰国した頃であるとか、あるいはダイヤモンド・プリンセス号の事例の頃であるとかといったときに陽性者のデータがあった場合に、これはかなり特定可能性は高まるということもありますので、タイミングも注意すべき項目であるのではないかと思っています。
 ひとまず私からは以上です。
○山本座長 ありがとうございました。
 その次、田辺先生、お願いできますでしょうか。
○田辺構成員 論点1につきましては、先ほど述べたとおり、いただいた案でよろしいかと思っております。
 論点2もいただいたとおりでよろしいかと思いますけれども、先ほどの質問とかぶるのですけれども、どのようなデータベースと連結するかというところは事前に想定しておいて、それによってハッシュ化やIDの連結の仕方が違うと思いますので、そこは検討が必要かと感じております。また、審査の在り方も、研究者の立場で申請をしようと考えたときに、2か所に出さなければならないのか、あるいは一括でできるのかというところもあろうかと思うので、連結を想定した場合は、ID連結の仕方と審査の在り方が重要かと感じております。
 論点3につきましても、いただいた案のとおりでよろしいかと感じております。マル2の迅速な提供というところで、いろいろ御意見をいただきましたように、パッケージとして出して研究者のほうで選別するというやり方が現実的かと感じております。また、3番のところが感染症ならではの非常に重要なところかと思います。5波以降、HER-SYSの中でかなり簡素化されたところはよろしいかと思いますけれども、先ほど鈴木先生がおっしゃいましたように、初期の頃だとか、あるいは濃厚接触者の情報が入っているところもHER-SYSの中であろうかと思いますので、それは総論的にはこういう形でよろしいかと思いますが、実際に審査をするときにその項目をよく吟味する必要があるかと感じております。
 以上となります。
○山本座長 ありがとうございます。
 引き続きまして、戸部先生、お願いできますでしょうか。
○戸部構成員 私もこの3つの論点については、このたたき台のとおりでよいと思います。論点1についても、研究上の公益上の必要性あるいはデータの多さ、あるいは国民の受容度の高さといった観点からすると、新型コロナウイルス感染症で差し当たりは始めてみるということでよいと思います。
 論点2のデータベースについても、データベースそれ自体についての知識が私はまだ欠落しておりますので、差し当たりこれでよいかと思います。
 論点3については、この項目、考え方としてはこれでよいと思うのですが、提供項目それ自体を切り出して議論できるのかという疑問は少し湧いてきまして、何を提供できるかということは、その提供の方法や安全管理の方法とも相関してくるような、そういう論点かとも思いました。これは独立で検討できるのかという疑問が思い浮かびました。
 以上です。
○山本座長 ありがとうございます。
 それでは、日置先生、お願いできますか。
○日置構成員 ありがとうございます。
 論点1から3まで、おおむね異存ございません。まずはスモールスタートではないですが、始めてみることも重要かと思いますので、ポイントを絞って対応していくというのでよろしいのではないかと思います。
 一方で、論点3のところのマル2ですね。「一つ一つの内容を確認することなく、迅速な提供が可能なものであること」、これを追求しますと、研究等について必要なデータ項目はそろうのかなど疑問も湧いてくるところではございますので、まず始めるところとその後に拡大していくところを分けて考えるのも一つかと感じております。今後の議論というところではございますけれども、今後のデータベース活用の幅も狭めないような検討を進めていっていただくのがよろしいかと所感として持っております。
 以上でございます。
○山本座長 ありがとうございます。
 それでは、横野先生、お願いいたします。
○横野構成員 事前に確認させていただきたいこととして、過去の経緯に関する御指摘等もありましたけれども、今回の制度の下で提供の対象となる情報は、制度を開始した以降に登録されたデータと考えてよいのでしょうか。
○山本座長 既に蓄積しているデータは含まれますね。
 事務局、いかがでしょうか。
○井上結核感染症課総括調整官 まさに今回対応方針でも事務局から出しておりますとおり、コロナといったものを挙げてございますけれども、つまり、次年度を待たずとも、過去に蓄積されたものに関しても提供は考えているといったことでございます。
○横野構成員 それはどこまで遡及するということについては、特に制限はないのでしょうか。
○井上結核感染症課総括調整官 特段、そのような法令上で縛りがあるようなものではございません。ただし、その他、様々な検討の視座があるかと思いますので、そこのニーズであったりとか、その辺りを捉まえながら、実際に決めていくといったことになるかと考えております。
○横野構成員 分かりました。
 その辺りで、制度が開始された以降に登録されたデータと制度が開始される前に登録されたデータと同じ扱いでいいのかどうかというところは1点気になっているところではあります。ただ、論点1の対象とする感染症の候補については、これまでの経緯や社会的な重要性の高さから考えて、また、過去のデータも使えるということであれば、新型コロナウイルス感染症を出発点にするというのは妥当であろうと思っております。
 論点2に関しては、私のほうで十分具体的なデータベースごとのデータの状況等を把握できていないところもあるので、御提案のとおりでいいかと思っております。
 4番目に関しては、制度開始前、開始後というところをどれだけ考慮する必要があるのかということも一つの視点になるかと思っております。
 それから、この提供の際に、義務として提供せざるを得ないということで個人が提供した情報なのか、あるいは任意で提供された情報なのかをどう考慮するかといった視点も必要かと。必ずしもそれに拘束される必要はないと思うのですけれども、視点としては必要なのではないかと思っております。
 それから、提供項目については、提供を可能とする項目については幅広い視点を持って考えた上で、審査の段階においてそれぞれの利活用の状況や安全管理措置の状況等によって具体的な判断がまた入ってくると思いますので、提供可能な項目についてはある程度広く考えるということと、このような制度で利活用するという前提があることで、今後データ登録の形は恐らく変わってくる部分があるだろうと思いますので、そこを踏まえての見直しも必要になってくるのではないかと思っております。
 また、提供項目をどの範囲にするかということだけではなくて、先ほど山本先生からも御指摘がありましたが、成果が公開される時点でのコントロールというところまで含めて、全体的な枠組みとして考えていくことが重要であろうと思っております。
 以上です。
○山本座長 ありがとうございます。
 論点1に関しては、ほとんどの先生方の御意見が一致して、まずは新型コロナから始めていこうということだろうと思います。症例数が多くてそれなりに安全に提供できることでしょうし、最近であるということからデータも比較的多く集まってきていることもございましょう。もちろん様々な欠落値はございましょうけれども、それがいいということで、大体皆さんの意見は一致しているのだろうと思います。
 論点2に関しましては、ここに書かれているのでほぼいいのだろうというのが多くの方の御意見ですけれども、今村先生から高齢者に多い疾患である、なおかつ、治療後に要介護になる方が結構いらっしゃるということで、介護データベースとの結合も考慮すべきだと。何を研究するかによって変わってくるのですけれども、私もその可能性は排除しないほうがいいのだろうと思います。したがって、まとめとしては、この中に介護データベースを加えても問題ないのかと。
 論点3に関しましては、これはなかなか議論のあるところで、具体的なデータベースを見ながらでないと本当の要件は決めていけないところがあるのだろうと思いますけれども、この対応方針の中のマル2で、あまり手間をかけずに提供できることが大事だということが書かれているのですけれども、これはNDBや介護DBの提供のお手伝いをしていると本当にそのとおりで、今、1年ぐらいかかってしまっているのですね。審査自体は長くても1か月とか2か月で終わっているのですけれども、実際はこのデータベースの構造が複雑であることによって、要望どおりの切り出しができない、やってみたけれども実はこれは要望と違った、やり直すと。やり直すと、今、NDBは1つSQLを投げると1週間返ってこない状況ですので、すぐ数か月たってしまうことになります。介護データベースの場合、そこまで大きなことはないので、もう少し迅速に処理はできると思いますけれども、それでも時間をできるだけかけないほうが望ましいと。
 その対策としては、あまり項目にこだわらずにその項目の選択を研究者に任せる、今の介護データベースのある種の提供の形態の一つなのですけれども、そういったことが考えられます。もう一つは、あらかじめプリセットをつくっておく。つまり、多くの研究者が要求されるであろうデータセットを最初から想定して、それでよければ早く提供できるという形を用意しておくのも一つだろうと思います。ただ、これはやろうと思うとニーズを調査して何をつくればいいのかをかなり検討しないといけないので、そういったことも検討したほうがいいという提言にならざるを得ないとは思います。
 3つ目のポイントで、調査等が引き続き適切に継続できるよう、これはもう感染症法で感染症にかかった患者さんの情報は医療機関等から出てくるわけですから、特段制限はないわけですけれども、積極的疫学調査にどう協力していただけるかというのは、積極的疫学調査に提供したら自分の情報が出てしまったみたいなことになってしまうと、これは協力する方がうんと減ってしまうことにつながりかねないわけですね。そうすると、この患者さんと医療従事者以外に関係するような情報は不可とは言いませんけれども、慎重に検討する必要があるのだろうということが考えられています。
 データの質は、これはリアルワールドデータである以上はある程度データの質にばらつきがあるのは覚悟の上で研究者はやられるので、それほど提供する前に考えることではなくて、提供してから研究者の方に考えていただくこと、我々としては、提供する側としては、データの質に問題がありますよということをちゃんとお伝えすればいいのだろうという気はしていますけれども、私としてはそのように考えています。
 皆さんの意見をお聞きになって、特に追加で御発言のある方、いらっしゃいますでしょうか。
 それから、安全に提供するというのは、データセットを媒体等でお渡しする場合と、例えば今のNDBでやっているデータセンターに来ていただいて、オンサイトセンターに来ていただいて研究するというのでは、大分安全に関する要求が違ってくる。それから、HICと言われているクラウド上で研究する仕組みを提供できるのであれば、これも随分安全管理に関する要求事項は変わってくる。安全であれば安全であるほど、研究者のすることはある程度約束に基づいてやっていただけることを前提にすると、データの提供はかなり迅速にできるようになることになりますから、そこはトレードオフになるのだろうという気がします。
 鈴木先生、どうぞ。
○鈴木構成員 ありがとうございます。
 先ほど山本先生が最後におっしゃったデータの質のことに関して、確かに提供する場合にはもうリアルワールドなので、分析をする際にいろいろ検討してくださいといった形でやるしかないのだろうとは思います。一方で、ずっとこの新型コロナのデータを見てきた者から言いますと、それこそ流行の当初においては非常に子細にデータが集まり入力されていた一方で、次第に症例数が増えてくると現場で入力が追いつかなくなるので、ですから、2020年のそれこそ10月以降は発生届のみに優先順位をつけて入力をしていくことに切り替わっていったり、あるいはさらに流行が長引くに従って、それこそまた入力が追いつかなくなるので、2020年の中盤以降は発生届の対象自体を絞り込んでそれ以外については数のみを入力してもらう、こういったことをずっと3年間繰り返してメンテナンスしながらやってきているので、それを理解しながら分析をしていただかないと、誤った方向に結果が行くのではないかということをどうしても懸念してしまいます。ですから、そういった背景も含めてデータを提供しないといけないということに理屈上はなるのですが、それは現実的に難しいので、データの質も提供する際には提供する側もちゃんとフォローしなければいけないのではないかと思いまして、コメントをいたします。
 以上です。
○山本座長 ありがとうございました。
 非常に重要な点を御指摘いただいて、ありがとうございます。まさにそのとおりでございますね。
 ほか、御意見はございますでしょうか。本日の論点に関しては、このような議論でよろしゅうございますでしょうか。
 それでは、本日の議論はここまでとしたいと思います。今後事務局で整理をしていただいた上で、次回以降の議論につなげていきたいと思います。
 それでは、本日の議論は以上でございます。
 事務局から次回以降の予定について、何かございますでしょうか。
○井上結核感染症課総括調整官 ありがとうございます。
 本日いただきました御議論、また、第2回以降の話に踏み込むような点として、匿名化の在り方や連結データベースの具体的な安全の管理措置、戸部先生からもございました提供項目の話と実は相関するといった話について、一旦事務局で整理をさせていただきまして、次回、御報告をさしあげたいと考えてございます。
 次回の第2回有識者会議の日程でございます。7月下旬を予定しておりますが、詳細については事務局から追って御連絡をいたします。
 構成員の皆様及び康永参考人におかれましては、御多忙のところ御出席賜りまして、ありがとうございました。
 この後に関しましては、事務局側で記者ブリーフィングということで、本日の議事の概要等を説明させていただく予定となっております。
 事務局からは以上でございます。
○山本座長 ありがとうございました。
 それでは、これで第1回の有識者会議を終了といたします。
 康永参考人には、大変参考になるプレゼンテーション、ありがとうございました。
 また、構成員の皆様方には、積極的な御議論をどうもありがとうございました。次回以降もよろしくお願いいたします。
 本日はありがとうございました。