第2回 匿名感染症関連情報の第三者提供に関する有識者会議  議事録

日時

  • 令和5年7月24日(月)16:00~18:00

場所

航空会館ビジネスフォーラム(501号室)

議題

  1. (1)前回の主な御意見を踏まえた論点3の追加論点
  2. (1)本日の論点等について
  3. (3)その他

議事

議事内容
○山本座長 それでは、ただいまから、「第2回匿名感染症関連情報の第三者提供に関する有識者会議」を開催いたします。
 構成員の皆様方におかれましては、御多忙にもかかわらず御出席いただき、誠にありがとうございます。
 進行につきましては、第1回の会議で座長に指名していただきましたので、私が務めさせていただきます。どうぞよろしくお願いいたします。
 まず、事務局の方で異動があったと聞いておりますので、新たに着任されました大坪健康局長より御挨拶をお願いいたします。
○大坪健康局長 山本座長、御紹介ありがとうございます。
 7月4日付で佐原の後任で参りました、健康局長を拝命いたしました大坪でございます。
 私、この会議には、第2回、本日からの参加となりますけれども、どうぞよろしくお願いいたします。
 本日はありがとうございます。
○山本座長 よろしくお願いいたします。
 冒頭のカメラ撮りにつきましては、ここまでとさせていただきます。御協力をお願いいたします。
 なお、これ以降は、写真撮影、ビデオ撮影、録音することはできませんので、御留意ください。
 傍聴される皆様におかれましては、傍聴時の注意事項の遵守をよろしくお願いいたします。
 本日も、WEB会議で開催することとしております。各構成員が個別に発言される場合、まず挙手機能を用いて挙手をしていただくか、チャットで発言される旨のコメントを記載していただき、私が指名いたしますので、その後に御発言をお願いいたします。なお、WEB会議ですのでタイムラグが生じますが、御了承をお願いいたします。
 初めに、本日の出席状況について、鈴木構成員は遅れて参加ということでございます。
 なお、本日の参考人として、全国保健所長会の内田勝彦会長から御意見をいただくことにしておりますので、御了承をよろしくお願いいたします。
 それでは、早速、議題に入ります。初めに、事前に事務局から資料について送付されていますけれども、不備等がございましたら、事務局にお申し出いただくようにお願いいたします。
 よろしゅうございますか。
(首肯する構成員あり)
○山本座長 それでは、早速、議事次第に従って議事を進めてまいりたいと思います。
 最初に、「(1)前回の御意見を踏まえた論点3の追加論点」ということで、まずは、前回発言いただいた主な御意見と論点3について、事務局から説明をお願いいたします。
○井上結核感染症課総括調整官 事務局より説明申し上げます。
 資料1の2ページ目ですが、前回の会議では、3つの論点に関して御議論をいただきました。
 まず論点1ですが、提供感染症の候補については、制度開始当初から、新型コロナウイルス感染症から始めることが妥当ではないかといったことでおおむね合意を得てございます。
 論点2は、連結データベースの候補については、本制度の創設趣旨とも関係する話として、感染症の重症度、ワクチン・治療薬の有効性等に関する分析の達成に資するデータベースとしては、NDBを接種DBに加えて、介護に関しても加えてはどうかといった御意見がございました。
 論点3は、提供項目の選定に関する考え方です。考え方については、下の表の左側に、1、2、3、4の4つの考え方を事務局から提示をさせていただき、おおむね合意を得られたところです。ただし、それぞれについては御意見をいただきまして、1点目、提供項目に関連しますが、本制度については、医療に関する情報、すなわち医師の診断日等でありますが、その提供で十分目的が達せられるのではないかといった御意見がありました。2点目、データの迅速な提供のため、データをセットとして提供することも考えられるのではないか。また、研究者のデータ活用の幅を狭めないように検討していったほうがよいといった御意見がございました。3点目、第三者提供に当たっては、積極的疫学調査への協力の観点から慎重に考える必要があること。そして、4点目として、データの利活用に当たっては、データの質に関する留意事項に配慮すべきことといった御意見がございました。
 これらを踏まえまして、論点3の追加御議論事項としてまとめたものが4ページ目でございます。
 1つ目ですが、まず、テキスト情報が中心となります積極的疫学調査あるいは類似の情報項目については、提供の対象としないということで始めてはどうかといった点に関して、御意見を賜りたく存じます。
 また、提供項目の基本的な考え方、さらに、第1回の会議では、東京大学の康永先生の連結解析の例、そのほか、委員の皆様方からいただいた御意見を踏まえまして、提供項目のイメージといったものを下に掲げてございます。これらに関しまして、制度の開始当初からは、利用申請の内容等を踏まえ、提供時の審査において具体の提供項目を検討してはどうかといった点に関して、御議論をいただきたいと考えてございます。
 資料1については、以上でございます。
○山本座長 ありがとうございました。前回の議論のまとめですので、御意見がありましたら、後で討論の時間に伺いたいと思います。
 それでは、引き続きまして、内田参考人から、関連する御意見をいただきたいと思います。
 内田参考人、よろしくお願いいたします。
○内田参考人 全国保健所長会の会長を務めさせていただいております大分県東部保健所の内田と申します。どうかよろしくお願いいたします。
 では、資料2に基づきまして、御説明をさせていただきます。今日は、私どもの意見を聴いていただくということで、本当にありがとうございます。9つほどポツで意見を書いておりますので、1つ目から順に御説明をさせていただきます。
 この有識者会議で、今日こうやって意見を聴いていただけるということで、非常にありがたいと思っております。今後も、できましたら、私ども情報提供側のユーザーの意見をより多く聞いていただいて、参考としていただければ、大変ありがたいと思っております。
 2点目でございます。情報提供の理解促進と信頼の確保のために、目的ですね。何のために第三者にデータを提供するのか、何のためにそういったことが必要なのか、そういった目的を、この検討会で先生方に明確にしていただけるとありがたいのですが、そういったことで、これを、また、公にしていただきたいと思っております。国民を含むユーザー側と第三者である研究者側でその目的を共有するように、文章で総論的なことは概念的に示せるかもしれませんけれども、公衆衛生の向上に資するように、データ提供側へのデータ分析の還元等も含めて、そういった確保をしていただきたいと思っております。
 3つ目でございます。情報提供はユーザー側への還元を原則としていただいて、データの情報交換が有益なコミュニケーションとして、信頼に基づくものであることを望んでおります。審査基準やガイドライン等に当てはまるから「提供して当然」というような印象を持たれないように、匿名情報でありましても、その先に人とか自治体といったものが存在して、人々の健康と福祉と人権を維持することを尊重して、第三者には慎重にデータを扱っていただきたいと思っております。
 それから、4つ目のポツですが、これは実際コロナのときにアドバイザリーボード等で起こったことですが、第三者に提供されるデータに住所地がございますけれども、市町村単位での提供では人口が少ない地域もあって、個人の特定につながることが危惧される部分が大きくなってまいりますので、特に個人の特定につながらないように御配慮をいただきたいと考えております。
 5つ目のポツですが、発生届につきましては、主治医が入院をさせたいということで、重症度を重めに記載することなどもございました。それから、ワクチン歴や症状及び発症日等が空白であるという、そういった発生届、HER-SYS入力が結構多ございまして、その後の保健所の調査によるHER-SYS情報の修正がかなりの業務量となりました。修正できればいいのですが、業務が逼迫いたしますと修正できなくなります。そういったこともございますので、感染症関連情報の精度につきまして、第三者提供され十分に分析評価可能なデータであるのかどうかというのは御検討いただきたいと思っております。
 それから、6つ目のポツですが、一番下ですが、第三者に提供される感染症情報は、個人情報(氏名・住所・電話番号等)ですが、これを記した発生届そのものを提供するのではなく、サーベイランスの目的で、年齢層・性別・所在の地域・臨床症状、そういったものをカテゴライズしたチェックボックスから選択式に診断医が電磁的にデータ入力するシステムなど、そういったものを開発していただくと、提供する際に第三者に不要な情報は削除されるのではないかということで、そういったことが望ましいかなと思っております。
 2枚目に移りまして、7つ目のポツですが、第三者に提供される可能性のある匿名感染症関連情報にHER-SYSデータも含まれておりますけれども、特に、積極的疫学調査とか、健康観察といった保健所業務に伴うデータもこの中には含まれております。こういった業務は感染者への相談指導や情報収集を通じて得られるデータですけれども、これは相手方に、我々は公務員であるので、守秘義務があることが当然前提となっております。また、個人情報に細心の注意を払いながら我々は情報を集めております。
 そういったことに十分御留意いただきまして、個人情報保護、法的または倫理的に説明がつくことだけで担保するということではなく、匿名情報は提供者に不利益を与えるものではなくて、公共の福祉といいますか、公衆衛生上非常に重要なことであると、最初、目的のときに申し上げましたけれども、特に不利益を与えるものではないということは保証していただかないといけないと思っております。我々の業務は、感染者の方々との信頼関係で成り立っている部分が大きいので、その信頼を失いますと、本当に情報提供していただけなくなります。そういったことがございますので、そこのところは、どうかよろしくお願いしたいと思っております。
 それから、8つ目のポツですが、HER-SYSの入力項目はあまりに網羅的でございまして、自治体や流行時期によって入力する・しないの判断や、それから、調査の粒度がかなり異なっていたと思われます。そういった状況で、どのデータに実用性があるのか、また、どれぐらい入力されていれば実用性が高いのか、そういったことを、私どももデータは積極的に提供したいと思うのですけれども、優先順位的なものはある程度示していただいたほうがいいかなと思っておりますし、できる限り提供できるデータは、優先的に入力するような、そういった仕組みが望ましいかなと思っております。
 それから、最後のポツですが、新型コロナウイルス感染症対応で、各自治体では、HER-SYS以外にも独自に感染症関連情報を、データベースシステムを運用してデータをためているということがほとんどであります。ですので、今回決まる第三者提供の内容によっては、データをいろいろ操作することについては、自治体は現状でそんなに困っているわけではないということがありますので、そういたしますと、第三者提供の内容によっては、HER-SYS等の国のデータベースシステムへの情報提供が必要最小限になってしまう可能性があるかなと危惧する意見がございました。
 以上でございます。
○山本座長 ありがとうございました
 それでは、内田参考人の御意見も踏まえつつ、最初に御説明いただきました追加論点に対する意見交換をいただきたいと思います。
 順番に御意見を伺っていってよろしゅうございますでしょうかね。
 最初に、今村構成員から御意見をお伺いできますでしょうか。
○今村構成員 今村です。前回、ちょっと議論に参加できなかったので、議事録を読ませていただきましたが、活発な議論が行われたようで、参考にさせていただきました。
 今、議論にあるような情報を出していくことは賛成です。
 ただ、今、内田参考人からもありましたように、個人が特定できないように留意をしていただきたいことも十分に分かります。ただ、個人情報という意味で言えば、突き詰めていくと、必ずと言っていいほど個人を特定できるようになると思うのですけれども、利益とそのリスクとのてんびんの中で決めていく話ではないかと思っております。NDBも個人のレセプトのデータですので、あれを見ている限り、かなり個人の踏み込んだ情報があるわけで、感染症の情報に関しても、個人を特定するとまずいというのはよく分かるのですが、かと言って、特定できないようにすると、全く分析できなくなってしまうという、両方の問題点があると思っています。その意味では、私は、NDBのレベルに匿名度を合わせて進めていくことは、落としどころとしてはきれいかなと思っております。
 内田参考人のコメントの中で1つ気になったというか、共感できた部分がありまして、このデータをつくっている人の苦労を知れということが書いてあったと思います。実際に、コロナの入力はものすごく大変だったと思うので、このデータを提供する際には、そのデータを入力した人たちの苦労についても、ぜひ提供していくようにしていただいたほうがいいのではないかと思います。
 私からは以上です。
○山本座長 ありがとうございます。
 続いて、大曲構成員から御意見をいただけますでしょうか。
○大曲構成員 国際医療研究センターの大曲です。ありがとうございます。
 基本的には、私も、これまでの経緯と今日提示された論点、賛成であります。
 追加で、監査レベルですが、コメントすると、これも今村先生のおっしゃったことと重なってしまうのですけれども、一つ使用する情報としては、基本的には構造化された情報と。入力欄があって、そこに入力するといったものを使っていくと。逆に、テキスト情報で任意に書けるようなものに関しては外していくといったことは、私も賛成です。実際に入力する立場に立てば、テキスト情報として我々が任意入力されるものに関しては、何のコントロールもされませんので、それをデータとして扱えるかという問題もありますし、この中には、先ほどのお話が出ている、要は、感染経路等の情報も入ってくるわけですけれども、これは、また、別の意味で議論の対象になるというところで、こちらを外していくのは私も賛成だと思いました。
 内田先生のおっしゃっていることは、本当にごもっともと思って伺っておりました。医療機関の立場としても、我々、この入力に関しては医療機関も関わってくるわけですが、実際にこの情報の使われ方、特に個人に肉薄するような情報が何らかの形で外に出た場合には、実は医療不信というのがすごく起こります。医療機関への信頼がなくなることもあります。ひいては、データを使われるということに関して、医療を経由して得られたデータを使うことに関して、国民の理解が得られなくなるといったことは想定し得ますので、そうならないような配慮は非常に重要だと思いますし、これも繰り返しになりますけれども、この際ですので、データ入力のところが非常に省力化ができるようにというところも、ぜひ御検討をいただければと思います。それは、正確なデータの入力ということにも恐らくつながるのではないかと思っております。
 以上です。
○山本座長 ありがとうございました。
 それでは、田辺構成員お願いできますでしょうか。
○田辺構成員 まず、資料1で挙げられました最後のページの検討項目の1つ目のテキスト情報につきましては、先ほど、全国保健所長会からの御意見もございましたように、個人特定の問題もありますし、現実的に、テキスト情報をビッグデータで解析していくのは非常に難しいのではないかという技術面もありますので、事務局案にございますように、提供対象としないというのが原則でよろしいかと思っております。
 提供項目のイメージということで挙げていただいておりますが、総論的にはこのような案になろうかと思いますし、現実的にどこまでやるかというのは、審査のときに判断するという事務局案で、特に異議はございません。
 先ほど内田参考人からいただいた御意見も拝見していまして、私自身も第1波から第3波の初期のときに、県庁側の地方自治体の立場でコロナに対応したこともありまして、非常に共感する内容でした。
 この中で実際技術的なところを考えますと、最後から2つ目のHER-SYSの入力項目が網羅的で、調査の粒度が違うというところにつきましては、必須項目と任意項目ということで分かれてきたと思います。恐らく必須項目は全部入っていると思いますが、任意項目がどれぐらい入っているかといったパーセンテージは、時期によって異なるかと思いますので、そういったものが参考資料として挙げられると、申請するときの参考になるかなと思って聞いておりました。
 以上です。
○山本座長 ありがとうございます。
 それでは、引き続きまして、戸部構成員お願いできますでしょうか。
○戸部構成員 私も、全体としては、内田参考人の御指摘に大いに共感するところでありまして、情報提供の基本的な考え方としては、個人情報保護の観点からはできるだけ慎重に、リスクを最小化する方向で制度設計していくべきだと考えております。
 論点3の資料にございます御提案は、基本的にこれでおおむね妥当であろうと思います。ただ、提供可能な項目の住所のところ、これも内田参考人の御指摘にありましたが、市町村名については、相当慎重な取扱いが必要かと思います。前回、パッケージ化とかデータパック化のような御議論もありましたが、それは少し時期尚早で、この御提案にあるような個別審査で行くべきと考えます。
 以上です。
○山本座長 ありがとうございます。
 それでは引き続いて、日置構成員お願いできますか。
○日置構成員 ありがとうございます。
 参考人から出ている御意見の中で、まずは地域のお話もありましたけれども、特定に至る程度は、その地域、地域であるとか母集団にもよりますので、このあたりは審査基準をつくるときの目線として持っておくというお話かなと承りました。
 守秘義務の観点ですが、これは各省が持っているデータベースでも議論になっています。そのときに、ここが結構ボトルネックにもなるのですが、今回の場合は、感染症法によって明確に提供等が位置づけられていますので、そこで守秘義務の観点も含めて検討があったのだというお話になるかなと思っています。ただ、とは言え、法律があるからそのまま進めてよいのかというような御意見のところもあったかと思いますので、この検討会であるとか、あるいは今後の広報活動のほうでフォローしていくべきところではないかなと承っておりました。
 前回の積み残しというところでいただいているテキスト情報中心には対象としないというところですが、実効性が担保されなければ意味がないというところもあるかと思いますので、最初のスタートのところについては、この対応で異存はないというところですが、想定する活用するモデルや使用ニーズというところにも併せて、今後、柔軟な対応もできるように、最初はコロナからという話でもありましたけれども、ほかの感染症になったらどうなのだという話もあるかと思いますので、そのあたり柔軟な対応ができるように、今後の検討課題として残しておけるようにしたほうがよいかなと思っております。
 以上でございます。
○山本座長 ありがとうございます。
 それでは引き続いて、横野構成員お願いできますか。
○横野構成員 ありがとうございます。
 今いただいた内田参考人の御意見については、非常に有益な示唆をいただいたと思っております。その中にもありましたけれども、今後、データ入力の時点での構造化等を推進することはやはり必要になってくると思いますが、現時点では、テキスト情報中心のものについては、プライバシー保護の面も考慮して対象としないという整理でよいかと思います。
 また、現時点で利活用の対象となるこうした情報は、基本的には過去の情報になると思いますので、データの利活用についての周知や理解等がまだ十分に図られていない段階で取得された情報が主体になるかのかなと思います。今後、そういった周知とか理解の醸成といったことを図っていくことが必要だと思いますし、そうしたことと併せて、データの持ち方、入力の仕方を見直しながら、可能であれば、将来的に必要な部分については提供項目を拡大することも検討するとよいかと思うのですが、現時点では、この資料1の4ページに提示していただいたような考え方を基本とするのが妥当だと思います。
 以上です。
○山本座長 ありがとうございます。
 最後に、私から一言意見を述べたいと思いますけれども、まず、これは感染症法に基づいて提供される情報であって、この情報の取扱いで法律に触れることがあれば、禁固刑に至る罰則が設けられております。そういう意味では、法律に基づいてかなりきちんと制御された提供であるということがまず第一で、しかも、一方で、この提供されたデータを使って何らかの公表物を得た、つまり論文を書いたとか何かの場合、その公表物は全くコントロールされない世の中に広まっていく情報になって、ここで患者さんに損害があると取り返しがつかないことになりますから、そこのところの審査は多分十分にしなくてはいけないのだろうと思っています。
 一方で、今村先生のお話にもありましたように、あまりにも個人特定性の危険を本当にゼロにしてしまうと、ほとんど使えないデータになってしまって、結局、このデータを使うことによって新たな感染症の予防に非常に資するような知見が得られたにもかかわらず、それを得られなかったというのは、これは将来に対してある意味やってはいけないことだというのがちょっとありますので、このデータの本当に公益をきちんと求めることも重要な点として考えるべきことだろうと思います。
 この論点に関しましては、現在、積極的疫学調査のデータをあまり安易に扱いますと、内田参考人がおっしゃいましたように、信頼関係を失って、協力してもらえない。これは本末転倒も甚だしいわけですから、現状は、ここはとりあえず提供しないということでスタートをするということで、私も賛成でございます。
 ただ、今、Large Language Model(LLM)、ChatGPTとかGoogle Bardのように、自然文章を扱う研究は非常に急速に進歩していますので、テキストデータだからと言ってデータ分析ができないわけではない。ただ、そういうリスクがあるので、これはかなり慎重に検討をする必要があるということですので、これから、この提供を進めていく中で、もしも、本当にそういったことがニーズが生じるような申請が出てきた場合には、慎重に検討をしていく。当面はやらないということで進めるのはいいのではないかと考えております。
 ほかに御意見ございますでしょうか。
 よろしゅうございますか。
 それでは、次の議題「(2)本日の論点等について」ということで、論点4から論点7につきまして、事務局から説明をお願いいたします。
○井上結核感染症課総括調整官 事務局より御説明をいたします。
 資料3の2ページ目でございます。まず、こちらのページに関しては前回もお示しさせていただいた本会議の全論点を掲げてございます。本日の議論といたしまして、赤枠囲いの点について、論点4から論点7ということでまとめております。論点4は、提供先の範囲、審査方法、基準の観点で、論点5が匿名化の方法、論点6はデータ管理方法、安全管理措置に関する事項、論点7は公表・審査に関する事項でございます。
 次のページお願いします。3ページ目で、こちらはNDBを例として、匿名感染症関連情報の提供のフローと連結のイメージといったものを可視化しております。
 まず、下のほうからですけれども、感染症関連情報については、感染症法第12条に基づき、まず医師が発生届を都道府県に届出をいたします。さらに、都道府県は保健所の積極的疫学調査情報と併せまして、発生届に関しましては、その内容、すなわち発生届情報そのままというものではございませんけれども、その内容を報告するといったことが法文上求められております。
 その後、匿名感染症関連情報の第三者提供の流れの部分ですけれども、第三者提供に当たっては、感染症法の56条の41に基づきまして、まず、相当の公益性を有する業務を行う者に対して提供するといったこと。その際、厚生科学審議会の意見を聴く必要があるといった点、こちらは論点4と関連する事項であります。
 また、当該感染症関連情報に関しましては、厚生労働大臣が匿名化をした上で、研究者等の申請者に対して提供することとなるわけですけれども、その匿名加工基準が論点5といったことになります。
 さらに、申請者においては、法に基づきまして、安全管理措置、照合禁止、消去等の措置を行う必要があるといったこと。こちらは論点6でございます。
 最後に、申請内容と照らして適正な公表物となっているかどうか、公表前の審査について論点7として整理しております。
 なお、連結に当たって、制度開始当初、まずは新型コロナウイルスの情報といったところからスタートするわけですけれども、その際には、片仮名氏名、性別、生年月日を用いましてハッシュ化をかけた情報、いわゆるID4と言われる情報ですけれども、そちらを生成しまして、データ連結をすることを想定してございます。
 上のほうはNDBの流れですけれども、厚生労働大臣は、まず、そもそも匿名化された情報を持っており、それを研究者に提供するということで、研究者側が自身のPCなどで連結をすると、そういった流れを想定してございます。
 次ページお願いいたします。ここから個別論点に関して詳細説明させていただきます。
 まず論点4、提供先の範囲、審査方法・基準でございますけれども、こちらは感染症法56条の41に基づきまして、国・地方公共団体等の行政機関、大学等の研究機関に加えて、「民間事業者その他の厚生労働省令で定める者」といったことが規定されております。この省令で定める提供先の範囲に関してどのように考えるかといったことが一つの論点。
 また、提供に当たっての審査基準をどのように考えるかといったことを、併せて御議論いただきたいと考えております。
 下に、事務局のたたき台を用意してございますけれども、まず、提供先の範囲に関連する話として、匿名感染症関連情報については、幅広い主体に活用されることで、国民保健の向上に資する分析の創出に期待ができるといったことでございます。ですので、法律に除外されている「特定の商品又は役務の広告又は宣伝に利用するために行うもの」といったもの以上に、省令で特段除外業務に関して明示する必要性といったものはないのではないかといったことをまず提示させていただいております。
 さらに、法律上の「相当の公益性」を有すると認められる業務を提供対象にする必要があります。この「相当の公益性」に関しまして、下のところで、NDBの「相当の公益性」ということで、1、2、3、4、5という形で列記をさせていただいておりますけれども、これらを参考にしながら公益性の基準といったものを考えてはどうかといった点でございます。
 その次に、審査基準に関連することとしては、NDB始め他の公的データベースを参考にいたしますと、利用内容が適当かどうか。その際に、申請時には、利用の目的、必要性、過去の研究実績等に関して、他の公的データベースでは求めておりますけれども、それらが適当であるかどうかといったことを確認することが必要ではないかといった点、さらに、安全管理措置がしっかりと取られているのかどうか、そちらに関して申請時に確認してはどうか。それを基準に盛り込んではどうかといったことを考えております。
 最後に、感染症の特性ということで、いわゆる差別・偏見につながりやすいといったことが特性として挙げられますけれども、それらの観点から、申請内容に関しても問題ないものになっているかどうかといった事項に関しても確認、基準として設けてはどうかといったことをこちらで提示させていただいております。
 次お願いします。論点5です。匿名化の方法ということで、感染症法における匿名感染症関連情報については、患者等の個人を識別すること、感染症関連情報を復元することができないようにするために、厚生労働省令で定める基準に従い加工した情報という定義がございます。こちらに関して、他の法的データベースの運用を踏まえまして、どのように加工基準を考えるかといったことを御議論いただきたいと考えております。
 たたき台でございますけれども、まず、他の公的データベースと同等の確保基準を定めることとしてはどうかということで、例として、1、2、3、4、5と並べております。それぞれ、1番目は個人識別情報の削除に関する事項、2点目は識別符号の削除に関する事項、3点目が連結符号の削除、4点目は特異な記述の削除と言われているものでございます。「特異な記述」という点に関しましては、個人情報保護委員会のガイドラインの中でも、例えば、日本人の最高年齢ということが例示されておりますが、既に報道等で特定され得るような、そういった特異な記述といったものについては削除してはどうかといったことがあります。
 その点と関連するわけですけれども、2点目、個別に判断が必要なものについて、特に診断日などが特異な記述に触れるかどうかといったことが若干疑義があります。つまりは、感染症の発生処置、症例が少ない時期、そういったときには、ある程度個人の特定に至る可能性もあるのではないかといったことが論点としてございます。これらに関しては、提供時の審査においてある程度確認していきながら判断してはどうかといったことを、まず提示させていただいております。
 論点6、次のページをお願いします。こちらは「データの管理方法、中間生成物の管理」ということで、第三者提供制度に関しては、先ほどの内田参考人からの御発表にもありました、信頼に基づいた制度となるようにすべきであるといった話です。そのためには、実効ある安全管理措置を確保していく必要があります。
 対応方針(たたき台)でございますけれども、まずは、他の公的データベースの運用を踏まえますと、組織的な安全管理措置、利用者の権限・責務の明確化でございますが、そういった点とか、人的安全管理措置、情報利用者の教育・訓練に関する事項、さらに、物理的安全管理措置、技術的安全管理措置、そういったことを求めてはどうかといった点があります。
 また、第1回有識者会議でも議論に上りましたけれども、今現状、特に医療・介護データ等に関して検討が進んでおりますHIC、いわゆる連結解析基盤ということで、そちらの基盤に載っているデータベースは、研究者がデータを自身で連結すると、それがより安全な形でできるようになるといった検討が進んでおります。それらに関しても、将来的に活用していくこととしてはどうかといったことをたたき台として挙げさせていただいております。
 最後に論点7であります。公表に係る審査・基準に関して、対応方針といたしましては、まずは、申請時の利用内容との整合性を確認することが必要ではないかということで、さらに、他の公的データベースを踏まえますと、特に公表研究の成果によって特定の個人が識別されないようにということで、例示として3つ掲げております。サンプル数が例えば10未満は公表しないという最小集計単位の原則、年齢区分あるいは地域区分に関しても、一定のグルーピングしたデータを、公表の際に求めていくといったことを基準に盛り込んではどうかといったことを考えております。
 さらに、最後の点としては、一度公表されたものに関しては、なかなか関与が及ばなくなってしまうといった点に関して、先ほども座長からも御指摘ございましたが、法違反の適用の可能性があるとかそういうことに関しては、事前にしっかりとガイドラインに明記することで、利用者に伝達をするといったことで抑止を狙ってはどうかといったことを考えております。
 以上が、論点4~7といったことでございます。
○山本座長 ありがとうございました。
 今日は、論点4から論点7まで御提示があったわけですけれども、それぞれについての御意見を伺えればと思いますけれども、また順番にお聞きしてよろしゅうございますですかね。いつもトップで申し訳ないですけれども、今村構成員からお願いできますでしょうか。
○今村構成員 今村から、今回、4~7まで論点をいただいているので、それぞれについて少しずつ。
 まず、論点4の審査方法・範囲については、御提案いただいている方針案で賛成です。
 論点5「感染症の特性を踏まえた匿名化の方法」で、公的DBと同じようにするのは賛成です。
 診断日の「特異的な記述」ということですけれども、NDBともしくっつけるのであれば、診断日は極めて重要な情報です。NDBは、少なくとも医療行為については時系列で日付単位で入っているので、その診断が行われた前かどうかというのはものすごく重要な情報なので、出すべきだと思っています。
 ただ、御指摘のように、診断日は、個人の特定の材料にもなるということで、そういったところの留意は必要だと思うのですけれども、実際にデータを扱う立場からすると、この大きな分岐点となるポイントなので、これは極めて重要な情報だと考えます。
 それと、次の論点6「データの管理方法、中間生成物の管理」は、基本的な方針は賛成です。HICもすぐには使わないということですけれども、このHICをNDBとくっつけようとすると、メモリーを物すごく食うので、これを実際どんなふうにHICで準備するのかというのは大きな問題だと思いますので、コロナの情報はNDBなどに比べるとずっと小さな情報なので、規模としてはNDBをくっつけた途端にHIC上の問題を一気に抱え込むことになると思うので、そういったことの配慮が必要かなと思います。
 論点7ですけれども、これも、また、方針としては賛成で、逆に、これは必須だと思います。NDBで個人を特定しないために様々な要件が、5歳年齢刻みとかが決まっているわけですけれども、くっつけたことで何歳か分かるということであれば、多分NDBのほうの今度は匿名化されている部分がどんどん顕名化されていくという問題があって、ほかのデータベースとくっつけるのであれば、そのデータベースの基準は守っていく必要があるのではないかなと思います。ですので、そのようなことを考えていくべきではないか。
 ちょっと事務局に1つだけ確認ですけれども、本来、NDBなどは、匿名加工情報という整理ですけれども、今回、この感染症の情報、厚生労働省から出ていく前は顕名化されているわけで、それが匿名化されたものをくっつけることで、逆に、NDBが仮名加工情報になってしまうということはないと理解しているのですけれども、それでよいかということをぜひ確認させてください。
 今村からは以上です。
○山本座長 ありがとうございます。
 今の今村先生の御質問で、事務局はお答えありますか。
○井上結核感染症課総括調整官 事務局からお答えさせていただきます。
 研究者側にまず立ってみますと、NDBに関しましては、こちらは当然匿名加工されたものということで、非個人情報ということになります。
 今村先生から、今、仮名加工情報というお話でございましたが、研究者側のほうですと、匿名感染症関連情報ですので、匿名化された情報です。このため、研究者はそもそも照合するすべが何らないという状態になりますので、非個人情報と非個人情報を持つということで、そちらに関しては問題がないと考えております。
 なお、厚生労働省にある間については、顕名の情報と、あとは一時的に匿名情報を持つという情報がございますが、改めて申し上げますと、仮名加工という情報ではありません。仮名加工情報と言う場合には、何らか照合するリストといいますか、そちらのほうを併せて用意した情報源になりますので、厚生労働省では、あくまで、顕名と匿名情報を同時に有するといった形になります。
 以上です。
○山本座長 ありがとうございました。
 それでは引き続いて、大曲構成員からお願いできますでしょうか。
○大曲構成員 大曲です。
 御提示いただいて、整理いただいた論点の4、5、6、7に関しては、私自身は整理いただいた内容に全て賛成であります。
 多少コメントだけしますと、2つありまして、論点4ですけれども、こちらに関しては、要は、提供先の範囲、それと審査方法に関してお示しされています。これ自体には全く異論はないのですが、私は、実際、この情報のどれぐらい提供される側の提供のスピードのキャパシティがあるかというのは存じ上げないのですけれども、恐らく請求が同時に多発するということは想定し得る話でして、そのときに、提供先の順位も検討が要るのではなかろうかと思っています。私も厚生労働省の事業でNDBのデータ等を使う立場にいますけれども、そのあたりにはやはり整理が必要。要は、急ぐものを早く出していただくといったことは必要なのではないかと感じるところがありましたので、その点をコメントいたします。
 あとは、論点5に関して、対応方針で、個別に判断が必要なものについては、提供時の審査において判断してはどうかというのは、本当にそのとおりだと思います。新規の感染者は、例えばオミクロン株の1例目、2例目、3例目が日本に入ってきたというときには、世の中の関心は診断日等に非常に関心が高いわけですが、それは、要は、根本的にはどういう人なのか、個人に迫ることが目的になっているように思います。それは非常に危ない状況である。一方で、そういった患者さんが5,000人も1万人も出ると、診断日の重みは逆になくなっていきます。ですので、その提供の時々の状況を、文脈を判断しながら、提供する・しないの判断をするということは適切ではなかろうかと思いました。
 以上です。
○山本座長 ありがとうございました。
 それでは引き続いて、お見えになりました鈴木構成員にお願いできますでしょうか。
○鈴木構成員 国立感染症研究所の鈴木です。すみません、10分か15分前から出席とさせていただいております。
 今挙げていただいております論点4~7につきまして、お示しいただいたたたき台の方針で、私はおおむね特に異論はございません。
 ただ、先ほど来、論点に挙がっております診断日のことですね。論点5になりますでしょうか。これを「特異な記述」として注意すべきかどうか。これは前回も私コメントさせていただいたかと思いますので、ちょっと追加でコメントをさせていただきたいと思います。
 既に挙がっておりますように、特に流行の初期、2020年の初頭とか、あるいは、地方などでも最初の症例、流行が立ち上がった時期などに関しては、報道でもかなり深掘りの情報が公開されるといったこともありましたので、その情報とここで提供される情報を突き合わせた場合に、場合によってはかなり個人の特定の可能性が高まったり、あるいはその方がこういった病気を持っているといったことまでももしかすると特定されるリスクがあるということは、しっかりと検討、検証しておく必要があるのかなと思います。
 ただ一方で、もちろんそのデータを活用するという観点から言うと、最初からあまり細かく制限してしまうと、活用の制限にもなってしまうので、ということで、突合するというところまではやるのだけれども、審査をして、実際に提供する段階で、個別にケース・バイ・ケースで判断していくというのが現実的なところなのではないかと私も思っているところです。
 私からはひとまず以上です。ありがとうございます。
○山本座長 ありがとうございました。
 それで引き続いて、田辺構成員お願いできますでしょうか。
○田辺構成員 私も、いただいた事務局案で基本的に賛成です。
 まず、論点4は、省令、特に除外業務を明示する必要もないと思います。
 論点5で挙げられております診断日の話ですが、分析する側としては、診断日がないと分析は難しいと思いますので、「提供」と「公表」を分けて考えるのが良いかと思っています。「提供」は提供でしていただいて、「公表」するときに、例えばグラフで出すとかはあっても良いと思いますが、テキスト情報のところは削除するなど、個人が特定されるものは「公表」のときに、診断日をぼかすといった配慮をする形が良いと思います。「提供」の段階で落としてしまうと分析するのが厳しいという印象は持っております。
 真ん中あたりの「特異的な記述」についてです。年齢の話もありましたが、NDBですと、100歳以上は同一グループとありますので、そのあたりは一緒にしていくのが良いと思っております。
 論点6の管理方法については、開始時点ではオフラインになるかと思っていますが、おそらく、ずっとオフラインというわけではなくて、最終的には、クラウド上でやるという形になっていくと思っておりますので、こういったたたき台でよろしいかと思っています。
 最後の論点7の最小区分のところも、NDBと一緒でいいと思いますが、地域のところはかなり大事になってくると思っています。事務局案の資料1の最後のページを見ますと、真ん中の「提供可能な項目(イメージ)」の※の1つ目の提供の範囲は、原則都道府県単位とし、市町村単位の必要性については審議会にて判断となっておりますので、粒度として市町村より細かいところはまずないとして、最小粒度が市町村としても、本当に市町村単位で公表すべきかどうかというのは議論が必要かと思います。
 以上になります。
○山本座長 ありがとうございました。
 それで引き続いて、戸部構成員お願いできますでしょうか。
○戸部構成員 私も4~7はおおむね賛成であります。
 細かいコメントですが、論点4の1ポツ目の広告・宣伝用途の問題がありますが、これと研究用途とが截然と区別できるのかという問題が、恐らく現実にはあろうかと思いますので、どういう場合に宣伝・広告用途になるのかというさらなる具体化が必要かと思います。
 先ほど大曲構成員から、申請が重複した場合は、重要なものから処理すべきだという御意見がありましたが、他方で、申請処理は申請した順が通常だという考え方もあり得ると思いますので、この点は重要な論点として、今後、検討が必要かと思いました。
 論点5については、これでよろしいと思います。
 論点6と7は、これは共に安全管理の話かと思いますが、これも基本的には賛成で、各種安全管理措置を講じるということでよいかと思いますが、ただ、事前に管理措置をチェックして、それを構築したとしても、必ず悪い人はいるわけで、罰則があっても犯罪はなくならないということがあるように、罰則があるから万全というふうには考えてはいけないのだと思います。ですので、論点6のところにあるHICの活用は、これは安全面でのリスクも小さくなると思いますので、活用を今後検討していただきたいと思います。
 論点7については、これは少し先の話かもしれませんが、56条の45に違反すると、いきなり刑罰を科されることもあるのですが、56条の47の是正命令の対象にもなると。このあたりの振り分けをどうするかということを今後考える必要があるかと思いました。
 以上です。
○山本座長 ありがとうございました。
 それでは引き続いて、日置構成員お願いできますでしょうか。
○日置構成員 ありがとうございます。
 論点4から論点7まで、最初のスタート、今から始めますという段階では、こちらは細かいところでは若干意見はありますけれども、大きな方向性としては異存はございません。
 ただ、スライドの3ページを拝見していると、申請者の側で、ばらばらにもらってきたデータを連結していくという話のようなのですが、よくある匿名化、その情報をもらった後の活用の場面で、識別行為の禁止とか、安全管理とか、特定のリスクを自分たちが負ってしまうということで、データの利活用に、こんな活用の仕方をしていいのかというような形で疑義が呈されると、もらった側のほうで少し困るというようなこともありますので、今後、審査の基準とか、各論点を検討していく上では、そういった利用者側の負担も視点として持っていただきたいなと思っております。
 論点4からの細かなところですけれども、先ほど戸部構成員からも御意見ありました広告・宣伝とはどの範囲なのだと。民間が関与する場合は特にですが、私企業の場合には、ここのあたりをどこまでやるとここに抵触するのかというところは非常に懸念が持たれているところではあります。この部分と、「相当の公益性」が厳しくなり過ぎないようにというところは、御検討をいただく必要があるのかなと思っております。
 次、論点5ですけれども、他の公的データベースと同等の加工基準を定めることとしてはどうかということで、例にNDBの加工基準が出ておりますが、3のところの、現に取り扱う情報を相互に連結する符号に限るというIDの考え方ですが、今回の片仮名氏名と性別と生年月日を用いたID4、こちらがそもそも厚生労働省へ入ってくる段階で、もう既に付されているIDのように思えるのですが、ここは現に使用しているIDからは外れるのですという説明がつくのか若干気になりまして、そのあたりもきれいにしていたほうがいいかなと思っております。
 また、論点6のところは、オフラインからなのか、それとも提供してしまうので、その後どういう使い方をするかというところは、利用者によって、申請者によって結構異なるのかなと思っております。実際、このあたりをクラウド環境に置いていいのかとか、クラウド環境に置くのだったらソリューションをどうするのかとか、細かなところの設計があると思いますし、負担感は非常に大きいのかなと思いますが、安全性という観点も含めて、どれくらいのところがバランスがよいのかというところは、ちょっと検討をしていかないといけないかなと思います。
 私からは以上です。
○山本座長 ありがとうございました。
 それでは引き続いて、横野構成員お願いできますでしょうか。
○横野構成員 論点4から論点7までに関する基本的な方針については賛成いたします。
 論点4に関してですが、倫理審査等でよく問題になることとして、指針等の文言はどうであれ、こういう情報をある意味で最終的には営利を目的とする活動に提供してもいいのかということがよく問題になります。その中では、ここでは明示的に宣伝・広告が除外されているのですけれども、そこまで明確なものでなくても、最終的に営利を目的とする活動にも提供される可能性があるということについては、そういう制度であるということについての理解を十分に醸成することが必要になってくると思いますし、なぜ、そういう形での利活用が必要なのかということについての背景や説明も重要になってくると思います。
 それから、論点5に関連すると思うのですけれども、今村先生から最初の頃に出た仮名加工情報という話は恐らく、申請者のところでデータを連結することになった場合に、もともとはそれぞれのデータベースの段階では削除されていたようなものが、2つのデータセットを合わせることによって、ある意味見えてしまうというようなことがあるのではないかという御趣旨かと思いました。それは実際起こり得るのか、起こり得るということを想定したほうがいいのかどうかということと、データが研究者の手元で突合されたときに、何らかのそれに対する対応策を考える必要はないのかということについては、検討をする必要があると思います。
 それから、論点6に関しては、中間生成物のところはここにはあまり書かれていなかったので、どうなっているのかなというところがちょっと気になっているのですけれども、それぞれの提供先ごとに、安全管理措置をどのように講じているのかということについて確認をすること、状況の変化等について把握をすることには限界があると思いますので、データそのものを提供しない形での利活用の在り方を、今後、検討していくことは重要だと思っています。
 それから、最後の論点7に関しては、特に内容に関することではないのですけれども、対応方針(たたき台)の2ポツ目の2行目ですけれども、「特定の個人が第三者に識別されないように」という記載があって、ここは提供先の第三者だけではなくて、もっと広い意味での第三者ということで書かれているということだと思うので、その点は確認をさせていただきたいと思います。
 以上です。
○山本座長 ありがとうございました。
 最後の御質問に関して、事務局からは、当然そうだと思うのですけれども、お答えはございますでしょうか。
○井上結核感染症課総括調整官 ありがとうございます。事務局でございます。
 ここに関しては、例えば、年齢とか地域とかいろいろなクロスを恐らくして研究者の方は研究されることになるかと思います。そういうふうな形でかなり細分化していったとしても、第三者に識別がないような形で、例えば、それが最小集計単位原則に当たるようなところの話であるかと思いますけれども、そこに関しては十分な配慮をしなければならないことは求めたいと考えております。
○山本座長 ありがとうございました。
 では最後に私から。
 皆さん方の御議論で、今日御提示いただいた論点4から論点7は事務局案でおおむね御賛成をいただいたと理解をしております。それぞれ少しずつコメントがあったと思いますけれども、私も、今までの経験上、例えば、論点4の「特定の商品又は役務の広告又は宣伝に利用するために行うもの」は、これは本当に私企業であったら、これを全く排除できるのかというのは、これはかなり難しいことだと思うのですね。基本的には、これを主たる目的とするものではなくて、その下の「相当な公益性」が主たる目的であるということを見ていかざるを得ないのではないかなと考えております。
 それから、論点5は、それほど大きな問題はないと思いますけれども、突合した場合のリスクの増加は、これは匿名加工でなくなるとか、なくならないとかというレベルではなくて、匿名加工情報は基本的にリスクがあるから、個人情報保護法でも再特定の禁止というのをわざわざ設けてあるわけですよね。これは、再特定が絶対できないとは言えないから設けているわけで、そのリスクの程度は、連結をすることによって増大することはあると思うのですね。
 現状、NDBも含めて連結自体を研究者にお任せをしているというところがあるので、これは日置構成員がおっしゃったように、研究者が困る状況も多分あると私も理解をしております。本来、連結をしたデータセットを提供するというほうが合理的だとは思うのですけれども、現状は、今使っている大きなデータベースでは、連結をするという作業をデータベース化までする余裕がない。つまり、それだけのリソースがないので、連結自体を研究者にお願いしているというようなところが多分あるのだろうと思うのですね。したがって、これは、将来的には私はやはり連結をして、きちんとリスク評価をしてからお渡しをするということがいいのではないかと思いますけれども、現状ちょっとやむを得ないのかなという気がしております。
 それから、論点6、論点7は、多分ほとんど問題がないと思うのですけれども、論点7の公表基準ですけれども、実際に今、厚生労働省の管理しているデータベースの第三者提供の例で言いますと、例えばがん登録データベースとか難病小児慢性疾患のデータベースとかの利用申請と公表の審査を逐次やっているのですけれども、その中では、最小集計単位以下の公表の審査を要求されています。この基準で本当に必要十分なのか。恐らく必要条件として、これをやっていれば大丈夫だと言えるのですけれども、これを必ずやらないと個人の識別が侵されるのかというと、多分そうでもないのですね。
 例えば難病・小慢などの場合、そのデータの10以下になるものが、例えばeGFRというと、これはeGFRを外見上、あるいはそのデータ以外の状況から類推することはほとんど不可能に近いわけですから、これを例えば3であれ5であれ、特定の個人が識別できるようになるということはちょっと考えられないので、ここは10以下であっても、公表しても可というような審査が行われますが、恐らく感染症等データベースもそういった申請が出てくるのだろうと思いますけれども、それはそれで多分実質的な公表のリスクをきちんと評価した上で、審査をしていかなければならないのかなと思っています。
 それから、突合にID4を使って、今のコロナのデータベースの場合これしかないわけですから、これを使わざるを得ないのですけれども、ID4は正確性に欠けるところがどうしてもございます。したがって、今後生じるような感染症のデータ収集に関しては、できればID5で突合できるような形でのデータ収集が望まれる。これは、突合して違う人のデータをくっつけたものを分析するのは、研究成果としてのリスクがかなりございますし、そういう意味では正確な突合ができるような工夫は、多分、将来的には考えるべきでしょう。
 安全管理は、分析をする研究者の先生方にとっては意外と難しいことなのですね。情報の安全管理を専門にされている方が疫学調査の専門ということは絶対あり得ないわけで、そうすると、非常に優れた研究者であっても、情報のセキュリティに関してはあまり知識のない方がいらっしゃって、NDBの場合、これの実効性を確認するために、研究環境の監査をしているのですけれども、監査をするたびに、大きな問題があるのはほとんどないのですけれども、小さな問題が結構生じていて、是正をお願いするということが結構あります。これも小さな問題ですから、ちょっとリスクが増える程度で、実際に漏えいが起こったというわけではないのですけれども、これをもっと研究に専念していただくという意味では、ビジティング環境といいますか、データを提供するのではなくて、分析環境を用意して分析をしていただいて、安全な結果だけを取り出していただくというふうな、今のHICの考え方がそうですけれども、こういったことにできるだけ早く移行をしていったほうが、安全にお使いいただける。なおかつ、研究者がものすごく大変な努力をしなくても使えるということに、多分つながるのではないかなと思っております。したがって、現状はちょっと仕方がないにしても、可能な限り早くこういった環境も利用できるようなことを整備していただくことが重要ではないかなと考えております。
 ちょっと長々話してしまいましたけれども、追加で御発言ございますでしょうか。もしありましたら、挙手をお願いします。
 事務局、どうぞお願いします。
○井上結核感染症課総括調整官 幾つか御質問のようなところも含めて、構成員の皆様から様々御指摘があったかと思いますので、幾つか事務局の現段階の考えとか、お伝えしたいと思っております。
 一番最後のところで山本座長からありました、特に安全な形で連結、解析していくという話、あるいは2つのデータベースを合わせた場合のリスクで、研究者自身がやったらなかなか困る部分もあるといった点、一つの答えはやはりHICの活用かとも思います。説明の中でもありましたとおり、HIC自体、まだ先で、整備自体が現状まだできているわけではないというところもあり、こちらの匿名感染症制度、次年度からの初めての施行ということもあるので、同時期に一気に始めるということはなかなかまだ準備が十分に整わないところもあるかもしれませんが、できる限りの早くの移行ということは意識しながら、制度を整備していくのかなと考えております。
 もう一つ座長からありましたけれども、ID4で今回つなげていくという点に関しては、まず、連結キーはこれしかないということでありますけれども、将来的にはID5ということで、こちらは被保険者番号から生成されるハッシュ値でありますけれども、実は、今後の新感染症に関しては、被保険者番号を収集していくという形で我々考えておりまして、省令上の整備も済んでいるところであります。
 そのほか、ID4との関係もあるのですけれども、日置先生から、連結符号の関係の話のところもいただいておりまして、匿名情報に関しての連結符号みたいなところはどうなのかという話ですけれども、こちらに関しては、連結符号については、一つの情報源を母体として、仮名情報もそうかと思いますけれども、何らかのIDが振られたものについて、それがお互いに戻らないようにというところに関しての措置として、連結符号の削除があるかと考えています。
 例えばHER-SYSで言いますと、それぞれの個人に関して、自治体のほうが実際に入力するデータは、氏名等に加えてHER-SYS IDというふうなものをつけたりするわけですけれども、我々としては、HER-SYS IDに関しては削除をしていくということで、こちらのID4の部分は、こちらは、実際に他のデータベースとの連結には、活用としては必要になるのかなという形で整備をさせていただいているところであります。
 広告・宣伝の部分のところですけれども、これは他のDBの例を取りますと、例えば、このいわゆる幾つかの特定の地域でこの治療薬が実際に普及しているかどうかということを調べた上で、そこに関して、企業として何らか働きかけをしたいという形のかなり純粋な営業的な目的で研究がしたいといったものについては、利用申請が来た場合には、最初の時点で提供はしないといった判断が働くかと思います。
 ただ、線引きはそもそも非常に難しいラインかとも思いますので、そこに公益性の基準の観点からまず審査して受け止めるということがあり得た場合には、そこは個別審査によるわけですけれども、公益性の判断のところから一つ一つ考えていくのかなという、座長の御指摘と同様のような対応を現状では考えているといったことです。
 そのほか、戸部先生から、いきなり罰則という形ではなく、56条の47の観点の是正命令との関係性、そこに関しても何らか議論したほうがいいという点でございますけれども、こちらに関しては、今回、罰則に関して例示で少し書かせていただきましたが、実際には、幾つかステップを経た上での罰則というのが、妥当なプロセスかと考えておりますので、また、ガイドラインのほうを具体的に決める際には、そのような形で考えたいと思います。
 田辺先生からいただいた点として、「特異な記述」の削除の観点というか、仮に個別審査で「特異的な記述」というふうなものが見つかったとして、その項目を全て提供しないという判断に直ちに行くのではなく、あくまでその当該情報を外すような形での対応になるかと思いますので、それによって分析が全くできないということが起き得るものではないと考えております。
 事務局から、御質問に少し関係するような話についてお答えをさせていただきました。
○山本座長 ありがとうございました。
 今の事務局のお答えも含めて、追加で御発言ございますでしょうか。
 今村先生、どうぞ。
○今村構成員 今村です。
 今の事務局のお答えではないのですけれども、ID4の連結における重要性というのが今議論にあったので、そのID4をつくるときに失敗しないでほしいということをコメントさせてもらいたいと思います。
 もともと片仮名の氏名からつくるIDですけれども、まず、全角と半角という問題があります。さらにその後に、名前と姓の間にスペースがあって、スペースがあるかないかでも当然ハッシュ化すると違ってきます。さらに、このスペースを半角に直すときに、外字スペースとかというのもあって、外字スペースは半角スペースにはならないのですね。というようなことを今までできないで、多くのこのID4作成グループが失敗してきていますので、ぜひ、そういったことがないように、純粋にくっつけることができるようなID4になってほしいと思うので、今、最終的には、ID4のフォーマットが何回も改訂されてきていて、確定したものがあると思いますが、それを慣れた事業者が使っていただくというようなことが重要だと思います。特に外字スペースとかいうような話は、今まで知らなかったところがやって失敗したり、知っているところでも、知らない担当者がやって失敗したりしていますので、ぜひ、そういったところは注意をしてほしいと思います。
 今村からは以上です。
○山本座長 ありがとうございます。
 ほかはいかがでしょうか。
 診断日に関して特異性がある場合があることがございましたし、内田参考人からは居住地に関しまして、人口が非常に少ない地域があって、特定につながるのではないかというお話もございました。これは、目的が何かによってもかなり変わってくると思うのですね。例えば、NDBは、今、郵便番号が入っていますけれども、例えば、このCOVID-19のときに、居住地の中の発熱外来の数とか、最寄りの発熱外来までの距離とか、そういったことが何らかの影響を与えるとすると、その測定には居住地がないと分からないわけですよね。ただ一方で、結果として来るデータは距離とか密度だけですので、これはカテゴリー化すればどこの地域というのが全く分からなくなる。そういったことのデータを出すために必要なデータなのかということが、多分、非常に重要で、データの性質からだけを議論すると、非常に不自由なデータになってしまうという可能性がありますので、その点も含めて、ガイドライン等では御検討いただければと思います。
 ほかはいかがでしょうか。
 よろしゅうございますか。
 それでは、本日の御議論は事務局に整理をしていただいて、次回以降の議論につなげていきたいと思います。
 それでは、本日の議事は以上ですけれども、特に御発言ございませんでしょうか。
 よろしゅうございますか。
 それでは、事務局から連絡事項がありましたら、お願いします。
○井上結核感染症課総括調整官 本日も御議論いただきまして、ありがとうございました。
 伝達事項といたしましては、まず、次回の第3回有識者会議の日程についてですけれども、こちらは8月下旬を予定しております。また、詳細については事務局から各構成員の皆様に御連絡をしたいと存じます。
 本日におきましては、皆様及び内田参考人におかれましては、御出席を賜りまして、ありがとうございました。
 また、次回までに、本日いただいた御意見を踏まえまして資料を用意させていただきたいと考えております。
 この後、私のほうで記者ブリーフィングとして本日の概要を説明したいと考えております。
 事務局からは以上です。
○山本座長 ありがとうございました。
 それでは、これで第2回有識者会議は終了といたします。内田参考人におかれましては、御多忙のところ、議論の参考となるお話をありがとうございました。
○内田参考人 ありがとうございました
○山本座長 構成員の皆様方には、積極的な御議論どうもありがとうございました。次回以降もよろしくお願いいたします。
 では、本日はここまでといたします。