2024年2月8日 第1回 医療等情報の二次利用に関する技術作業班 議事録

日時

令和6年2月8日(木)16:00~18:00

場所

オンライン開催

出席者

構成員(五十音順、敬称略)

議題

(1)主査の選出について
(2)技術作業班の検討事項について
(3)医療等情報の標準化等のこれまでの取組みについて
(4)医療等情報のデータ連携、標準化及び信頼性確保に係る課題について

議事

議事内容
○事務局 事務局でございます。
 定刻になりましたので、ただいまより第1回「医療等情報の二次利用に関する技術作業班」を開催いたします。
 皆様におかれましては、御多用のところ、本作業班に御出席いただき、誠にありがとうございます。
 本日の会議は、オンラインによる開催としまして、会議の公開につきましては、傍聴用Zoomウェビナーで行うこととしております。
 本日は、第1回の開催となりますので、主査選出に入るまでの間、事務局を代表しまして、私、岡が進行を務めさせていただきます。
 開会に先立ちまして、厚生労働省医政局特定医薬品開発支援・医療情報担当参事官の田中より御挨拶申し上げます。
○田中参事官 皆様、こんにちは。
 医政局参事官の田中でございます。
 本日は大変お忙しい中、オンラインで本作業班に御出席いただきまして、誠にありがとうございます。
 医療等情報の二次利用につきましては、徐々に議論が進んできておりまして、一昨年、医療分野における仮名加工情報の保護と利活用に関する検討会において、精力的に先生方に御議論いただいて、これまでの議論の整理をまとめていただきました。
 その後、政府においても様々な検討、議論が行われ、昨年5月には、次世代医療基盤法の改正法が成立したほか、6月には、規制改革実施計画及び医療DXの推進に関する工程表が取りまとめられました。
 特にこの工程表の中では、医療情報の二次利用について、そのデータ提供の方針、信頼性の在り方、連結の方法、審査の体制、法制上あり得る課題等の論点について整理、検討するため、2023年度中に検討体制を構築するとされております。
 これを受け、昨年11月に、健康・医療・介護情報利活用検討会の下に、医療等情報の二次利用に関する様々な論点を御議論いただくために、医療等情報の二次利用に関するワーキンググループを設置し、公的データベースで仮名化情報を利用・提供する場合の法制的論点、情報連携基盤の整備の方向性に係る論点などについて議論を開始したところでございます。
 このほか、データの標準化、信頼性の確保、情報連携基盤におけるセキュリティ要件等の技術的事項などにつきましても検討を進める必要があることから、今般、本作業班を設置させていただきました。
 医療等情報の二次利用の推進に当たっては、一次利用から二次利用までを通貫してデータの標準化、信頼性の確保に取り組むことが重要でございます。
 また、既に運用が開始されている医療・介護データ等解析基盤(HIC)も念頭に、利用者目線で活用しやすい情報連携基盤の構築を進めていく必要があると考えております。
 本作業班では、医療情報やセキュリティ、データサイエンスの御専門の方々にも構成員となっていただきました。ぜひ活発な御議論をいただきますよう、お願い申し上げます。
 どうぞよろしくお願いいたします。
○事務局 ありがとうございます。
 続きまして、構成員の皆様の紹介をさせていただきます。
 本日の資料1の委員名簿に従って御紹介させていただきますので、一言ずつ皆様から自己紹介をお願いできればと思います。
 資料1の別紙、構成員名簿でございます。
 足立昌聰構成員。
○足立構成員 一般社団法人医療データベース協会の足立でございます。
 弊協会は、民間事業者の立場で医療データ、主にリアルワールドデータ、保険者由来のデータとなりますが、こういったデータの主に匿名加工情報の二次利用のDBを商用利用という形で提供させていただいている事業者の業界団体となってまいります。
 私どもは実際、そのデータベースを利用の用に供している事業者という立場と、実際に製薬や医療機器を開発されている民間事業者、あるいは学術という形で利用していただいている皆様のニーズにも日常的に接する立場でございますので、そういったところから非常に使いやすい基盤に少しでもお力添えができればと考えております。
 どうぞよろしくお願いいたします。
○事務局 ありがとうございます。
 続きまして、小笠原克彦構成員。
○小笠原構成員 日本医療情報学会で代表理事を務めております、小笠原でございます。
 日本医療情報学会は、医療情報の学術研究をメインとしまして、医療機関における情報システム、さらには情報の活用を行っております。
 また、今、医療情報技師の育成の点でも積極的に動いておりまして、医療情報の観点から、学術から運用まで考えていきたいと思います。
 こちらの作業班は、今後の医療に大きく関わる重要な作業班だと思っておりますので、何とぞよろしくお願いいたします。
○事務局 ありがとうございます。
 続きまして、岡田美保子構成員。
○岡田構成員 一般社団法人医療データ活用基盤整備機構の岡田と申します。
 私は、今ほどお話がございました、小笠原先生の日本医療情報学会で長く活動してまいっている者でございますが、医療情報の標準化とか品質といったところが関心領域でございます。現在は医療データ活用基盤整備機構で、特にリアルワールドデータを活用するための課題というところで、臨床学会のデータベース構築事業をお手伝いしながら、課題解決というところで実務的なレベルで現場の作業をしてまいっております。
 本ワーキンググループは、大変重要な取組だと存じますので、できる限りのお手伝いをさせていただければと思っております。
 どうぞよろしくお願いいたします。
○事務局 ありがとうございます。
 続きまして、岡村浩史構成員。
○岡村構成員 大阪公立大学医療情報医学の岡村と申します。
 私は、全ゲノム解析等実行計画で電子カルテのテンプレート機能を使って、FHIR形式で多施設の臨床情報を収集するというプロジェクトに参画させていただいております。
 また、私自身が代表をさせていただいているAMEDでは、私は血液内科医でもあるのですが、私の専門である造血幹細胞移植という治療を行った患者さんの多施設データをFHIR形式で収集するというプロジェクトも行っております。
 本ワーキングは、非常に重要だと思っております。私は臨床現場の医療者の立場、臨床研究者の立場、標準規格で多施設データを収集する立場から、尽力させていただければと思っております。
 どうぞよろしくお願いします。
○事務局 ありがとうございます。
 続きまして、清水央子構成員。
○清水構成員 皆さん、こんにちは。
 東京大学情報基盤センターの清水と申します。
 私は、もともと次世代医療基盤法の改正案についてのワーキンググループからこのような形で関わらせていただきまして、今、こちらの技術作業班の一つ上のアンブレラになるのでしょうか、ワーキンググループのほうでも構成員としてお手伝いさせていただいている立場です。
 私は、もともと製薬会社におりまして、その後、東京大学に移ってからも、民間のものも含めて、リアルワールドデータを実際に申請し、活用する立場を10年以上やってきましたので、ユーザーとしての視点から、どのような形で技術的なことが望まれるのか、使いやすい環境はどのようなものなのか等について、何かお手伝いできればと思って、参画させていただきました。
 よろしくお願いします。
○事務局 ありがとうございます。
 続きまして、田辺里美構成員。
○田辺構成員 IPA(情報処理推進機構)の田辺と申します。どうぞよろしくお願いいたします。
 私は、専門としましては、情報処理推進機構というセキュリティーの啓発をする法人におりまして、医療情報のセキュリティー面で様々にお手伝いする場面もあったのですが、そのほかに、実はAMEDでPO(プログラムオフィサー)という立場もやらせていただいておりまして、そちらでは、過去、NDBの研究事業であったり、現在ですと、様々な疾患領域のレジストリーの開発関係の評価をやらせていただいたりと、セキュリティー以外にも、医療情報の取扱いに関しては、研究も第三者的に拝見しているということで、そちらの経験も少しございます点と、今年の夏からは、全ゲノム解析事業のIT基盤チームで、メンバーとして全ゲノム解析事業の基盤整備に関しても少し関わらせていただいている状況ですので、今回、このような医療情報の利活用に係る二次利用の基盤構築という面も出てくると思いますので、そちらのお話も少し交えながら、皆様のお役に立てる情報の御提供ができればと考えております。
 どうぞよろしくお願いいたします。
○事務局 ありがとうございます。
 最後に、山口光峰構成員。
○山口構成員 こんにちは。
 独立行政法人医薬品医療機器総合機構医療情報科学部長の山口と申します。どうぞよろしくお願いします。
 PMDAは、医薬品の承認審査、安全対策、健康被害救済の3本柱の業務を行っています。その業務の一環として、医薬品の有効性・安全性に関する情報を収集して提供する役務を担っております。
 その業務の一貫として、MID-NETというデータベースを運営・管理していまして、製薬企業、行政、アカデミアの皆さんが使えるような形で運営・管理をしているところでございます。
 今回、医療情報の二次利用に関する検討を進めることになると思います。MID-NETは既に利活用者がいて、二次利用できる環境を提供しておりますので、その経験をフィードバックさせていただきたいと思っていますので、どうぞよろしくお願いいたします。
○事務局 構成員の皆様、ありがとうございました。
 続きまして、事務局を紹介させていただきます。
 医政局参事官の田中でございます。
○田中参事官 よろしくお願いいたします。
○事務局 医政局企画官の西川でございます。
○西川企画官 よろしくお願いします。
○事務局 医政局室長補佐の吉井。
 そして私、岡でございます。よろしくお願いいたします。
 また、厚生労働省の技術参与として、葛西重雄様にも御参加いただいております。
 そして、オブザーバーとして、内閣府健康・医療戦略推進事務局、デジタル庁、社会保険診療報酬支払基金にも御参画いただいております。
 続きまして、資料の確認をさせていただきます。
 今回の資料は、議事次第、資料1、資料2-1、資料2-2、資料3-1、資料3-2、資料4-1から資料4-3及び参考資料1でございます。
 もし不備等がございましたら、事務局までお申しつけいただけますと幸いでございます。
 それでは、これより議事に入ります。
 構成員の皆様、会議中御発言の際に「手を挙げる」ボタンをクリックしていただきまして、カメラをオンにしていただきますよう、お願いいたします。
 指名を受けてからマイクのミュートを解除し、御発言をお願いいたします。
 御発言終了後は、再度マイクをミュートにしてくださいますよう、お願いいたします。
 それでは、議題(1)でございます。
 「主査の選出について」です。
 資料1を御覧ください。
 「医療等情報の二次利用に関する技術作業班 開催要綱」の「2.構成員」の「(3)技術作業班に主査を置く。主査は技術作業班の構成員の中から選出することとし、必要に応じて、主査代理は、主査が指名することができる」とされております。
 本技術作業班の主査につきましては、事務局としては、一般社団法人日本医療情報学会代表理事の小笠原克彦構成員にお願いいたしたいと思いますが、いかがでございましょうか。
 小笠原先生、よろしいでしょうか。
○小笠原構成員 承知いたしました。
○事務局 ありがとうございます。
 それでは、小笠原先生に技術作業班の主査をお願いしたいと思います。
 小笠原先生、以後の議事運営をよろしくお願いいたします。
○小笠原主査 ただいま主査を仰せつかりました、小笠原でございます。
 構成員の皆様の御協力を得て、円滑な議事運営に努めてまいりたいと存じます。
 どうぞよろしくお願いいたします。
 なお、先ほど事務局からありましたように、開催要綱におきまして、主査代理は、主査が指名することができるとされております。
 主査代理につきましては、岡田構成員にお願いしたいと考えており、本人には御了承いただいておりますが、いかがでしょうか。
 特にないようでしたら、岡田先生、よろしくお願いします。
○岡田主査代理 御指名ありがとうございます。
 承知しました。
 よろしくお願いします。
○小笠原主査 それでは、早速、議題(2)に入りたいと思います。
 技術作業班の検討事項につきまして議論させて頂きます。
 事務局から資料2「医療等情報の二次利用に関する技術作業班の検討事項」を説明いただき、質疑応答に時間を取りたいと思います。
 それでは、事務局、資料2-1、資料2-2の御説明をお願いいたします。
○事務局 事務局でございます。
 まずは資料2-1を御覧いただければと思います。
 こちらは、これまでのワーキンググループでいただきました主な御意見につきまして、事務局においてまとめたものでございます。
 前回は、ワーキンググループにおきまして、参考資料1におつけしています「基本的な考え方、論点」について御議論いただいたところでございます。
 こちらは、お示しいたしておりました基本的な考え方と論点に分けて、各構成員の先生方からいただいた御意見をまとめさせていただいてございます。
 青字で記載してございますのが、直近の第2回のワーキンググループでいただいた御意見でございまして、黒字でお示ししているのが第1回ワーキングでいただいた御意見でございます。
 1ページ目が「基本的な考え方について」の御意見でございます。
 マル1~マル3は、次のページ以降の個別論点で記載させていただいてございます。
 2~4ページ目までが「論点①:公的DBで仮名化情報を利用・提供する場合の法制的論点」に関する御意見でございます。
 失礼いたしました。5ページ目までが論点①の御意見でございまして、6ページ目以降が「論点②:情報連携基盤の整備の方向性に係る論点」に関していただいた御意見を記載させていただいております。
 6ページ目をお願いします。
 末尾に※を付させていただいております御意見が、今般、こちらのワーキンググループの下に設置いたしました技術作業班において御議論いただく内容かと思ってございます。
 少し資料の投映が。
 もし差し支えなければ、先生方、お手元にお送りしております資料を御覧いただければと思います。
 論点②では「(1)取扱う情報の範囲」と「(2)情報連携基盤において必要となる要件」で「Visiting環境の整備について」とか「一元的な利用申請の受付・審査体制のあり方について」「求められる情報セキュリティ」「その他」というところで御意見をいただいておりまして、それぞれ御意見をまとめさせていただいております。
 9ページ目になりますが「論点③:医療DXの推進に関する論点」。
 そして、最後のページ、10ページ目になりますが「その他のご意見」ということでまとめさせていただいております。
 特に※が付されております、技術作業班に関係あるような論点は、先生方にも御議論いただければと考えているところでございます。
 続きまして、資料2-2「医療等情報の二次利用に関する技術作業班の検討事項」でございます。
 「検討項目(案)」ということで、大きく2つ記載させていただいてございます。
 (1)といたしまして「医療等情報の二次利用におけるデータ連携及び標準化、信頼性確保に関する課題及び対応策」でございまして、医療機関等におけるデータ入力、データ提出に関する課題・対応策。
 標準コードの管理と付与に関する課題及び対応策。
 あるいはデータマスター整備に関する課題及び対応策といった内容について検討していくことではどうかと考えてございます。
 (2)でございますが「情報連携基盤に関する検討事項」ということで、公的データベース等と情報連携基盤との接続、あるいは利活用者のVisiting環境等への接続等に関する要件。
 安全管理措置に関する要件。
 情報提供一覧の整理。
 情報連携基盤の取扱いを可能とする民間データベースに係る要件。
 あるいはダッシュボード機能等を備えたポータルの在り方ということで検討いただけると幸いだと考えてございます。
 先ほど開催要綱にもございましたが、基本的には議事は公開とさせていただければと思います。
 セキュリティに関するものなど、必要に応じて非公開としたいと考えてございます。
 一番下の「今後の進め方」でございますが、今般、初回を開催させていただきまして、今後、3月、4月と開催できればと考えてございます。
 4月に一旦、それまでの議論整理を行わせていただければと考えてございます。
 2ページ目でございます。
 「データ連携の全体モデル」あるいは「DB」「医療機関等」「情報連携基盤」に分けて、それぞれの論点について、さらに詳細に記載させていただいているものでございます。これらにつきまして御議論いただきたいと考えておるところでございます。
 事務局からの説明は以上でございます。
○小笠原主査 ありがとうございます。
 今の御説明について御意見、コメント等はございますでしょうか。
 はじめに、私から 資料について確認させていただきたいのですが、資料2-1で黒字と青字があったかと思うのですが、この違いは何かあったのでしょうか。
○事務局 事務局でございます。
 第1回目でいただいた御意見が黒字でございまして、直近の第2回のワーキンググループでいただいた御意見について、青字でお示しさせていただいているものでございます。
○小笠原主査 ありがとうございます。
 構成員の皆様方、いかがでしょうか。コメントとか御意見はございませんか。
 非常に幅の広いテーマについて議論しなければなりませんので、何かあればご質問頂かなければと思いますが、いかがでしょうか。
 それでは、挙手されている先生もいらっしゃらないようですので、この方向性に従って議論を進めていきたいと思います。
 では、続きまして、議題の3番目、医療等情報の標準化等のこれまでの取組につきまして議論したいと思います。
 資料3-1、資料3-2がありますが、それぞれ事務局と保険局医療介護連携政策課から順番に御説明いただき、その後、まとめて質疑応答の時間を取りたいと思います。
 それでは、事務局から資料3-1の御説明をお願いいたします。
○事務局 事務局でございます。
 資料3-1の御説明をさせていただきます。
 「医療等情報の標準化、電子カルテ共有サービスに係る取組について」でございます。
 まず、2ページ目でございます。
 こちらは、データヘルス改革推進本部の資料でございますが、これまでデータヘルス改革の中で、左下にございますように「医療・介護現場の情報利活用の推進」ということで、医療・介護現場において、患者等の過去の医療等情報を適切に確認、あるいは、それによって、より質の高いサービス提供が可能になるということで、取組を進めてきたところでございます。
 左下に「取組の加速化」という矢印がございますが、2ポツ目「電子カルテの標準化推進と標準規格の基本的な在り方の検討」ということで、取組を行ってきたところでございます。
 また、直近でございますが、3ページ目と4ページ目に医療DXの推進に関する工程表をお示しさせていただいております。
 こちらの工程表におきましては、3ページ目の「全国医療情報プラットフォームの構築」の中で、2点目にお示ししてございますが、電子カルテ情報共有サービスを構築して、共有する情報を拡大するということで、まずは3文書6情報からですが、こちらの電子カルテ情報の共有を進めることとなってございます。
 4ページ目でございますが「電子カルテ情報の標準化等」ということで、1ポツ目でございますが「2023年度に透析情報及びアレルギーの原因となる物質のコード情報について、2024年度に蘇生処置等の関連情報や歯科・看護等の領域における関連情報について、共有を目指し標準規格化」とございますし「2024年度中に、特に救急時に有用な情報等の拡充を進めるとともに」とございますように、順次、必要な情報について標準規格化等を進めていくとされておるところでございます。
 また、最後の「医療DXの実施主体」でございますが「社会保険診療報酬支払基金を、審査支払機能に加え、医療DXに関するシステムの開発・運用主体の母体とし、抜本的に改組」ということで、支払基金に医療DXの実施主体としての機能を持たせて、改組していくと書かれているということでございます。
 5ページ目にお示ししてございますのが、医療DXの推進に関する工程表の全体像でございます。
 6ページ目でございます。
 「保健医療情報の閲覧の仕組み」ということで、①、②とお示ししてございます。
 ①が、御自身の医療情報を御自身が閲覧できるようになる仕組み。
 ②といたしまして、医療機関間で必要な医療情報を閲覧できるようになる仕組みという2つの形態が存在していると考えておりますが、2番目の「標準化を進めている所」と真ん中にお示ししておる部分です。データの外部出力の機能でしたり、出力データの構造化みたいなところの標準化をまさに進めてきているところでございます。
 7ページ目でございます。
 令和元年11月に取りまとめていただいております「技術面から見た標準的医療情報システムの在り方について」の概要でございます。
 真ん中の中ほどでございますが「今後の医療情報システムに求められる考え方」の「目的」に赤字で記載されている部分でございますが「統一された電子カルテ、画一化された製品は現実的ではない」と示されておりまして、その下の「具体的な対応」でございますが、HL7 FHIRの普及が一つの方向性ではないかというところと、標準的なコードを拡大していく、検査・処方・病名等の必要な標準規格から実装していくことが必要だと取りまとめていただいているところでございます。
 8ページ目でございます。
 「厚生労働省標準規格化に向けた進め方」でございますが、既に上段にお示ししてございます診療情報提供書等のFHIR記述仕様書ができておりまして、下の図でお示ししてございますように、規格作成団体からHELICS協議会での審議を経まして、厚生労働省の保健医療情報標準化会議の審議を経た後に、厚生労働省の標準規格化となっているところでございます。
 9ページ目にお示ししてございますのが、「ネットワーク上で共有・交換できる医療情報の拡充見通し」でございますが、真ん中の青枠で囲われております3文書6情報が現時点で標準規格化がなされているところでございますが、今後、さらに医療機関等で共有が必要・有益な情報・文書などへ標準規格を順次拡充していくところで検討を進めているところでございます。
 10ページ目「電子カルテ情報共有サービスの概要」でございます。
 先ほど申し上げました3文書6情報は、左の枠の中に記載がございますが、現在、こちらの共有を目指して構築を進めているものでございます。
 こちらは、患者さんについて、患者さんのデータを特定する必要がございますので、被保険者番号を活用することを検討しながら、検討を進めていただいているところでございます。
 被保険者番号につきましては、健康保険事業とこれに関連する事務以外に用いるものについて制限をする告知要求制限が設けられておりますが、今後、こちらを活用できるように整理を進めてまいるところで考えておるところでございます。
 11ページ目でございます。
 「3文書6情報の概要」ということで「医療等情報利活用ワーキンググループ」で先日、1月24日に御議論いただいたものをお出しさせていただいてございますが「6情報」の真ん中の「主要コード」に記載しておりますそれぞれのコードについて、使用することとしてはどうかということでお諮りさせていただいているものでございます。
 12ページ目でございますが、それぞれなぜそのコードを採用するのか、理由を書かせていただいているものでございます。
 13ページ目でございますが、顔リーダーの改修ということで、これまでの検討を踏まえまして、顔リーダーで閲覧を同意するところに関します画面の遷移のイメージをおつけさせていただいてございます。患者は、医療機関ごとに同意を設定するものでございます。
 14ページ目でございますが、その閲覧の同意につきましては、カードリーダーでの待ち時間解消という観点から、事前にマイナポータルで設定しておく、あるいは前回受診日のときの記録から設定できるような機能も設けるということで検討を進めておるということで、御参考でございます。
 資料3-1に関する御説明は以上でございます。
○小笠原主査 
 それでは、続きまして、保険局医療介護連携政策課から資料3-2の御説明をお願いいたします。
○保険局医療介護連携政策課 それでは、資料3-2を御覧ください。
 「医療・介護データ等解析基盤(HIC)の現状と取り組みについて」という資料でございます。
 おめくりください。
 現在、レセプトや特定健診の大規模なデータベースであるNDBに関しては、提供の抜本的な見直しを行っております。
 こちらの抜本的見直しの根幹になっておりますのがHIC(医療・介護データ等解析基盤)、つまり、クラウドの解析基盤でございまして、左の図で示しておりますように、一部の小規模なデータセットに関しては、既にHICでの解析が可能となっております。
 2024年秋に向けて、より大規模なデータについても解析ができるように、現在開発を続けているところでございます。
 HICですが、現在、主としてNDBを解析することになっておりますが、右側にデータベースを並べておりますように、様々なデータベースの解析を可能とする構想の下に検討が進められてきたものでございます。
 HICの中には、解析ツール等もございまして、データのアップロードや成果物のダウンロード機能も実装されています。
 まずは、HICのセキュリティー要件について、簡単にお話しいたします。
 全ての項目を詳細にお話しすることはできませんが、右側の赤枠にありますように「不正プログラム対策」や「ファイアウォール機能」はもちろんですが、主体認証とかアクセス制御によって運営側でアクセスを管理すること、
 また、運営側でログの管理とか利用状況の監視をすることで、Visiting環境の安全管理措置をオンプレミスに比べて用意しやすいものにしております。
 細かいセキュリティー要件に関しましては、5ページ目、6ページ目に参考でお示ししておりますので、後ほど御覧いただければと思います。
 7ページ目までお進みください。
 こちらが「利用者に求める要件」となっております。
 今、画面が映っておりませんが、お手元の資料で御確認ください。
 まず、このような公的なクラウド解析環境が初めてでございましたので、まずは下の緑色の四角に書いておりますように、現在用意しておりますNDBの特別抽出に倣いつつ、HICでは、先ほどお話ししたように、ログインの管理とか利用状況の監視ができることを鑑みまして、どの点は緩和できるかという観点で、まずは安全管理措置を設定いたしました。ですので、主な点は赤字で示しておりますような要件をガイドラインにお示ししております。
 例えば入力ミスでHICのアカウントがロックされるという制御を設けている他、これまでオンプレミス環境では必ずスタンドアローンのパソコンを使うようにと言っていましたが、クラウド解析基盤になりますので、もちろん、無線LANの不正アクセス対策をした上で、インターネットを介して接続いただくことを許可しています。
 ガイドラインに詳細な安全管理措置をお示ししておりまして、NDBの第三者提供に関するホームページで御覧いただけますので、併せて御確認いただければと思います。
 こちらに、オンプレミスの場合とHICの場合での主な違いをまとめております。
 右側がNDB、オンプレミスの場合で、左側がHICです。
 例えばですが、アクセス制限を運営側で行いますので、NDBで求められているような厳しい入退室管理及び記録の保持は求めておりません。
 公共の場所で利用するわけにはいきませんが、職員の方のみが入れるような場所であれば取り扱ってよいとしております。
 そのほか、一番下の2行を御覧いただきますと、これまではデータを消去した際に、その消去の証跡まで御提出するように求めておりましたが、こういったデータの消去とかログの管理は運用側でできることになりますので、こうした管理は利用者の方にしていただかなくてもよいこととなっております。
 9ページにお進みください。
 そのほか、備えている機能といたしまして、マスター等を解析機関に持ち込んで使われる利用者様は多いと思いますので、そういったことを可能にしておりますのと、解析環境からの成果物の取り出しに関しましても、厚生労働省のチェック後に可能となるようにしております。
 10ページにお進みください。
 先ほどお話しした内容のガイドライン上の記載になります。
 利用を終了したときには、利用者様の側でオンプレミスの上の消去とか、その証跡を御提出いただく必要はございませんで、終了したときは、運営側に終了書を提出していただき、運営のほうでHICから解析環境の破棄を行うことにしております。
 最後に、11ページは御参考になります。
 先ほど様々な公的データベースが使えるような構想と申し上げましたので、現時点での連結等に関する進捗状況を一覧にしてお示ししております。
 資料3-2の御説明は以上です。
○小笠原主査 ありがとうございます。
 構成員の皆様方、御質問、コメント等はございますでしょうか。
 清水構成員、どうぞ。
○清水構成員 清水です。
 御説明ありがとうございました。
 私一人混乱していたら大変申し訳ないのですが、今回、これらのデータベースの「連結」という言葉と「連携」という言葉が書かれているのですが、「連結」と「連携」はどう違うのか、分からなくなってきたので、今目指している「連結」の意味をもう一度別のかたちで御説明いただくことは可能でしょうか。
○事務局 ありがとうございます。
 事務局でございます。
 再度、先ほど資料3-2の最後のほうで、連結解析に向けてということで御説明させていただいておりますものにつきましては、各公的データベースから抽出した情報、あるいは次世代DBから抽出した情報について連結することが可能な状態で提供することができる規定の整備が進められているといった趣旨での「連結」ということでございます。
 一方で「連携」を使わせていただいているところがございますが、今後、情報連携基盤などが構築されるに当たりまして、情報連携基盤に連携していくところ。
 これは必ずしも情報同士の連結を含まない概念かと思っておりますが、そうした意味で「連携」と「連結」を使い分けておるところでございます。
○清水構成員 「連結」のほうについては、必ずしも個人IDでつなぐという意味ではなくて、複数のデータベースから、例えば同じ患者さんの同じ診療に関する情報を一つにまとめて載せることを「連結」と呼んでいるという理解で正しいのでしょうか。
 「連携」のほうは、データをつなぐという意味で分かったのですが「連結」のほうについてもうちょっとご説明いただけますでしょうか。
○事務局 ありがとうございます。
 事務局でございます。
 「連結」につきましては、個人の情報をひもづけるということで、それで用いる識別子につきましては、今、それぞれ検討されているところでございますが、個人としての情報をひもづけた状態で提供することができるといった趣旨での「連結」でございます。
○清水構成員 分かりました。
 ありがとうございます。
○小笠原主査 ほかにいかがでしょうか。
 足立構成員、御意見等はございますか。
○足立構成員 ありがとうございます。
 私からお伺いしたいのは、今回御紹介いただいたHICは、他の公的データベースとの連結というところで、民間のDBで、次世代医療基盤法に基づく民間データベースのこともここで例示されているかと思いますが、今回、この部会で議論することが予定されている連携基盤と、HICの拡張というところで、今後、このようなDBを取り込んでいきますというところの範囲が、電子カルテの情報を除くと、ほぼかぶっているような印象があるのです。
 HICの今後という部分と、今回、この作業部会で議論する対象となる連携基盤の役割とかポジションがかぶるのか、異なるものとされているのかについて、事務局から御説明いただけると助かります。
○事務局 事務局でございます。
 まさに先ほど御紹介いただきました、今、画面上にお出ししてございますHICと公的データベースは、まずはNDBと介護DBでございますが、これらが解析可能な環境として構築を進めておるところでございます。
 今後、情報連携基盤を構築していくということで、こちらのHICの取組を念頭に置きつつ、それを拡充する形かと思いますが、HIC、情報連携基盤を用いて、一定の要件を満たすような民間のデータベースも、こちらの情報連携基盤上で取り扱えるようにすることも考えられるのではないかということで、ワーキングでも御議論いただいているところでございます。
 まさにこちらの技術作業班では、民間データベースについて、どうした要件が考えられるかといったところでの御議論をお願いできればと考えているところでございます。
○足立構成員 ありがとうございます。
 つまり、今回議論するものが、今後拡張されていくHICのようなものになるかどうかは、一旦さておいて、機能上、異なるものをつくるかどうかという話はさておき、おおよそこういうデータベースを取り込む連携基盤の仕様について議論できればよいと理解しましたが、そちらで問題ないでしょうか。
○事務局 はい。そちらの御認識のとおりでございます。
○足立構成員 ありがとうございます。
○小笠原主査 ありがとうございます。
 山口構成員、どうぞ。
○山口構成員 ありがとうございます。
 私は親会議に出席しているため、検討の流れを理解しているつもりですが、重要なことゆえ、改めてもう一回質問させていただきます。この図は、非常に重要であると考えています。足立構成員からも質問がありましたが、HIC基盤を拡張する話と、新しい基盤をつくる話ではかなり違うと思います。HIC基盤におけるログ管理等の安全管理の要件については、新しい基盤であってもHIC基盤に寄せればいいのかなと思います。
 一方、資料3-2の8ページに示される利用者の端末を接続する場所の要件については、これまでもいろいろと御尽力いただいていると思いますが、利便性を考慮して、利活用者が使いやすいように構築したほうがよいと思います。そのためには、HIC基盤やその他の基盤の場所について何が使いにくいかを明らかにし、その部分をもっとよくするようにしていただければと思います。そういう提案をしたいと思いますので、いかがでしょうか。
○小笠原主査 こちらは、事務局へのご質問ですね。
○山口構成員 そうですね。
○事務局 事務局でございます。
 まさに現在のHICの取組を参考にしながら、同様に対応できるところは対応しつつ、さらに改善できるところは改善し、情報連携基盤を構築していくということかと思いますので、利便性等の観点から、どういったものを設けていくべきかということについて、ぜひ今後も御議論いただければと考えてございます。
○山口構成員 この資料を見る限りになりますが、NDBのガイドラインは、右側より左側のほうがかなり利活用者の利便性を考慮して作成されているのではないかと思っています。
 分かりやすく言えば、会社内からの接続であれば問題なく、ネットカフェ等の会社外からの接続は駄目ですよということになると思います。公衆環境による接続は駄目であるが、ある程度セキュリティーができる場所があればいいですよと書いているような気がしますので、これに近い形でまとめられればと思いますので、よろしくお願いいたします。
○小笠原主査 構成員の皆様方、いかがでしょうか。ほかにございますでしょうか。
 セキュリティーの観点から、田辺構成員、お願いいたします。
○田辺構成員 田辺です。
 ありがとうございます。
 今、山口先生からもお話がございましたが、セキュリティーの観点で、ガバナンスを標準化して、どこを使っても同じレベル感で守られている状態をつくる意味ですと、HICの基盤がありますので、先ほど図で示していただいた、まさに左側にあったセキュリティーの監視の部分は、それを踏襲していくというか、基盤上で同じものを使っていくという考え方かと拝察します。
 ログの監視等とか、この部分は共通的に使っていくということで、あまりあちらにもこちらにも同じような基盤があるのは、管理上も二重、三重になっていきますし、どこかでセキュリティー上のホールができてしまう可能性もございますので、基盤については、恐らく、そんなにたくさんあれもこれもということにはならないかなと。
 ただ、クラウドの中ですと、比較的安全にゾーンを切っていけますので、そのゾーンごとにそれぞれの目的に合った使い方をしていくというやり方もございますし、今回、特にVisiting環境という名前で、外からクラウドにアクセスする利用方法もあると思います。今までのように、専用の部屋を作って、そこに行かないと使えない状態ではなくて、アクセスが許された利用者がアクセスするという状態を持っていただければ、解析環境にアクセスして使えますよというほうが、利便性も上がりつつ、ある一定のセキュリティーを担保するという意味では、この方式はよいのではないかと拝見しております。
 今、私が関わらせていただいています全ゲノム解析事業でも、こういった形で一極集中的に基盤として持ち、研究者の方々がそちらにアクセスするようなものですと、Visiting環境という言葉ではなくて、Trusted Research Environmentという安全なリサーチ環境の整備として、仮想のデスクトップを御利用いただくものも今まさに開発しようとしているところでございますので、そういったものも併せて考えていけるといいのではないかと思って拝見しておりました。
 以上です。
○小笠原主査 ありがとうございます。
 ほかにございますか。
 足立構成員、お願いします。
○足立構成員 医療データベース協会の足立でございます。
 今、議論に上がったセキュリティーは、もちろん、細目についてはこれから議論されるところだと思うので、議論の前提として、現時点で決まっているものではないと思いますので、少しお話しさせていただくと、セキュリティーの要求水準は、昨今はしゃくし定規にいろいろと決めるというよりは、通常はデータの機微性とか個々の状況に合わせて、リスクベースでどういったセキュリティー水準を設定するかというところが議論されるかと思いますが、親会であるワーキンググループも含めて、取り扱う情報とかVisiting環境で実際に触ることができるデータの要保護性というか、どの程度の水準で安全を確保すべきかというところがどうしても議論する前提になるのです。
 何となく安全を確保しなければいけないというレベルだと、要求水準の設定がどうしても感覚的なものに陥りがちなので、実際、どういったデータを取り扱うことができるのかとか、どういったデータを取り込むことが予定されているのかというところが割と前提になるので、今後、技術作業班の中で検討していくに当たって、多分、取り扱うデータのスコープを決めるのがセキュリティーの議論をする前の前提事実になるかというところで、議論の順番について、少し御配慮いただければと思っております。
 以上です。
○小笠原主査 ありがとうございます。
 今の御提案も含めて、次回以降、取り入れていく必要があると考えています。
 私個人の意見になりますが、医療情報が発生している医療機関のセキュリティーが原則ではないかと思っています。ですので、それ以上であると、今度は逆に使いづらくなりますし、それ以下だと、医療機関側としては結構怖いだろうと思います。ここら辺は標準的な医療機関のセキュリティーがベースではないかと思います。
 ほかにありますでしょうか。
 お時間もありますので、最後に時間があれば、また少し御議論いただくとしまして、次の議題に移らせていただきたいと思います。
 議題の4番目でございます。
 医療等情報のデータ連携、標準化及び信頼性確保に係る課題について議論したいと思います。
 それでは、資料4-1、資料4-2、資料4-3がありますが、それぞれ清水先生、山口先生、岡田先生から順番に10分程度で御説明いただき、その後、まとめて質疑応答の時間を取りたいと思います。
 それでは、まず、清水構成員から資料4-1の御説明をお願いいたします。
○清水構成員 どうもありがとうございます。
 清水です。
 声は入っていますでしょうか。
○小笠原主査 はい。よく聞こえております。
○清水構成員 こちらの資料は、これまでお見せいただいた資料を十分に拝見する前に作った部分もありますので、一部重なっていたり、皆様には釈迦に説法的なところもあると思いますが、その辺は適宜飛ばしながら10分ほどでお話しさせていただければと思っております。
 今回対象としているのは、公的データベーを中心とするリアルワールドデータについてのお話だと理解しております。
 私は、先ほど申しましたとおり、民間の製薬会社から医療データに関わるキャリアをスタートしたこともありまして、民間のデータベースにつきましては、2000年代真ん中頃から使わせていただいています。
 最近では、NDBをかなりがっつり使わせていただきながら、利用にあたっていろいろな課題を感じているということで、その経験を踏まえてお話しさせていただきたいと思っております。
 歴史的にはこのような感じでありますし、日本には、今回のテーマに挙がっていないようないろいろなデータベースがあるのですが、次のページをお願いします。
 これが恐らく、一番網羅的に載っているのではないかと思うのですが、このようにいろいろなデータベースがある中で、今回は特に公的データベースを中心に連結を進めていくということだと理解しております。
 データベースを大きく分けると、レセプトとカルテベースのものに分かれるかと思いますが、一つ押さえておきたいのは、NDBをはじめとして、日本の医療情報データの中心はレセプトであることです。
 レセプトが何であるかは、ここでは釈迦に説法だと思いますので、お話は省略しますが、レセプトという話になると、レセプト病名、あるいは検査結果が分からないなどの課題が挙がるのですが、現実の問題として、今、日本の医療情報の中心はレセプトになることを前提に考えて、そこにカルテ等の情報をどう含めていくかを検討するべきではないかと考えております。
 いろいろなデータベースがありますが、それぞれのデータベースは、N数がどれくらい取れるのか、どんな項目が取れるのか等について、表などにまとめたものはよくあるのですが、私は、こういう形でいつもまとめています。
 このように説明すると、皆さん分かりやすいとおっしゃってくださるので、今日も釈迦に説法かと思いながら出させていただいたのですが、各データベース、あるいは左上には厚労省が出しているオープンデータなども載せさせていただきました。世の中に医療情報データはいっぱいありまして、特に最近、どんどん新しいものができてきているのですが、情報の粒度、悉皆性という観点でみると、どうしても相反するものがあります。
 次にエンターしていただくと、45度の線が出てきますが、情報の粒度を高めようと思うと、どうしても悉皆性は下がる。逆に情報の粒度を下げても、全国をカバーしようと思えば、それなりのN数が取れる形になるので、データベースは、この45度の線の上に大体並びます。特に民間のデータベースは、固有名詞はここでは書かせていただいておりませんが、右上にあるピンクのものなどは、企業努力されているので、粒度もそこそこ高いし、悉皆性もそこそこ高い形で、実際に使い勝手もいいですすし、日本の医療情報データの中でよく使われているのは民間のデータベースになっている、という現実があるかと思っています。それをいつもこんな形でまとめて、考えるようにしております。
 民間のデータベースについては、とても高価ではありますが、高かろう良かろう、となっています。我々がこれから公的データベースを連結していこうという話のときに、安かろう悪かろうではいけないので、そういう意味では、次の次のステップだということはもちろん十分に理解しているのですが、民間のデータベースも、ある程度ベンチマークとして視野に置いておくべきではないかと考えております。
 ビッグデータという言い方を時々するのですが、日本ではスモールデータが散在していて、トータルではビッグデータになっているというのが現実ではないかと思っています。
 ただし、これらのデータベースをうまく組み合わせれば、何とか全体像も分かるようなところまで来たということなので、今回の公的データベースを連結していきましょうというお話はとてもいい方向ではないかともちろん感じております。
 民間でよく使われているJMDCさんであったり、メディカル・データ・ビジョンさんであったりについて、それどれが一番いいという話は全くなくて、それぞれに一長一短があるので、それをNDBを真ん中に書いて比較したものになります。先ほど申し上げましたとおり、悉皆性と粒度という観点からいうと、それぞれ特徴がある状況になっています。今ある公的データベース等を中心に連結していくことにより、この全体をいい形に持っていこう、というお話ではないかと理解しております。
 ただ、現実は、今、このような形でそれぞれにプロコンがある状況です。
 これは、それぞれ悉皆性と情報量でどのように推移されているか、まとめてみましたので、もし御興味のある方は、参考に見ていただければと思います。
 ここからが本題で、あと時間が半分なのですが、ワーキンググループのほうでも出てくるのですが、医療情報は非常に機微なデータだということで、セキュリティーを強化しようと思うと、どうしても使い勝手が下がってしまう。
 どうしてもセキュリティーを厳しくすることで、使い勝手が置き去りにされていくというのが現実にある状況かなと思っているので、セキュリティーがきちんとしていて、なおかつ、使い勝手もそこそこいいという落としどころ、中庸点を見つけるかが鍵になるのではないかと思っております。
 これを進めていくためには、データ自体の質の向上もまだまだ必要ですし、そこで適正なセキュリティー要件を構築する。そこの落としどころをどこにするかというのが今回の技術班の大きなテーマではないかと理解しております。
 データの質の向上については、一つだけここで申し上げておきたいのが、マスターの整備の話で、このお話は、今日、この後のお話にも出てくるようなのですが、
 マスターにつきましては、傷病名、医薬品、診療報酬、JLACのような検査あたりが必要になるということでお話しに挙がりますが、ほかの方から出ていなかったので、「医療機関マスター」、歯科も含めて全国約18万軒のマスターをここであえて加えさせていただきたいと思います。
 というのは、例えばNDBを解析していますと、全国をすべてカバーしている、悉皆性が高いというのは非常に優れた点なのですが、医療機関は特定できないまでも、同じ医療機関かということを過去10年間のデータの中で結びつけることが非常に難しいケースがあるので、医療機関マスターをマスターデータの一つとして加えていただけたらと思って、1枚加えさせていただきました。
 現在、例えばNDBなどは、マスターを自分で用意して、自分でやるようにということなのですが、そうではなくて、今回の解析基盤に、ここにあるような医療機関も含めたマスターを置いておくべきではないかと思っておりますので、その中に医療機関をぜひ加えていただければと思います。
 カルテなのですが、カルテのデータで、どういうものをつなごうとしているかという話は、私も先ほど拝見して、理解したつもりなのですが、カルテに書いてある情報は、どこに書いてあるか、同じ病院の中で、同じ項目についても非常にばらばらです。
 これは私のチームの研究で、乳がんのサブタイプがどこまで分かるのかということ調べたときの結果なのですが、抽出されたカルテのデータからは、75%しか分からなかった事実があります。標準化というときに、目的を決めて項目を選んでいかないと、どうしても漏れてしまうということで、カルテの情報を一元化するときには、この辺は考慮が必要かと考えております。
 すみません。あと2~3枚なので、よろしくお願いします。
 それから、解析環境の話で、先ほどの比較表もありましたが、NDBはHICによって昔の状況とは大分変わっているとは思いますが、ここで2点だけお話しさせてください。
 1点目は、セキュリティーという話をしたときに、悪意のある第三者による情報の不正取得という話と、悪意ある利用者が目的外使用をする話、データから個人が特定できてしまう可能性、これら3つは全部違うものだと思うのですが、しばしばこれらが一緒にディスカッションされているようなことがあるように思います。そもそも悪意があるという前提に立って物事を決めていくとなかなか難しいので、悪意がある人をどう検出して、その人に使わせないようにするかという観点でいくべきであり、悪意のある人が悪意ある行為をできないようにとがんじがらめにして、結果非常にちぐはぐな状況になってしまっているのがNDBの現実ではないかと思っているので、加えさせていただきました。
 その後、2~3枚あります。
 NDBは、以前はまさにコロナの時期だったので「三密」という言葉を使わせていただいたのですが、こういう状況だったのですが、今回、Visiting環境を可能にしようということで、こういう話がなくなってくれればいいなと考えております。
 あと、ネットワークのセキュリティーに関してなのですが、私は、2年ぐらい前だったのですが、実際に東大の中でつないでやることが不承諾になってしまいました。
 右上に書いてあるのがその不承諾の理由だったのですが、正直に言って、納得いかなかったのですが、不服申立てもできないということで、断念しましたが、今回、ネットワークの安全性を考えるときに、HICのお話を聞いていると、大分このときとは変わっているのかなと思いながら、いわゆる情報ネットワークのセキュリティーに関しては、かなり明確な基準を設けていただきたいと思っております。
 あと一つ、外部にデータを公開するときのK匿名化の話なのですが、これはあまりディスカッションになっていないので、あえてここで一言申し上げておきたいのですが、これはNDBオープンデータの例なのですが、集計表を作るときに、個人が特定できてはいけないということで、医薬品ですと、1,000単位よりも下の場合にはハイフンにしなければいけないというルールがあります。
 NDBで公開するときにも、内容によって10未満だったり、100未満だったり、例えば1,000未満をハイフンにするとして、980か、355かということが分かったときに、なぜこれが個人の特定に結びつくのかがよく説明されていないと思うのです。
 そういう意味で、集計して、公開するときに、個人が特定できるという話とK匿名化の話もごちゃ混ぜになっているような気がするので、この辺もできれば検討に加えていただけたらと思っております。
 最後の1枚になります。
 次世代医療基盤法でのシステムなのですが、今まで解析者のほうで解析環境を用意しなければならないとあったのですが、今回、HICをベースにつくっていくことになりますと、そういうことはこちら側として提供するのかなということで、いい方向ではないかと思っております。
 次のページなのですが、真ん中の情報連携基盤をつくって、いろいろなデータセットを抽出して、そこに置いておいて、Visiting環境でアクセスして解析を行うという話で、これからこの情報連携基盤について、HICをベースにいろいろなことを考えていこうというお話だと思うのですが、最後の1枚。
 私は今、東京大学の情報基盤センターにいるのですが、そちらが管理しているスーパーコンピューターがございます。
 「Wisteria」というマシンで、実はもともと公の機関、大学、公共機関等が自由に研究等に使えるようにということで導入されたものです。
 ただ、実際には、まだあまり活用が進んでおらず、キャパが十分に余っている状況です。このマシンは、本当に電気代ぐらいで使わせてくれるものなので、例えばAmazonなどに比べても安いですし、こういう公の研究のために活用されるべきものですので、このような可能性なども視野に入れながら、できるだけキャパの大きいものをきちんと用意する形にしていただけたらと思っております。
 というのは、例えば、今NDBでは東京大学、京都大学、厚労省の中にオンサイトリサーチセンターがありますが、ここにあるマシンは、既にある予算の中で用意したものなので、正直に言って、非常にキャパが低いものになっています。
 こういうスーパーコンピューターのような大きなキャパを持っているものの中でやる形にすれば、コストの問題もある程度低減されますし、今回、このようなことも幅広く考慮しながら検討できたらと思っております。
 以上です。
 よろしくお願いします。
○小笠原主査 御提案も含め、御説明ありがとうございました。
 続きまして、山口構成員から資料4-2の説明をお願いしたいと思います。
 よろしくお願いします。
○山口構成員 よろしくお願いします。
 PMDAの山口です。改めてよろしくお願いします。
 私からは「MID-NETの品質管理・標準化」について説明します。PMDAでは、MID-NETというデータベースを運営・管理しています。その状況を御説明させていただきます。
 「MID-NETの概要」について説明します。
  MID-NETは、2018年利活用の受付を開始したデータベースです。全国10拠点23病院に御協力いただき、データベースを構築・運営しています。
 PMDAが医薬品医療機器総合機構法に基づく業務の一貫として運営・管理を行っています。
 各病院に統合データソースというデータベースを設置しています。
 データ規模は、10拠点のデータを合わせると、昨年末で605万人となりました。
 現在、徳洲会10病院を追加する作業をしておりますので、かなり大きなデータベースになる予定です。
 品質管理された医療情報データベースと言われており、高い信頼性を確保しております。
 PMDAの安全対策部が安全対策に活用するとともに、製薬会社が製造販売後データベース調査を実施しています。
 行政利活用においては、限定的ではありますが、定型的な解析の自動処理も行っています。
 病名、処方の情報に加えて、350項目以上の検査結果を利用可能です。
 専用ホームページで情報発信していますので、ぜひ御確認いただければと思います。
 「MID-NETシステムの全体像」について説明します。
 先ほどもご説明いたしましたが、協力医療機関10拠点のそれぞれに統合データソースというデータベースを設置しています。ここがポイントになっております。電子カルテシステムの各種データは「標準化ストレージサーバ」を通りまして「統合データソース」に蓄積されています。
 電子カルテシステムは、病院ごとに多種多様になっておりますので、電子カルテの情報を統合データソースにいかに正確にデータを蓄積するかがポイントの一つです。また、統合データソースには、標準化されたデータ、すなわち標準コードが付与されているデータをいかに蓄積するかがポイントの一つです。
このように各協力医療機関の統合データソースには、品質が確保され標準化されたデータが蓄積されています。
 利活用については、オンサイトセンター、または企業内のリモート接続環境、いわゆるVisiting環境から実施することができます。
 利活用者は、オンサイトセンター又はリモート接続環境から遠隔の操作でスクリプトを作成して、抽出条件を書かれたスクリプトを医療機関に送付します。
 その結果、送付されたスクリプトは統合データソースで処理されます。
 医療機関により承認されると、統合データソースからデータセットが抽出され、そのデータが外部データセンターに送られてきます。10拠点で処理されるため、結果的に外部データセンター10個のデータセットが送られてくる形になります。
 そして、利活用者は、これらのデータセットについて統合解析等を行い、その解析結果(統計情報)を持ち出して、論文等を作成する形になります。
 利活用者は、協力医療機関にはアクセスできず、外部データセンターにのみ接続できる仕組みです。
 運用開始当初は、利活用者の皆様にPMDA内のオンサイトセンターに来訪いただいていましたが、現在は、利便性の向上ということで、リモート接続環境からも接続できるようになっています。
先ほども説明したとおり、統合データソースに正確に、また標準化されたデータを蓄積するかがポイントになっております。
 「MID-NET運営の道程と品質管理」の歴史について、説明します。
 我々のデータベースは、2010年に、薬害肝炎の検証委員会から示された「データベースを活用した安全対策提言」において医薬品の安全対策に資するデータベースをつくりましょうと提言されたことを契機に構築が開始されました。
 基盤構築開始は2011年、ハードウエア導入は2012年、データ送信は2013年から開始しました。
 その後、2018年に正式な運用を開始しており、現在では、製薬企業等のデータ利活用者がいる状況でございます。
 重要なポイントになりますが、2013年からデータの送信を開始し、2014年からPMDAで試行的な調査業務を実施しているのですが、この段階で継続困難な分析上の懸念が発生しました。
 当時十分に検証した結果、2015年にはデータベースにデータが正確に蓄積されていないという結論に至り、手探りで品質管理作業を開始しました。試行錯誤しながらその品質を維持できるようになりましたので、2018年に外部利活用の受付を開始しました。このように、MID-NETは、現在、品質を管理、維持していることを説明していますが、このような歴史もありましたという御紹介させていただきます。
 左側は、2015年の頃のデータ品質を示しています。青色は、病院情報システムの情報が統合データソースに正確に移行されている情報の部分です。黄色は、不一致がある情報の部分です。赤色は、電子カルテにしかない情報とか、統合データソースにのみ情報がある部分です。このようにはじめはたくさんの差異がありました。
 品質管理を実施したことで、右側のように、いわゆる電子カルテの情報と統合データソースのデータが件数・内容とも一致するようになりました。
 差異の原因はいろいろありますが、御確認いただければと思います。
 そのような歴史がありましたので、我々は、信頼性を確保する仕組みとして「MRDA(MID-NET Real-time Data-quality Assurance)」MRDAという仕組みを導入し、運用しています。具体的には担当者を明確にして、基本方針、品質管理計画、手順書に基づき、記録を残しながら品質管理を実施しています。いわゆるQuality by Designを実践しています。
 品質管理計画における「信頼性確保の3要素」を簡単に説明します。
「1.システムの品質管理」においては、一般的にシステムベンダーが行っている導入時のバリデーションに加えて、PMDAも別の角度から検証を実施しています。
 原則、導入時と改修したときには必ず検証作業をやるようにしております。
 そのほか「データの品質管理」ということで、定期的にオリジナルデータとの一致性を確認しています。また、日常的品質管理も行っております。
 データの品質管理については、先ほど説明したとおり、病院情報システムから統合データソースに正確にデータが移行されていることを確認しています。具体的には、毎年1回、病院情報システムと統合データソースの両者からデータを抽出し、件数・内容を比較して、間違っていないか、確認しております。
 比較対象期間は、全期間ではなく、1か月と決めております。
 データの送信状況は、電子カルテのリプレース、運用変更により変化します。そのため、電子カルテデータについては、定期的に全医療機関で確認しています。
 一方、レセプト・DPCのデータは、基本的に全医療機関で同じ仕様であるため、代表医療機関で比較作業を実施しています。
 問題があった場合には、運用保守業者に修正を依頼しておりますので、ほぼ100%一致する形で維持できています。
 電子カルテはずっと同じ環境で運用されておらず常に変化します。また、5年に1回はリプレースがあります。さらに、運用方法も変更になります。その結果、データの色は結構変わるので放置することはできません。
 日常的品質管理の例でございます。
 PMDAは、日々、管理情報を自動収集し、その情報をモニタリングしています。
 通常時は、土日や祝日のデータ量がちょっと減り、その他の日は一定程度のデータが送れています。
 異常発生時には、データが全て無くなってしまうようなことが起きます。このような異常をなるべく早く察知して、保守ベンダーに連絡して、修正するようにしているところです。
 1年に1回確認するとともに、日々データのモニタリングもしているのです。
 次に、標準化について説明します。データベースのデータは、標準化されていなければ利活用することができません。一方、全ての医療機関が電子カルテのデータに対して標準コードを付与しているわけではございません。
 この検討会でも議論されることにはなると思いますが、標準コードの管理は非常に重要です。複数の病院のデータを統合して解析するためには、統一的なデータ標準化が必要になります。
 MID-NETでは、統合データソースへのデータ取り込み時にデータを標準化しております。
 全医療機関が全く同じように標準コードを付与していれば、こういう作業は発生しないと思いますが、医療機関には医療機関の事情がございますので、多くの医療機関は基本的にはローカルコードを使って運営しているところです。標準コードでの管理は、日本としては進んでいない状況ではないかと思っております。
 もう一つ紹介させていただきます。検体検査についてです。
 検体検査については「検体検査実施頻度」「安全対策の観点」を考慮し、優先の高いコードを標準化対象に選定しているところです。
 また、結果値換算や単位の統一化も実施しているところです。
 データの分布等を確認して、コードのつけ間違いがないか等も確認します。
 同じ評価物があっても、測定法が違ったら、検査項目は当然違います。医療機関が付与した名称だけで標準コードを付与することは危険で且つ判断がつかないため、医療機関と連携して適切なコードをつけるようにしています。連携ミスもありますので、分布も見て、間違いを防止しているところでございます。
 リアルワールドデータについては、「信頼性の高いデータ」と「適切な解析計画」の2つが成り立ったときに、評価が可能になると思います。どちらかが一方でも欠けると「評価不能」になります。すなわち、何らかの数値、結果は出るけれども、正しいかどうかは分からない状況になります。幾ら解析計画が適切でも、データベースの信頼性が担保されていなければ、結果を適切に評価できないことになっております。
  最後に「MID-NETの品質管理・標準化まとめ」でございます。
 「(1)品質管理」についてですが、データの信頼性が確保されていなければ、データの二次利用は困難だと考えます。太字で書いておりますが、医療DXによる統一化はかなり期待しております。
 MID-NETは、MRDAの手法を取り入れて、継続的な品質管理を実施してまいります。
 次に「(2)標準化」についてですが、データが標準化されていなければ、データの二次利用は困難であると考えております。
 こちらにつきましても、本検討会でも議論されると思いますが、医療DXによる統一を期待しております。
 MID-NETでは、実態に沿った継続的な標準化作業を実施してまいります。
 最後に、今回の検討に際して、MID-NETの構築・運営時に得られた標準化、品質管理等に関する技術・知見については、情報共有が可能でございます。
 今回の検討は、厚生労働省所管のデータベースが対象であり、MID-NETとデータ収集経路が異なる部分がありますが、MID-NETの手法(考え方)を参考に、それぞれのデータ収集方法に適した手法を検討することが重要ではないかと考えておりますので、どうぞよろしくお願いいたします。
 以上でございます。
○小笠原主査 ありがとうございました。
 続きまして、岡田構成員から資料4-3の御説明をお願いいたします。
○岡田主査代理 それでは、私から「医療等情報の二次利用に関する課題と解決・改善に向けて」と題して、特に「手法・技術・標準の観点から」ということで、資料を提供させていただきます。
 改めて書くまでもございませんが、医療等情報、リアルワールドデータでございますが、この課題解決には、大きく2つの観点があって、一つは「手法・技術・標準」、もう一つが「倫理・法律・社会」で、両方の観点が必須でございますが、以下では特に「手法・技術・標準」の観点から取りまとめております。
 これは、先ほどの御講演でもございましたので、あまり詳しくは必要ないと存じます。
 リアルワールドデータとはどのように定義されているかということなのですが、国際的には、幾つかの団体がリアルワールドデータとはこういうものであると書いていますが、統一的な定義は、国際で合意されたものがあるわけではございません。
 しかし、大体共通しているのは、RCTのように収集された、臨床試験で集められたようなデータではなくて、非介入的な方法で観察的に得られるデータで、主としてEHR、電子医療記録でございます、管理的データ、あるいは医療費請求に係るデータ等から得られるものであるのが、大体共通したところであるかと存じます。
 参考までに、EHRという言葉を使いましたが、この議論は結構長くて、私は国際標準化のところでも参加してまいっておりますが、20年ほど前からEHRとは何ぞやと大分議論されてまいりました。
 まとめて言うと、EHRの目的は、患者さんのケアの継続性であり、医療者のケアのコーディネーションである。
 もう一つは、医療の質向上、あるいはポピュレーションヘルスに資する機能を有するもの。
 このため、相互運用性を有するものがEHRであるという定義として、大体合意されています。
 定義は20年も前なのですが、今もこの考え方は変わっていないところかと存じます。
 これも念のため、リアルワールドデータの種類はどんなものがあるかは、本日多く御議論いただいている、あるいは御報告いただいているところの整理にもなるかと思いますが、ここで言っているのは、研究目的として、試験データのように、定まったプロトコルにのっとって収集されたものではないところが基本でございます。
 先ほど申したように、日々の臨床で収集されるところが中心でございますが、これにさらにレジストリーやデータベース、調査データ等も含めてリアルワールドデータという広義の定義の場合もございます。
 これも御存じのところかと存じますが、先ほど清水先生のところでマスターというお話があって、まさにそのとおりだと思っているところなのですが、今、御存じかと存じますが、病院のほうはどうなっているかといいますと、日本の病院情報システムの歴史は古く、リアルワールドの観点からは、それが活用を難しくしているところがあり、それぞれの病院が異なる時点で、異なるベンダーからシステムを導入して、開発して、発展してきている経緯があります。
 現在、各病院は、薬剤であれ、検査であれ、それぞれの院内マスターを持っていて、そのマスターに応じて診療を提供されているわけです。
 診療においては、それぞれ病院独自のマスターで全く問題ないわけでございますが、これをいざリアルワールドデータの統合活用をしようということで、集めてきて、データベース化すると、先ほど山口先生からお話がございました標準化のところでこれが問題になってしまいまして、そのまま集めても利活用ができないということで、統合化する前に、クレンジングであったり、標準化であったり、多大な作業が必要になっている状況でございます。
 多施設で共同研究、多施設のデータを活用していく上では、標準化されたマスター整備が必要である。
 それから、院内に標準を取り込むという現実的な解決策が必要であろうというところでございます。
 データ収集の方法でございますが、今までいろいろな方法で研究目的のためにデータ収集を試みているわけです。
 各施設がばらばらですので、これを集めて活用するときには、標準化して、データの品質も確認してということで、データを集めて、その都度この整備に非常に多くの時間と労力、費用を費やしてきているわけでございます。
 また、近年は「分散型のデータ利活用」も研究開発されて、実装もされてきているところかと存じます。
 大ざっぱに、どんな方法があるかという例でございます。
 ウェブからの入力であったり、SS-MIX2からプログラムで自動収集したり、右側は電子カルテのテンプレートからの出力、右下はSS-MIX2とテンプレートの統合型の収集といったものを例として挙げております。 「国内における医療データベースの類型」。
 これは一つの類型としてお示ししたもので、これが定義というわけではございませんが、データベースを分けるとすると「臨床レジストリー/データベース」。
 それから、レギュラトリーの目的で構築されるデータベース。
 そして「公的レジストリー/データベース」があるかと存じます。
 これらのお話が本日の議論でもそれぞれ入ってきているものと存じます。
 「公的データベースに保管される医療等情報の二次利用における課題」。
 これは、これからのワーキンググループでの御議論の中心にもなっていくところと存じますが、主な公的データベースには、ここでは6つ挙げておりますが、顕名で格納されているもの、匿名化されて格納されているものがございます。
 「公的データベースの二次利用における課題」として、私は近年、データ整備に注力していまして、活用を御支援する立場なのですが、公的データベースの活用の困難さは、先生方から常に指摘されています。
 NDB等、国が保有する公的データベースは、もちろん活用可能になっていますが、極めて限定的であるし、特に言われるのは、死亡情報の活用が非常に難しいところでございます。
 それから、本日の冒頭での御説明にもございましたが、データベース同士の連結も非常に困難でございます。技術的な問題と、法的・社会的な問題の両方があるかと存じます。
 リアルワールドデータの課題については、幾つか論点がございますが、医薬品コード(薬剤データ)は、様々な二次活用に必須のものでございますので、まず取り上げております。
 国内では、薬事であったり、流通においては、いわゆる規制で定められているコード、あるいはデファクトで流通しているコードであったり等、安定してコードが活用されているのですが、院内での処方のような場合、医薬品コードの標準は特に定められずにきております。そのため、病院内で利用されるコードは様々ございますが、流通用のGS1、レセプトコード、電カルにはYJコードやローカルコード等がございます。
 これに対して、厚生労働省標準規格としては「医薬品HOTコードマスター」が指定されています。
 先ほども若干触れられたかと存じますが、HOTコードは、院内で特定の利用、ユースケースがある業務に使われるものではございませんので、これを使ってくださいという形で推進もあまりされてきておりませんので、病院にはあまり普及していないと言って差し支えないと存じます。
 しかし、厚労省の規格になっていますので、これまでのデータベース構築では、HOTコードに変換してデータベース登録することもなされてきているのですが、この変換作業に手間暇がかかるのと、エラーのリスク等も交じってくるということで、手作業でコードを変換するのではなくて、標準コードが流通する仕組みが不可欠なのだろうと考える次第です。
 検査データについては、よく御存じのところと存じますが、実際に複数の病院のデータを集めて見てみると、検査データは、単位も相変わらずばらばらでして、これも昔から知られていることなのですが、解決されていません。
 それから、先ほどもあったように、検査値の分布は必ず問題になるところですが、多くのデータを集め、データベース化して、これを見ると、おかしな分布をしていると、それが分かって、理由が何かということも特定できて、そこで解決できる場合もあるのですが、実は、理由はよく分からないけれども違うこともあって、現在は、研究者の活用目的に応じて分布をそろえたり、正規分布変換したりもされています。
 それから、定性値はなかなか標準化されません。
 また、先ほど言及がありましたが、検体検査では、JLACというコードがございますが、今までのJLAC10は、医療施設にほとんど普及しておりません。
 しかし、これも厚労省標準規格で、JLAC10が挙げられていて、研究活用のためにJLACに転換しようとすると、簡単にはできなくて、しかも誤りも混在しがちで、ここが大きな課題になっています。
 現在、JLAC10からJLAC11に移行が進められています。私はこの支援をさせていただいているのですが、JLAC11のほうがより容易に標準コードを割り当てることが可能であると考えております。
 電子カルテ情報の活用に多くの課題があることは、御承知のとおりと存じます。
 ここでは、一部の例を挙げておりますが、医薬品に関しても、今、薬剤コードの話だけをしましたが、用法や用量等もなかなか標準規格が普及しておらず、投与量の取得・把握が困難な状況にあります。
 それから、電子カルテのデータからはリーズニング、なぜその薬の投与を開始したのか、やめたのかは、取得はほぼできない状況です。
 また、カルテには書いてあっても、テキストの中に埋もれていて、なかなか取得できない、例えば血圧値がございます。
 また、電子カルテ情報で、必要だと言われて、多くの疫学研究で言及されながらも、なかなか標準化されずにきたものが幾つかあって、アレルギー、予防接種、手術歴、家族歴等ですが、このうち幾つかは、今、医療DX政策の中で急速に標準化を推進されておいでのところです。
 今度は、リアルワールドデータの二次利用ということで、データ連結に関わるところです。
 先ほど「連結」とは何かという重要な御指摘がございましたが、個々の事業のデータベースでは、もともと共通性を持って構築したわけではないので、標準的データが備えられていないことから、こういったものを統合活用しようとしても、もちろん、そんな簡単にはいかないのですが。少し離れて見ると、例えば「Common Data Model」という考え方がございます。今「OHDSI」という国際的な研究枠組みでも、Common Data Modelに基づいていますが、その辺も、我が国でも考えてみたほうがいいのではないかと思うところです。
 次に標準化されていないリアルワールドデータに関しては、その都度変換するのではなくて、標準コードがあらかじめ流通するような仕組みをつくることがまず不可欠であると。
 そのためには、JLACがまさにそうなのですが、これは正しいかどうかの判断がなかなか難しいところがございまして、こういうものは、標準コードを専門とする団体・組織を設置して、そこで一元的に管理して、国全体で各施設が活用できるようなマスターを整備していくやり方が適切ではないかと思います。
 それから、公的データベースと民間データベース、解決のほうだけ見てみますと、今まで研究者の先生方を御支援していて問題になっているところは、先ほどもございましたが、患者識別をどうするかというところで、少なくとも被保険者番号が入っていると、まだ連結の可能性がございますが、被保険者番号は変わります。
 そうすると、研究者が、異なる番号でも同一人であれば同一と判断できるような仕掛けが必要ですが、この仕組みは、支払基金のほうで有しておられて、これを活用できるようにしていただくことが重要ではないかと思います。
 あと、こういったいろいろなデータベースを活用するには、今までも御指摘がありましたが、メタデータという考え方が要るかと思います。
 先ほどの、Common Data Modelの例として「OMOP CDM」が、OHDSIという国際的な観察研究の枠組みでのアプローチです。
 もう一つ、右側は、FDAのSENTINEL Common Data Modelの例で、最近になって、これを担当されている方にお話しを聞きましたが、日々改善していて、今も活用が進んでいるということでございます。 医薬品と検体検査の標準化に係る課題でございますが、厚生労働省標準規格として、右側に「解決策/改善策の例」としてお示ししておりますが、例えばYJコードは、デファクト的に院内にありますので、こういうものを標準コード規格としても活用できるようにしていただいてはどうかと。
 それから、GTINコード、これはもともと流通用のコードですが、今は添付文書にひもづいて、院内に入ってくる流れができましたので、これを基軸にするマスター、グランドマスターと先ほど清水先生がおっしゃったかと思いますが、そのような考え方ができるかと思います。
 JLAC10、JLAC11は、先ほど申したところでございます。
 院内システムでは、データを出すところで標準化させるのではなくて、上流工程で標準が入るような流れ、仕組みをつくる必要があると考えます。 複数の薬剤コードの詳細をここで整理しております。
 薬価基準収載医薬品コード、レセプト電算処理コード、個別医薬品コード(YJコード)、GTINコード、HOTコードについての説明でございます。
 例を示しております。こちらは、今の厚労省標準規格での例でございますが、今まで臨床検査のマスターが標準規格になっているのですが、一次利用という観点も踏まえながら、病院内で使われる、標準的に流れる方向性として、JLAC10やJLAC11というコード体系自体を厚労省標準規格にしていって、推奨していってはどうかと考えます。
 あと、真の病名というところで、先ほどの先生方のスライドにもあったかと思いますが、レセプト病名は、必ずしも真の病名ではないということで、これは様々な研究がございます。
 大規模データベースを構築した場合には、病名を推測するような方法論もあって、この辺も探索していくといいのかなと思います。
 あと、これも先ほどのお話にあったのですが、病院情報システム、電カルシステムは更新されて、長い間には検査も変わってまいりますので、更新されて変わるところの情報がきちんと押さえられていくような仕組みをつくっていかないとならない。今までそういった必要性がなかったので、なされていない場合が多いのですが、これは実現可能かと思います。
 JLAC10とJLAC11の違いについては、後ろのほうのスライドにございますので、後で参照いただければと思います。
 今考えられることとしては、JLAC11、体外診断用医薬品ごとにこういうものをあらかじめ付番していただいて、ナショナルマスターのようにして、これを入手可能なコードにして、各施設に取り入れていただくのがいいのではないかと考えるところでございます。 JLACコードの問題なのですが、いろいろな研究に使われて、リアルワールドデータでも非常に重要なのですが、JLACの課題が指摘されてきまして、現在「JLACセンター」が設置されました。
 ちなみに、私はその事務局担当でございまして、実務で専門の先生方の御指導の下、動いているのです。センター長は康先生でございますが、今まで専門的に定めている臨床検査項目マスター運用協議会や、臨床検査医学会の委員会と密に連携してJLAC10、JLAC11を付番する業務を担っております。
 この絵に示されているように、医療機関、電カルベンダー、製造販売事業者であったり、PMDAとの連携であったり、こういったところの連携を保ちながら、JLACの標準コードが確実に医療施設に流れる仕組みを構築していくための枠組みとしてJLACセンターができております。
 下は、実際にどうやったらJLACコードが正しく割り当てられるかという流れを検討した一例をお示ししております。プロセスをお示ししております。 これが先ほどのJLAC10とJLAC11の違いでございます。御参考までに。
 JLAC10コードを実際に、例えば新たな試薬、これはCOVID-19の抗原検査キットでございますが、どうやって割り当てているのか、具体的に事例でお示ししたものです。
 御関心があれば、どうぞ御覧いただければと存じます。
 あとは参考まででございます。
 リアルワールドデータで議論されているデータの品質保証(Data Quality Assurance)の議論で、2~3枚のスライドをつけさせていただきました。
 以上でございます。
 どうもありがとうございました。
 時間を取り過ぎました。すみません。
○小笠原主査 岡田構成員、ありがとうございました。
 現状、どのように走っているかということがよく分かったかと思います。
 それでは、今、3名の構成員の皆様方から御説明いただきましたので、コメント、御質問いただければと思います。
 お時間としては、本会議は18時までですので、5時55分まで議論したいと思います。
 どうでしょうか。皆様方、いかがでしょうか。
 岡村構成員、お願いします。
○岡村構成員 先生方、今まで非常にいろいろと御苦労されてきたノウハウを御提示いただきまして、ありがとうございます。
 私も、現場の立場から同じように感じることが多々ありました。基本的に、先生方が御提示いただいた内容は、私も賛成いたしております。
 御質問としては、一つ、山口先生の御発表にありましたデータの信頼性のお話で、電子カルテはリプレースもあるし、検査も医薬品もそうでしょうが、どんどん変わっていくので、マスターの管理は常時行っていく必要があるというお話があったと思いますが、例えば実際に、今、いろいろなマスターがあると思うのですが、どの病院も恐らく、各部門の担当者が独自の方法に基づいてマスターの管理をされていると思うのです。
 例えば検査であったら、検査手法が変われば、本来ローカルコードも変えなければいけないのですが、前と同じコードをつけてしまって、それであるがゆえに、集めたときに問題が生じるとか、例えばそういうことが起こっているように感じています。
 あるいは、マスターが変わって、それがどのタイミングで変わったのかというログが残っていなかったり、そのようなこともあったりしますので、例えばなのですが、各医療機関に対して、様々なマスターの管理手順指針みたいなところを示すような形ができれば、信頼性という意味で有用になるのではないかと思うですが、この辺りに関して、山口先生や岡田先生、御意見がありましたら、お伺いしたいです。
○山口構成員 私が答えてしまって、よろしいでしょうか。
○小笠原主査 お願いします。
○山口構成員 PMDAの山口です。
 標準コードの話だと思います。
 多くの医療機関は、通常、標準コードではなくローカルコードで管理していると思っていただければと思います。薬剤や検査もローカルコードで管理されているのが基本だと思います。
 検査については、以前別の検査項目で使用していたローカルコードを、別の検査項目に当ててしまうのは、実例としてあります。
 そのような事例がありましたので、MID-NETの全医療機関に対してローカルコードの使いまわしをやめてくださいということで、定期的に周知しています。
 ただ、これはMID-NETに限った話ではなく、全国的に見れば、ローカルコードの使いまわしてしまう医療機関はあるような気がします。
 MID-NETでは、分布等を見ているため、全く違う検査項目のローカルコードをつけてくればもちろん分かります。同じ検査項目でも、測定法がかわれば、気づける仕組みを取っています。また、医療機関にもお願いしているところでございます。
 以上です。
○岡田主査代理 岡田でございます。
 岡村先生、ありがとうございます。
 私は早口で、自分でもどこまで何をしゃべったか、よく覚えていなくて、すみません。
 私も、岡村先生と同じことを考えていまして、いろいろな病院のリアルワールドデータの支援をしてきて、こうすればいいのにと思うところが多々あるのですが、自分が思って、それで終わっていては話にならなくて、こういうものを何か共有させていただけないかと私はよく思っています。
 そういうときに、先生がおっしゃるように、このようにマスター管理しましょうみたいなガイドというのか、手引なのか、分かりませんが、何かできるといいなと思っておりまして、このワーキングでぜひ御議論いただきたいと思っております。
 ありがとうございます。
○岡村構成員 ありがとうございます。
 今、マスター管理をされているのが薬剤師であったり、臨床検査技師であったりということで、情報とかデータの専門ではなく、そのようなノウハウを持たれている方ではないことが多いので、分かりやすい手順、ガイドみたいなものがあったほうがいいのかなと感じた次第です。
 ありがとうございます。
 もう一つ御質問させていただいてもいいでしょうか。
○小笠原主査 どうぞ進めてください。
○岡村構成員 ありがとうございます。
 これは事務局への御質問になるかもしれませんが、今回のデータ連携基盤の公的データベースの範疇で、NDBをはじめとして、いろいろとあったと思いますが、今、取組をされている3文書6情報に関して、これがもし公的データベースの一つのデータソースとして位置づけられると、先ほどの清水先生のお話で、悉皆性と粒度の表があったと思いますが、あの右上のほうにあるようなデータソースになるのではないかと期待しております。なので、公的データベースのデータソースとして、6情報が入り得る余地があるのか。
 もう一つは、先ほど岡田先生の御発表にもありましたが、死亡情報のような転帰の情報が非常に欲しいところになるので、全国がん登録が議論中という形であったと思いますが、これは今、どのような議論で、どのような方向性にあるのかに関して、この2点をお伺いさせていただければと思います。
○事務局 事務局でございます。
 まさに現在、投映させていただいておりますが、最初にいただきました3文書6情報が今後、二次利用で提供されていく可能性があるのかどうかという点での御指摘でございますが、まさにワーキングのほうでも、医療DXの推進に関する論点ということで、電子カルテ情報共有サービスにおいて共有される情報についても二次利用を進めるという方向性について、どのように考えるかということで、論点立てをさせていただいておりまして、二次利用に供していくべきではないかという方向での御議論をいただいているところでございます。こうしたものが今後、まさに活用されていくようなことがあり得るのかなと思っております。
 2点目にいただきました死亡情報についてでございますが、今、一部でございますが、NDBと連携するような形で、死亡情報の活用ができるように検討が進められていると伺っております。
 また、死亡情報は重要なデータであることは承知してございますので、今後、より使いやすさといった点で何かできないかということは、事務局としても検討してまいりたいと考えておるところでございます。
○岡村構成員 分かりました。
 ありがとうございます。
 6情報については、先ほど岡田先生の御提示にあったOMOPとの相性もよく、国際共同研究も非常にしやすくなりますので、ぜひ御検討いただければと思います。
 よろしくお願いします。
 ありがとうございます。
○小笠原主査 ありがとうございます。
 残り時間が少なくなりましたので、手短にお願いいたします。
 田辺構成員、お願いします。
○田辺構成員 IPAの田辺です。
 お三方の先生方、大変きれいに情報をおまとめいただきまして、私もやっと頭の整理が追いついてきた状況でございます。どうもありがとうございます。
 先ほど清水構成員からもお話がありましたが、セキュリティーは、安全に倒しますと、幾らでも湯水のごとくお金を使って、安全な環境をつくろうとすると、そういう形でコストがどんどん上がってしまう、かつ、利便性も落ちていくことになります。
 例えば政府機関ですと、絶対に守らなければいけないものと、ある程度流通してもいいものということで、格付を決めて、厳格に管理するものと、日々自由に使っていただいていいものと情報を切り分けて、それに応じて利便性も維持しつつ、守らなければいけないものは守るようなセキュリティーの対策を講じています。
 特にキーワードとして、はやり言葉で恐縮なのですが、今、ゼロトラストという言葉がセキュリティーの世界だと一般的に使われておりまして、要は、専用回線を使っていれば安全だということから、専用線を使いますと、高価になってしまいますので、そこはなるべくコストを安く抑えて、どなたでも情報の利活用が進むように、流通させられるようにということで、ネットワーク上はゼロトラストということで、ネットワークを信頼しない、その代わり、皆さんに身分証のようなものを持っていただいて、常にゲートウエイで身分をきちんと確認していくような、ここのネットワーク上にいるから安心という形ではないタイプのセキュリティー対策も徐々に広がってきておりますので、そういった細かいところは、また別の回でお話しできればと思います。
 それから、これは感想めいた話で恐縮なのですが、AMEDの研究を見ていても、どこでもデータの標準化、データを利活用しようとすればするほど、標準化されていなくて、まずはデータマネジャーさんがデータをきれいにしていくところから非常に時間をかけて研究をしていらっしゃいます。
 そういうことを考えても、標準化が非常に重要だということはずっと脈々と言われてきて、必要性とか、どこを標準化したいという御意見は出ていながら、なかなか進まない。
 これは個人的な意見ですが、誰かがグリップして、施策を展開していく、政策的に標準化しましょうということが決まっても、それを具体的に施策に落として、どの順番にしますかとか、そういうことをイニシアチブを取ってやる。
 要するに、利活用という扇をばっと広げていくときの要になる組織が必要なのですが、医療DXの場面で、報酬基金様がそこを担う形で政策意思決定されているようですので、そこを要に、例えば医療情報であっても、そこを起点に発出されるとか、ルールもそこを起点に発出されるということで、ガバナンスの一つとして、基金様に活躍していただくようなことができるといいのではないかと思って、拝聴しておりました。
 すみません。最後は感想になってしまいましたが、以上でございます。
○小笠原主査 ありがとうございます。
 それでは、清水構成員、手短にお願いします。
○清水構成員 清水です。
 私の発言、及びほかの先生の発言と絡んだところで、今回、マスターデータの整備の必要性が一つ議論の対象であることがクリアになったことは、非常にありがたいと思っております。
 その中で、一つ論点に加えたいのが、そもそもの話として、私は医療機関マスターを加えさせていただきましたが、医療機関マスターであったり、検査のJLACであったり、医薬品のYJコードを使うとか、その話がもちろん最初にあるのですが、そのコードをどう整えるかというところに、一つ時系列という軸も必ず加えていただきたいと思っています。
 私は、先ほど資料の中で、時間もなかったので、飛ばしてしまったのですが、同じ医薬品が、YJコードの中でも、販売会社が変わるとコードが変わることがあります。
 例えばなのですが、糖尿病の薬の解析をしたいとなったときに、現在の糖尿病の薬のリストを挙げたところで、例えばNDBは11年間、12年間分ありますが、12年前には同じコードではなかったりするのです。そうすると、データ抽出の際漏れてしまうということが起こってしまうので、時系列も含めての各コードの管理をきちんとしていかないといけないということを申し上げておきたいと思います。
 そうなりますと、同じように、例えば明日、うまく過去10年間分のリストができたとしても、常に変わっていくので、それのメンテナンスも含めてやっていかないと、せっかくつくったものがまた古くなってもいけないので、そういう意味での時系列管理をひとつ念頭に入れていただけたらと思って、付け加えさせていただきます。
○小笠原主査 ありがとうございます。
 それでは、足立構成員、お願いします。
○足立構成員 足立でございます。
 私も質問というよりは、時間的にも若干感想めいたところになるのですが、清水先生、岡田先生からいただいたところで、民間DBを提供しているところで、高かろう良かろうと。
 「高かろう」のところはコメントを差し控えさせていただきたいところではあるのですが「良かろう」と言っていただいたところは、この部分はまさに今回、お話しになった中で、データのクレンジング等も含め、マスターの整備とか、レセプト病名のお話もありましたが、実際に利用される方において、データの転換だったり、読替えだったり、そういう処理の工程として、私が所属している会社でも3,000工程ぐらいかけているのですが、こういったプロセスが逆に価格に転換されている部分もありますので、この辺りについて、効率的な処理を行うことについては、全くもって賛成でございます。
 特に上流のデータがつくられる時点で、データ自体が欠けているものについては、まさに医療現場において、そのデータが適切に標準化された中で記録されていく必要があるところで、ここは連携基盤で後から補えない部分になりますので、連携基盤側である程度マスター等を活用して、利活用しやすいようにそろえられる部分と、そもそも上流できちんと標準化されて、データが入力されていなければカバーできない部分をしっかりと分けて議論することが改めて重要ではないかと、両先生のお話を聞きながら思ったところが感想でございます。
 あと、山口先生からお話があった、まさにMID-NETの場合は、GPSPに対応されているのが前提になっていると思いますが、HICにせよ、新しいものにせよ、実際にこれがレギュラトリーの目的で使われるという話になった場合には、製薬や医療機器の事業者の立場からすると、実際にそこの品質保証については、基盤より先のデータベースのところで何が起こっているのかは、もはや見えないので、データベース自体、このデータベースはどのような目的で利用するかというところについては、親会の分科会でも議論されているところかと思いますが、特にインテグリティーも含めてのデータの品質に関して申し上げますと、レギュラトリーの目的に堪え得る仕様であるのかについても、結構MID-NETの情報・知見等をお借りする必要があるのかなとすごく感じているところではございますので、今後、こういったところもこの場で議論できればよいのかなと感じた次第でございます。
 以上です。
○小笠原主査 ありがとうございます。
 山口構成員、お願いします。
○山口構成員 ありがとうございます。
 PMDAの山口です。
 標準コードについてコメントさせていただきます。
 本日、話を聞いているだけでも、標準コードについては、薬剤だけとっても、YJコードとか、HOTコードとかいろいろな標準コードがあがっています。
 この検討会で推奨する標準コードを決めなければ、今後も場当たりでいろいろな標準コードを使うことになってしまうと思います。薬剤だったらこのコード、検査だったらこのコード、病名だったらこのコードということを決めることを念頭に議論したほうがいいと思います。
 また、ICDにつきましては、国際的にICD10からICD11に変わる議論が進んでいると思います。また、ICD10とICD11ではかなり仕様が違いますので、ICD11と決めてしまうことで逆に標準化が進まなくなってしまうこともあると思いますので、そのあたりも考慮し慎重に検討したほうがいいと思います。
 最後に、JLAC10につきましては、非常に難しい課題があると考えています。
 MID-NETではJLAC10を採用していますが、運営しながら常に、本当にJLAC10からJLAC11に変えられるかと考えています。変更することでなかなか難しい問題もありますので、推奨する標準コードについては関係者でよく議論したほうがいいのではないかと思いました。
 先ほど行政の話があがりましたが、MID-NETは行政のGPSP遵守を非常に意識しています。今回、公的データベースに関することを検討すると思いますが、公的データベースの品質保証すべき範囲は、二次利用する部分になると思います。例えば、公的データベースのデータ収集過程は国が保証しているところだと思いますので、データ収集過程以降の二次利用に関する過程の品質をどう保証するかという議論をしたほうがいいのではないかと思います。
 品質保証すべき範囲については、よく考えて検討したほうがいいのではないかと思いましたので、よろしくお願いいたします。
 以上です。
○小笠原主査 ありがとうございます。
 本技術作業班のスコープをもう一度見直した上で、また次回検討しなければいけないと思っております。
 本技術作業班において、標準化そのものを扱うことはないかと思うのですが、そこは事務局、いかがでしょうか。
○事務局 事務局でございます。
 先ほど山口先生から御指摘いただいた、6情報でどういったことが伝わるのかどうかですが、お示しさせていただきました利活用ワーキングでも、一次利用、電子カルテ情報の共有ですが、ある程度対象とするコードを絞ってというところを御議論いただいているところでございます。
 そういったことを前提としつつ、それの標準化とか、どうやって信頼性を確保していくのかというところは、ぜひこちらの技術作業班で御検討いただければと考えておるところでございます。
○小笠原主査 ある程度そこは踏まえて進めるということで、了解いたしました。
 お時間もちょうど18時になるところでありますが、最後に、私の感想を述べさせていただくと、セキュリティーに関して、まさに技術的なセキュリティーだけでは難しいだろうと思います。我々は最近、研究する際には、必ず倫理講習を受けなければいけないとかの決まりがあります。今後使う方に関しては、一定の講習などを踏まえた上で利用していただくことも必要なのかなと思います。悪意のある人は何でも行うので、それを排除するよりも、もっと使う側の倫理観を高める必要性があるのではないかと思いました。
 あと、標準化に関してですが、私が大学院生の頃から標準化の必要性はずっと言われているのですが、成功しているのはDICOMぐらいではないかなと思っています。聞くところによると、同じベンダーであっても連携ができないことが起きるという話もありますし、日本においては、200床以下の医療機関が8割という現状があります。このことを踏まえると、大学病院などの大規模病院では進んでいるのですが、200床以下の中規模小規模病院、まだまだ電子カルテ等が入っていない施設などにも、これからのルールを決めていくなどの、ある程度の強制力が必要なのではないかと思っています。
 ここがまさに医療DXだと思うのですが、入力側がメリットを感じるようなことも踏まえて、皆さんと一緒に考えていきたいと思っております。
 時間がちょっと過ぎてしまいましたが、最後に、これは付け加えたいということはございますでしょうか。
 ないようでしたら、最後は事務局に議事をお返ししたいと思います。
 よろしくお願いします。
○事務局 構成員の皆様、本日は闊達な議論をいただきまして、大変ありがとうございました。
 事務局におきましても、多数御指摘いただいているところでございますので、次回の開催に向けて、しっかりと準備を進めていきたいと思っております。
 次回の開催については、改めて事務局から御案内させていただきます。
 本日の議事録につきましては、作成次第、御発言者の皆様に御確認いただきまして、その後、公開とさせていただきますので、よろしくお願いいたします。
 引き続き、この技術作業班におきまして皆様に御議論いただければと思いますので、どうぞよろしくお願いいたします。
 事務局からは以上でございます。
○小笠原主査 ありがとうございました。
 本日は、主査の不手際で時間が延びましたことをおわび申し上げます。
 それでは、以上をもちまして閉会させていただきます。
 活発な御議論をありがとうございました。
一同:ありがとうございました。
―― 了 ――