ホーム> 政策について> 審議会・研究会等> 政策統括官(統計・情報政策・政策評価担当)が実施する検討会等> 国民生活基礎調査の非標本誤差の縮小に向けた研究会> 第1回国民生活基礎調査の非標本誤差の縮小に向けた研究会 議事録(2017年7月6日)




2017年7月6日 第1回国民生活基礎調査の非標本誤差の縮小に向けた研究会 議事録

○日時

平成29年7月6日(木) 9:51~11:44


○場所

厚生労働省政策統括官(統計・情報政策担当)会議室
(中央合同庁舎5号館21階11号室)


○出席者

構成員(五十音順、敬称略、◎:座長)

  石井 太
  稲葉 由之
  津谷 典子
◎廣松 毅

構成員以外の出席者

 西郷 浩(早稲田大学政治経済学術院教授)

事務局

  中井参事官(企画調整担当)
  中村世帯統計室長
  北世帯統計室国民生活基礎統計専門官
  大村人口動態・保健社会統計室室長補佐

○議題

(1)国民生活基礎調査と国勢調査の原データレベルでの比較・検証
(2)国民生活基礎調査の推計方法等に係る検証・検討
(3)その他

○議事

1.開会

○中村室長
 定刻より
10 分程度早いのですが、皆さんおそろいですので第1回国民生活基礎調査の非標本誤差の縮小に向けた研究会を開催させていただきます。

 皆様におかれましては、お忙しい中を御出席いただきましてまことにありがとうございます。私は世帯統計室長の中村でございます。本日は第1回目の開催ということですので、座長が選出されるまでの間進行役をさせていただきます。よろしくお願い申し上げます。

 それでは会議に先立ちまして資料の確認をお願いいたします。

○北専門官
 それでは事務局の方から資料の確認をさせていただきます。

 まず資料1が「国民生活基礎調査の非標本誤差の縮小に向けた研究会開催要綱」、資料2が「研究会における検討事項および開催スケジュール(案)」、資料3が「平成 22 年国勢調査と平成 22 年国民生活基礎調査の集計結果の比較」、資料4は「平成 22 年国勢調査と平成 25 年国民生活基礎調査の世帯数の比較」、資料5は「国民生活基礎調査の標本設計・推計方法等に係る研究会報告書 ( 平成 23 年3月 ) (抜粋)」。続きまして参考資料1として「統計委員会諮問第 82 号の答申(抜粋)」、参考資料2として「平成 22 年国勢調査と平成 22 年国民生活基礎調査(推計数)の世帯数の比較」。最後に参考資料3として「国民生活基礎調査の推計方法」ということでお配りしております。
 また、各先生方のお手元には6月
27 日に公表いたしました平成 28 年国民生活基礎調査の概況をお配りしております。事務局からは以上です。

○中村室長
 資料の過不足はございませんか。

 本日は全ての委員の皆様に御出席いただいております。

 それでは各委員の御紹介をさせていただきます。

 はじめに、国立社会保障・人口問題研究所人口動向研究部長の石井委員でございます。

○石井委員
 石井でございます。よろしくお願いいたします。

○中村室長
 続きまして明星大学経済学部教授の稲葉委員です。

○稲葉委員
 よろしくお願いいたします。

○中村室長
 慶応義塾大学経済学部教授の津谷委員です。

○津谷委員
 よろしくお願いいたします。

○中村室長
 情報セキュリティ大学院大学情報セキュリティ研究科客員教授の廣松委員です。

○廣松委員
 廣松です。よろしくお願いいたします。

○中村室長
 また、本日は審議協力者といたしまして早稲田大学政治経済学術院教授の西郷先生にも御出席いただいております。

○西郷審議協力者
 西郷です。よろしくお願いいたします。本日は所要で
11 45 分くらいに退席いたしますが、よろしくお願いいたします。

○中村室長
 次に事務局ですが、安藤統括官は本日緊急の会議のため出席できません。申し訳ございません。

 企画調整担当参事官の中井でございます。

○中井参事官
 よろしくお願いいたします。

○中村室長
 隣が世帯統計室の北でございます。

○北専門官
 よろしくお願いいたします。

○中村室長
 人口動態・保健社会統計室の大村でございます。

○大村人口動態・保健社会統計室室長補佐
 よろしくお願いいたします。

○中村室長
 なお、本研究会の運営や資料の作成等は「みずほ情報総研株式会社」に委託しており、本日は事務局として田中が参加しております

○田中(みずほ情報総研)
 よろしくお願いいたします。

○中村室長
 それでは会議の開催に当たりまして、安藤統括官の代理で中井参事官から御挨拶を申し上げます。

○中井参事官
 改めまして御挨拶申し上げます。政策統括官付参事官の中井でございます。よろしくお願いいたします。

 皆様方におかれましては御多忙の中、国民生活基礎調査の非標本誤差の縮小に向けた研究会に御参画いただきましてまことにありがとうございます。また、日頃より厚生労働統計の実施に当たり格別の御尽力、御協力を賜っておりますことを、この場をお借りして心より御礼申し上げます。

 さて、本研究会において御議論いただきます国民生活基礎調査は、相対的貧困率、がん検診受診率等の各種厚生労働行政施策の基礎資料として、大変重要な役割を担っている調査です。先般6月 27 日に最新の大規模調査について発表し、各マスコミ等で報道されたのは御存じのことかと思います。

ただ昨今の国民のプライバシー意識の高まり等を反映し、調査環境が年々厳しくなってきております。私ども調査実施者としては、より活用される統計調査とするためにも、回収率と調査精度の維持・向上を図る必要があります。この点について統計委員会における平成 28 年調査計画の答申の今後の課題の中で、「非標本誤差の縮小に向けたさらなる取組」として国民生活基礎調査と国勢調査の原データレベルでの比較・検証、国民生活基礎調査の推計方法等に係る検証・検討、また郵送回収の試験調査結果の検証。この3つの指摘をいただいております。

 本研究会ではこれら3つの取組について、専門的見地から検討・評価をいただければと考えております。委員の先生方の御意見をいただきまして、非標本誤差の縮小に向けた取組についてさらに検討を行い、次回の大規模調査年である平成 31 年国民生活基礎調査の企画に反映させたいと考えておりますので、活発な、忌憚のない御意見、御議論をいただければと存じます。

 簡単ですが私からの挨拶とさせていただきます。どうぞよろしくお願いいたします。

○中村室長
 議事に入ります前に資料1と2の説明をさせていただきます。

 資料1はこの研究会の開催要綱です。目的と検討事項については今御挨拶申し上げたとおりです。4番、この研究会は政策統括官が有識者を集めて開催するという位置付けで、委員の中から1名を座長として選出することになっております。また会議そのもの、会議資料、議事録については基本的に公開という形で運営させていただきたいと思っております。

 続いて資料2は会議の開催スケジュールです。今日が第1回で、議題は国民生活基礎調査と国勢調査の原データレベルでの比較・検証の評価。2つ目が国民生活基礎調査の推計方法等に係る試算・検証の方法についての検討。2回目は1回目の宿題並びに推計方法についてさらに御検討いただきたく、 11 月頃を予定しております。3回目は1月頃を予定しており、同じく推計方法の試算・検証の評価と、現在行っている試験調査の結果が1月頃には概ねまとまるので、それについて検証いただきたいと思います。最後に3月頃に4回目として、研究会の報告書の取りまとめというスケジュールで運営する予定です。

 それでは座長の選出ですが、私ども事務局からの提案として廣松委員に座長をお願いしたいと考えておりますがいかがでしょうか。

(「異議なし」と声あり)

○中村室長
 御賛同いただきましたので研究会の座長は廣松先生にお願いいたします。よろしくお願いいたします。以後の進行は廣松座長にお願いいたします。

○廣松座長
 御指名ですので座長を務めさせていただきます。何とぞよろしくお願い申し上げます。

 

2.議事

(1)国民生活基礎調査と国勢調査の原データレベルでの比較・検証

○廣松座長
 早速ですが、議事次第に従って議事を進めたいと思います。

 本日1つ目の議事は国民生活基礎調査と国勢調査の原データレベルでの比較・検証です。これにつきまして事務局より説明をお願いいたします。

○中村室長
 資料3と4が今回御提示する資料ですが、その前段として参考2を御覧いただきたいと思います。

 参考2は既にこれまでの分析で明らかになっていることですが、平成 22 年の国民生活基礎調査の推計数ベースの世帯数と国勢調査の世帯数を比較したものです。上の図にありますように単独世帯、特に若年層で乖離が大きくなっています。

 2ページ目は都道府県別の数値を示しておりますが、大都市を持っている都道府県において単独の捕捉率が低くなっており、都市部を中心に若年単独世帯の未回収の影響が大きいと考えております。これがこれまでの乖離の一番の大きな要因だろうと思っておりまして、これを前提に今回は資料3と4で新たに別の方法で数値を作ってみたということです。

 資料3を御覧ください。

 今申し上げましたように、これまでは国民生活基礎調査の推計数ベースの世帯数との比較ということでしたが、今回は実際に平成 22 年の国民生活基礎調査の調査対象となった調査地区と同じ、平成 22 年国勢調査区をマッチングさせて個票ベースで世帯属性や年齢階級別の集計をして比較・検証を行うものです。

 マッチングの仕方ですが、【前提】のところに書いてありますように、平成 22 年の国民生活基礎調査は平成 17 年の国勢調査の調査区から抽出します。したがって直接平成 22 年の国勢調査区とマッチングできないことになります。そこで総務省の国勢統計課に相談、協力を得まして、1(1は丸の中に数字)にあるように平成 22 年の国民生活基礎調査の対象となった平成 17 年の国勢調査区について調査区番号とは別に基本単位区番号というものがあるのですが、その基本単位区番号と調査区番号の2つをキーにして平成 22 年の国勢調査区とマッチングさせ、2(2は丸の中に数字)にあるように基本単位区番号と調査区番号が一致した地区についてそれぞれ集計したということです。

 2ページ目がマッチングした結果です。基本単位区番号と調査区番号の不一致が 1,650 地区あったために、約7割の 3,860 地区がマッチングできました。さらに国民生活基礎調査側の調査不能の地区及び国勢調査側の「施設等の世帯」のある地区を除外して最終的に集計したものが 3,826 地区。割合でいいますと 5,510 地区に対して 69.4 %、約7割の集計になっています。

 3ページ目以降が実際の結果ですが、まず下の囲みのところに「捕捉率」と「非捕捉率」という2つの言葉が出てまいります。捕捉率というのは各項目ごとの国勢調査に対する国民生活基礎調査の割合で、数値が低いほど国民生活基礎調査の方が低く出ているということになります。非捕捉率というのは国民生活基礎調査と国勢調査の差の総数に対する各項目の差の割合で、差の総数を 100 として、どこの項目がどの程度低くなっているかを示しております。

 表の上の方に戻りまして、全体の捕捉率が 79.1 %。年齢階級別に見ますとやはり若年層が少なく、男の非捕捉率は 65.6 %で大体3分の2を占めていることがわかります。

 4ページ目は世帯構造別に捕捉率をみたものです。冒頭にもありましたが「単独世帯」が 61.5 %で他の世帯構造に比べて非常に低くなっています。一方で「夫婦のみの世帯」、「夫婦と未婚の子のみの世帯」、「三世代世帯」といったものは9割くらいの捕捉になっています。

 5ページ目のグラフは世帯構造と世帯主の年齢階級別でみたものです。左上のグラフで、やはり若年層が低くなっています。上の真ん中の「夫婦のみの世帯」も若年のところがやや低くなっており、「夫婦と未婚の子のみの世帯」、「ひとり親と未婚の子のみの世帯」、「三世代世帯」、このあたりについてはそれほど年齢による差が顕著ではないという結果になっております。

 6ページ目は、世帯構造、世帯主の性・年齢階級別に非捕捉率を見たものです。「単独世帯」の 20 代、 30 代が 14.2 10.8 とありますが、全体の足りない分に対してここだけで大体4分の1を占めていることになります。

 7ページは世帯主の年齢階級別に、世帯構造別の世帯数の構成割合を国勢調査と比較したものです。国民生活基礎調査は概ね 60 歳代くらいまでは単独が低く、「夫婦と未婚の子のみの世帯」の割合が逆に高くなっていますが、 70 歳代以上ではそれほど大きな差がないという結果になっています。

 8ページ目は世帯人員別に捕捉率を見たものです。「1人世帯」は単独と同じですので 61.5 、2人以上の世帯では8割くらいの捕捉となっております。

 9ページ目は世帯人員と世帯主年齢で見たもので、やはり「1人世帯」、「2人世帯」の若年層が低いという結果になっております。

10 ページ目、世帯人員別に非捕捉率を見たものですが、ここでは「1人世帯」、「2人世帯」を合わせた非捕捉率が全体の4分の3くらいを占めています。

11 ページは世帯主の年齢階級別に世帯人員別世帯数の構成割合を国勢調査と比較したものです。 20 代、 30 代の「1人世帯」は国勢調査に比べ約 10 ポイントくらい低くなっています。

12 ページ目は世帯類型別の捕捉率を見たもので、「高齢者世帯」は 87.9 %と高く、「母子世帯」、「父子世帯」、「児童のいる世帯」がやや低くなっています。

13 ページ目、世帯類型と世帯主年齢階級別に見たもので、「高齢者世帯」は 80 %以上ということで年齢階級別の差は大きくなく、「母子世帯」や「父子世帯」は 40 歳代以下でやや低めになっております。

14 ページ目は世帯類型別に非捕捉率を見たもので、「高齢者世帯」は全体の 11 %程度、「その他の世帯」が 87.3 %となっておりますが、これは世帯類型というのが高齢者、母子、父子世帯以外が全てこのシェアに入ってきますので、そこのシェアが全世帯の8割くらいを占めていることでこういう割合になっているということです。

15 ページは世帯主の年齢階級別に世帯類型別の世帯数の構成割合を見たものです。どの年齢階級でみても両調査の構成割合はそれほど大きな差が出ていません。

16 ページは住居の種類と建て方別に捕捉率をみたものです。住居の種類でみますと、「持ち家」や「社宅・公務員住宅等の給与住宅」の捕捉率は高くなっておりまして、「民間賃貸住宅」が非常に低いという結果になっております。また、「一戸建て」か「共同住宅」かという見方をしますと、「一戸建て」に比べて「共同住宅」の捕捉率が低い。オートロックマンション系のところは低いということです。

17 ページは住居の種類と世帯主年齢階級別に見たものです。「持ち家」は 30 歳代以上で大体8割を超え、一方で「民間賃貸住宅」はどの年齢階級でも低い結果になっております。

18 ページ目が住居の種類と世帯主年齢階級別の非捕捉率を見たものです。「民間賃貸住宅」は全体の捉えていない部分の5割をここで超えており、特に 20 歳代、 30 歳代を合わせると大体3割近くになっています。

19 ページは世帯主年齢階級別に住居の種類の構成割合を見たものです。「持ち家」の割合は概ねどの年齢階級でも国勢調査より高めに出ておりまして、「民間賃貸住宅」が逆に低いという結果になっています。

20 21 ページはまとめて御説明いたします。仕事の状況と世帯主の年齢階級をクロスして捕捉率を見たものです。 21 ページのグラフでは「仕事あり」の 29 歳以下のところで低く、 30 歳以上では概ね8割以上。「仕事なし」では 49 歳以下のところで低く、 60 歳以上では大体8割くらいを占めています。「正規」の働き盛りの 30 50 歳代については概ね8割くらい、「非正規」は若年層で低く、 50 から 60 歳代あたりが高くなっています。

22 ページは仕事の状況と世帯主の年齢階級の非捕捉率ですが、右から2つ目の「正規」のところ、 30 歳代から 50 歳代のところが大体 10 %程度あるのですが、ここはもともとの母数も多いので捕捉できない部分の3割くらいがこの部分になっています。

 最後に 23 ページですが、世帯主年齢階級と仕事の状況の構成割合を国勢調査と比較したものです。国民生活基礎調査は「正規」と「仕事なし」で国勢調査より低くなっており、逆に「自営業主」のところは高めに出ているということです。これが平成 22 年同士の比較をしたものです。

 次の資料4は、平成 22 年の国勢調査と 25 年の国民生活基礎調査の世帯数の比較です。平成 25 年の国民生活基礎調査の調査対象地区は平成 22 年の国勢調査の地区から抽出するので、1(1は丸の中に数字)のようにそのまま調査区番号をキーとして国勢調査とマッチングすることができます。2(2は丸の中に数字)は実際に抽出した調査地区において、2年9か月くらいの間でどのくらいの世帯数の変動があったかを見たものです。

 2ページ目は世帯数の増減がどのような要因で生じているのかをイメージしていただくために作成したものです。左側の平成 22 年のある国勢調査区の世帯数を仮に 100 とすると平成 25 年の国民生活基礎調査の集計客体数が 83 世帯だったという例です。減少の要因としては「死亡」、「転出」で世帯が対象地区から外れた場合、「面接不能」や「調査拒否」などで未回収になった場合等があります。

一方で増加の要因としては新たに転入世帯が入ってきた場合、そこが対象になり回収できれば増加となり、未回収はそのまま未回収ということになります。この例ではもともと異動がなく回収できたというものが 69 ありまして、転入で回収できたものが 14 、合わせて 83 が回収できた。もし未回収の 17 というのがなければ大体 103 くらいになるのですが、これまでの平均的な回収実績としては大体8割くらいなのですが、そういうものを考慮しますと大体2年9か月くらいでこのくらいの世帯の異動があり、なおかつ未回収の部分が平均的にこのくらい発生しているというようなことになります。

 当初は両調査の調査地区の名簿を用いて、この増減要因を今申し上げたような詳細に分析する予定でいたのですが、国勢調査の調査世帯一覧の閲覧に一定の取扱要領というルールがあり、そこで調査地域の境界確認に限り閲覧を認めるということになっておりまして、今回のこういう調査では利用できないという回答を得たために、仕方なく調査地区ごとの増減の比較を行いました。

 3ページ目以降が実際の結果です。平成 25 年の国民生活基礎調査 5,530 地区で調査不能地区等を除くと 5,308 地区。これについて集計した結果、世帯数が 22 3,932 世帯。国勢調査に比べてマイナス5万 8,839 世帯。率にしますと 79.2 %となっております。 25 年の国民生活基礎調査の世帯票の回収率が 79.6 %ですのでほぼ同じくらいの結果になっています。

 4ページ目は両調査の世帯数階級別の地区数を見たものです。四角で囲っているのは階級の中で変動がなかったということで、下側にいきますと世帯数が減少したという地区で、そこの数が多いということで全体的に低い方に動いているということです。

 5ページ目では世帯数の増減幅別に地区数と構成割合を見ております。増加した地区は全体の 7.6 %、増減なしが 4.1 %、減少した地区数が 88.2 %、約9割近くが減少。そのうち1~ 10 世帯くらいの減が 48 %で約半分あり、 11 20 の減が2割くらいということで、合わせて2割くらいの減が全体の7割くらいを占めているということです。

 最後に6ページ目は世帯数の差を増減率別に見たものです。 10 %未満の減少が全体の 22.5 %、 10 20 %未満の減少が 24.3 %ということで、この2つで大体5割弱となります。

 以上が、平成 22 年と平成 25 年の国民生活基礎調査において実際に対象となった調査地区と同じ平成 22 年の国勢調査地区をマッチングさせて個票のデータで分析したものです。基本的には調査から分かっております若年・単身の捕捉が十分でないということが国勢調査の数との乖離に大きく影響していることには変わりないと考えておりますが、お気づきの点など御議論いただきまして評価をお願いしたいと考えております。

 以上でございます。

○廣松座長
 ありがとうございました。それではただいまの事務局の説明について、この研究会として評価を行います。御質問を含め、御発言いただきたいと思います。まず順番に資料3からお願いしたいと思いますが、いかがでしょうか。

 まず単純なことですが、例えば資料3の4ページ、 12 ページ等、それ以外のところでも「その他の世帯」というところがありますが、全部定義は同じですか。例えば4ページの「単独世帯」、「核家族世帯」等の「その他の世帯」の意味と、 12 ページの「高齢者世帯」「母子世帯」等の「その他の世帯」とでは定義は同じですか。

○中村室長
 それは違います。まず4ページの方は「単独世帯」と「核家族世帯」と「三世代世帯」以外が「その他の世帯」。
12 ページは「高齢者世帯」「母子世帯」「父子世帯」以外が「その他の世帯」ということで、意味合いも違いますし数も当然違ってまいります。

○廣松座長
 分かりました。

○津谷委員
 資料3の2ページですが、国民生活基礎調査と国勢調査のマッチングをなさっているのだろうと思いますが、平成
22 年の国民生活基礎調査の対象は 5,510 ということですが、これはクラスターサンプルをとられているのでしょうか。

○中村室長
 はい、いつもどおりです。

○津谷委員
 クラスターサンプルですよね。そこで、このサンプルと国勢調査とをマッチングされた結果、不一致が
1,650 ということですが、これは結構大きい数ですので、もう少し具体的にご説明いただけますか。

○中村室長
 平成
22 年の国民生活基礎調査は平成 17 年の国勢調査から抜きます。平成 17 年の国勢調査とは調査区番号がストレートに一致しますが、平成 22 年とマッチングしようとすると例えば平成 17 年の 10 番という調査区番号があります。それが平成 22 年の調査をする段階で世帯数が例えば倍くらいになったといったときに、番号を振り直しがされるわけです。

○津谷委員
 ということは、要は、5年間の間に
census tract 、つまり国勢調査の調査区が変わったということですか。

○中村室長
 番号が変わったわけです。単純に番号だけでは比較できないです。

○津谷委員
 それを除外されたわけですね。

○中村室長
 国勢調査区というのは調査区番号以外に基本単位区番号というものがありまして、これは市町村の境界等が変更になった場合には変更されますがそれがなければ5年、
10 年、 15 年とずっとその番号を継続して裏でもっているのです。国勢統計課と御相談し、調査区番号と基本単位区番号の両方が一緒であればほぼ同じ地区と見なしていいだろうという御助言をいただきまして、両方が合うものについてやったところ、 1,650 が不一致であったということです。

○津谷委員
 国勢調査区は、英語でいう
census tract ですよね。これと基本単位区番号を一緒にして、ここからキーを作って作業されたということですが、人口の分布は変わりますので一概には言えませんが、1つの調査区番号の中に基本単位区が複数あると考えてよろしいのでしょうか。

○北専門官
 いろいろなパターンがありまして、複数の基本単位区番号で1つの調査区を設定している場合もありますし、例えば1つの基本単位区で、例えば高層マンションですと1基本単位区で階ごとに調査区を分けているパターンもありますし、基本単位区1つに対して1調査区というパターンもありますのでいろいろなパターンがあるということです。

○津谷委員
 基本単位区というのは1つ上のレベルで、そこに調査区が出てくるわけですね。

 なぜこんなことをお聞きしたかといいますと、「調査不能」とか、「施設等の世帯」については、国勢調査の匿名データを作ったときなどもこれらについては別の単位として取り扱っていましたので、これは構わないのですが、ここの部分と残り約7割について、絞り込んだときにどうして合わなかったのかと思いお聞きしました。

○中村室長
 何が一番同じと見なせるのかと考えたときに国勢統計課と相談してこれが一番いいだろうという話です。ほぼ同じなので差が検証できるという。同じと見なしていいだろうと。

○津谷委員
 だからこれで差が検証できるということですね。

○廣松座長
 その意味では基本単位区というのはどちらかというと街区、物理的な特徴で分けています。調査区の方は
50 世帯くらいですが、基本単位区は 25 世帯くらいが目安です。

○津谷委員
 国勢調査区はそうです、それぞれの人口規模や世帯数が大体同じになるようになっています。

○廣松座長
 国勢調査と同じになるように区分けをして番号をつけているわけですね。

○津谷委員
 もう1つお尋ねしますが、国勢調査は
10 月1日付けで実施されていますが、国民生活基礎調査はどうですか。

○中村室長
 世帯票は6月頭です。

○津谷委員
 そこからリサンプルしますよね。

○中村室長
 その中から単位区割をして所得票は7月です。

○津谷委員
 ということは、調査は6月から7月に実施されるということですね。

○中村室長
 はい。

○津谷委員
 これは先刻分かっていたことですが、大都市圏に
1 人で住む若い人は、どんな調査でも捕捉が難しい、特に男性ですね。調査にもよりますが。

○中村室長
 この調査で住居の種類でみると、持ち家はよくて共同住宅や民間のところは悪いというのはある程度予測できるのですが、そういうところがはっきり出ています。

○石井委員
 今の基本単位区番号と調査区番号の一致・不一致のところですが、そこは一致・不一致のパターンの特徴はあるのでしょうか。7割のところを代表的なものと考えていいのか、一致しないと特徴があって、7割のところが偏ったものになっているかどうかを検証できる術は何かあるのでしょうか。

○中村室長
 例えば5年の間に新たに指定都市になった場合には基本単位区番号や調査区番号が全く新たに振られてしまうということがあり、そこは丸々抜けてしまうことがあります。

○津谷委員
 私もそこは少し気になっています。7割というのは結構微妙な数字で、あまりいい加減なことは言えないのですが、これが6割くらいになってくると不一致であった部分をもう少し見た方がいいと思います。なぜかというと不一致が発生するには必ず理由があります。政令指定都市が新しくできたので別の行政単位として割り振ったということはもちろんあるかと思いますが、国勢調査は地方公共団体、つまり市区町村その他にお願いしてやっていただく部分が非常に大きいので番号を振るのは仕方がないと思います。廣松先生もおっしゃいましたように、国勢調査区は単位区が集中していると多くなりますし、以前は平屋の家が建っていたものが超高層マンションになれば一遍に世帯数が増えますので、これは割らざるを得ないということはあると思います。しかし、地理的な情報があり、そこに居住する人の数や世帯の数が大きく変わった場合、人口が移動したので不一致が発生しマッチングから外れたとするしかないのでしょうか。

○中村室長
 例えば指定都市になれば番号も全部変わってしまうところもあるわけです。そのときにそこをどのように探しにいくか、同じとみなせるところをどうやって探しにいくか、そこはなかなか難しいところだと思います。

○津谷委員
 そうですね、代替案を出せと言われても困るのですが、7割だからいいのかなと。

○中井参事官
 動きがあるところがむしろ入ってこなくなってしまうということですね。

○津谷委員
 そういうことですね。人口の分布が急に変わりますので。

 国民生活基礎調査はクラスターサンプルでデータをとっていますが、持ち家であれば人や世帯はそう簡単には動きません。ですから借家、特に民間の借家が多いと不一致が多くなるのは先刻分かっていたことですので、これが非標本誤差に影響していないか少し心配ですが、どうでしょうか。

○西郷審議協力者
 関連する質問で今回の比較とは少し違うのですが、例えば今回比較していただいたのは平成
17 年の国勢調査区を使い平成 22 年の国民生活基礎調査の標本抽出などが行われるわけですね。

○中村室長
 はい。

○西郷審議協力者
 でも実際に調査が行われるのは平成
22 年になるので、国の様子あるいは調査区の様子としては平成 22 年の国勢調査の調査区が現状をあらわしているものとして一番新しい名簿になるわけですが、5年前の名簿を使ってクラスターサンプリングで調査区に行くと全然様子が違っているということが3割くらい起きているという見方をしてよろしいわけですか。

○中村室長
 同じところが、ということですか。

○西郷審議協力者
 マッチングできなかったということはおそらく現状と自分たちが持っている名簿がずれているということですよね。そのように見てはいけないものですか。

 例えば国勢調査の方はどこかの地域に非常に大きな集合住宅ができたので平成 22 年には集合住宅が当たった調査区は番号が付け替えられた。ところが国民生活基礎調査の方は平成 17 年の国勢調査区でサンプリングを行っているのでそんなに大きな住宅があるとは思わずに行ってみたらものすごく大きな集合住宅が建っていてこのままでは調査できないというようなことが3割くらいの確率で起きているということではないか。

○中村室長
 そういうことではありません。

○津谷委員
 そういうことではないと私も理解しました。先ほどご説明があったように、新たに政令指定都市ができた場合、行政基本単位区番号を新たにつけるのは当然ですが、先ほど指摘した一軒家が集合住宅に建て替わった場合、事情はもう少し複雑なるのではないかと思います。建て替えによって、おそらく住む人や世帯も変わると思いますので。とはいえ、新たな基本単位区番号について、以前の番号は分かりますよね。例えば、政令指定都市になる以前は何県の何市の何区だったということがわかるのではないでしょうか。この突合を行って不一致をある程度つぶすことができれば、この
1,650 は全て排除しなくてもよくなるのではないかと、非常に単純ですが思いました。

○中村室長
 指定都市などが新しくできてしまうと基本単位区番号そのものも変わってしまいます。

○津谷委員
 ですから、新しく変わる前の基本単位区番号とマッチングできないのかということをお尋ねしています。それとも、最終的には世帯をマッチングしなければいけないので、このような作業はやっても仕方がないのでしょうか。

○稲葉委員
 私からも2点ほど。以前私も提案したことがありましたが、
GIS のシステムが入っているのでポリゴン情報としては総務省は持っている筈です。ですので、かなり大変な作業になるとは思いますがそれを見て地図上で合わせることは可能ではないかと思います。今は番号で合わせていらっしゃるわけですから、番号が変わると全然分からないという情報ですが、地図上で分かれば何とかマッチングは可能かもしれません。

 それに関連してもう一点、 20 ページの結果が非常に興味深くて、単身の若年あるいは共同住宅の捕捉率が低いのは想定できることかと思うのですが 20 ページを見ますと自営業主が多くなっているということで、特徴が出ていますので先ほど議題になった7割しか取れなかったところの何らかの特徴が出てきているのではないかという印象はあります。本来なら数字が 100 以上になるのはあまり起こり得ないことですので、この解釈がよく分からないのですが。

○中村室長
 私が考えるには、自営業主というのは家にいるので当然会えます。一方でマンション系の方は会えないので回収率が低いということで、全体的に見ると会えない部分が低く出るので、自営業主が普通にちゃんと取れたとしても割合としては多く出てしまうということではないかと思います。

○稲葉委員
100 くらいならそれかと思うのですが、 100 を超えるということの解釈が。

○津谷委員
 これは、このカテゴリーに属するケースの数が小さいことによると思います。ここではカテゴリー別に出されているのではっきりしないのですが、これは
2010 年の国勢調査のデータですよね。

○北専門官
 はい、平成
22 年の国勢調査です。

○津谷委員
 むしろもっと心配なのは、役員以外の雇用者、つまり人に雇われて働いている人の落ち込みが大きいことです。高齢者以外では、就業人口に占める雇用者の割合は非常に高く、雇用者の全体へのウェイトは大きいので、役員以外の雇用者の率が満遍なく低いことの全体に与える影響が懸念されます。とにかく、該当する数が少ないと率が非常に大きくなります。個人的には、該当数が少ない場合には、数値を出さない方がいいのではないかとも思います。

 さらに言うと、カテゴリー別の数のディストリビューションがあるといいですよね。各カテゴリーが全体に占める大体のウェイトが分かりますので。そして、全体に占める割合が高いカテゴリーの捕捉率に特に注目する必要があります。それが非標本誤差全体に与える影響は大きいですから。

○中村室長
 自営業主のところで例えば
19 歳以下の 500 などというのはもともとサンプルの実際の世帯が5しかないので、これはもう見なくていいと。それと、全体で 15 9,000 くらいあるのですが、その中で役員以外の雇用者は6万 8,000 くらいありますので半分よりやや少ない。その中で例えば 2,000 などというところは明らかにサンプルが少ないところです。役員以外の雇用者で一番多いのは働き盛りの 30 50 歳代。ここでいうと 75.7 80 %くらいのところが一番サンプル数が多く、そこは概ね 75 80 %くらい取れていて、低い 61 %くらいのところはサンプルが少ないのであまり気にしなくてもいいかな、というくらいで構わないと思います。

○稲葉委員
 少しおかしいなと思ったのは比率的なものもあったのですが、たぶんどちらかの調査で間違えているということでしょうか。つまり、1対1に対応して数値が
100 を超えるということは、国勢調査あるいは国民生活基礎調査の。

○中村室長
 不詳の割合が国勢調査が多いということでしょうか。

○稲葉委員
 不詳は取り除かずの比較ということですね。分かりました。

○津谷委員
2000 年以降、国勢調査でも不詳が非常に増えています。

○中村室長
 例えば「仕事の有無の不詳」
48 %というところがあります。ここはサンプルでいうと国勢調査が1万 2,800 くらい、国民生活基礎調査が 6,000 くらいしかないのです。

○稲葉委員
 分かりました。不詳の部分ですね。

○中村室長
 そういう意味の処理の違いが若干出てきてしまう。

○津谷委員
 特に若い年齢層で不詳が多いですよね。配偶関係もそうですけれども。ですから不詳を除いて、集計することが多いのではないかと思いますが、今まではまだ何とかもっていますが、今後不詳が更に増えていくとすると、不詳を除いて集計してしまっていいのか心配です。不詳を除いて残りについて比例按分することが目的ではなく、マッチングが目的であり、カテゴリーを決めてマッチングをしていかなければいけないので、不詳の処理は大きな課題だと思います。

○稲葉委員
 地域でずいぶん違いますものね。

○津谷委員
 ただオンライン調査が普及すると、オンラインでは設問に全部答えないと終われないので、不詳は少しは減るかなと思います。

○稲葉委員
 ずいぶん違うのではないでしょうか。

○中村室長
 国勢調査は今回4割くらいでしたか。

○津谷委員
 4割弱です。

○中村室長
 前に比べれば増えたと思います。

○津谷委員
 しかし、調査票が比較的単純な国勢調査と違って、国民生活基礎調査はもっと複雑ですので、オンラインではできません。やれないし、やるべきではないと私は思います。

○廣松座長
 資料3に関して、読み方から始まっていろいろ御指摘いただきましたが、ほかによろしいでしょうか。

 確かにもしこの資料を公表するとしますと、今いろいろ御質問があったような点に関しては少し丁寧に説明しないと、この数値のままですと読んだ人が誤解するおそれのあるところがあります。その意味で特に今の 20 ページの仕事云々のところの「注」のところで今議論があったような、例えば「不詳」の説明なども加えていただいた方がいいでしょうね。

○津谷委員
 これは外に出すべきかどうか分かりませんが、数が非常に少ない場合は気をつけないといけません。これは例えですが、多変量解析でも説明変数の係数だけを出すのではなく、各変数の記述統計量を見る必要があります。割合が小さいと当然標準誤差は大きくなりますので、気をつけないといけません。

○中村室長
 実際のサンプルの実数データは作っていますので、後ほどメールなどで送らせていただきましょうか。

○津谷委員
 今回は結構です。

○中村室長
 異常値が出ているのは大概がそういうサンプルの。

○津谷委員
 言いたいポイントは、大事な部分を押さえて、それを何とかすると全体の状況の改善につながるというところに時間もエネルギーも集中してやった方が、効率がいいのではないかということです。

 ついでに言いますと、見さていただいた棒グラフはすごく分かりやすいです。本当にありがとうございます。作図するのに多くの時間を使われたかと思います。私たちはいろいろなコメントを出していますが、そのためのデータの整理と作図にかかった労力に対して敬意を表したいと思います。

ただ、これらの図をみていくときに、パターンで見ていますよね。例えば5ページの図が良い例だと思うのですが、世帯を世帯構造別に分けて、次に世帯主の年齢別に捕捉率を見ています。その際、関連する図が同一ページに一緒に示されているのはすばらしいのですが、さらにスレッシュホールドというのでしょうか、この値を超えたら注意した方がいい一種の分岐点を決めて、データをみていくとより有用ではないかと思います。例えば、世帯主の年齢によるパターンをみる場合、例えば7割を切っているようなところに焦点をあてて、それが全体に占める割合がある程度高く、また一年だけではなく、トレンドとして増加傾向がみられる場合に、ここはどうして低くなっているのかを考えるようにした方がいいのではないかと思います。

もし国民生活基礎調査が確率サンプルで抽出されているのなら、回答率にしたがってサンプルウェイトを計算すればいいので簡単なのですが、国民生活基礎調査は確率サンプルではありませんので、簡単にサンプルウェイトは計算できません。そうすると、どうしてもある程度の回答率を保つことが問題になってきます。調査結果に選択性のゆがみがかかっているのではないかと言われないためにも、そして重要な施策にこの調査の結果が使われるわけですから、全体にかかるウェイトが大きい部分の回答率を上げることに焦点をあてて、もう少し掘り下げてやってみればどうでしょうか。

○中井参事官
 コアになる部分を取り出してそこを中心的に考えるということですね。

○津谷委員
 はい。きょうは大変インフォーマティブな情報をいただいて、とても参考になりました。これは絶対にやらなければいけないステップですが、これからのことを考えると、新しい方向性を考えなくてはならないと思います。非標本誤差の問題は、国民生活基礎調査だけではなく国勢調査を含むほとんど全ての調査、特に世帯調査は個人調査が直面する課題だと思います。厚生労働省はマッチングするための基礎情報をもっていらっしゃるわけですので、そのアドバンテージをフルに活用してさらに掘り下げて検討を進めていくステップにして頂ければと思います。解決方法が簡単に分かればこんなことにはなっていないわけで、おそらく日本中のだれに聞いても簡単な解決法はないように思います。

○廣松座長
 先ほどの話ですが、ぜひ率の方ではなく分布の実際の数の情報を後ほどいただければと思います。

 時間の関係もありますので、次の資料4の説明に関してはいかがでしょうか。

○津谷委員
2010 年に国勢調査が実施された3年後の 2013 年の国民生活基礎調査ですね。とても興味深い結果ですが、単位は世帯ですか。

○中村室長
 通常国勢調査を作っているのは大体
50 世帯くらいなのですが、分かりやすいようにあえて 100 にしました。

○津谷委員
 質問の意味はそういうことではなく、ここに出ているのは世帯数ですよね。もしそうであれば、世帯数が減っているものが多い。
2010 年から 2013 年までの3年間のうちに世帯員が死んだ場合、世帯構造が変わる可能性があります。例えば、今まで夫婦世帯だったが、夫婦のどちらか一方が亡くなると単独世帯になる。あるいは、多世代同居世代だったけれども、祖父母世代のだれかが死んだり施設に入ったりした場合、世帯としては同じ場所に居住していても、世帯構造や世帯規模が変わってくることがあるのではないかと思います。

 つまり、世帯が最小単位であれば全く問題ないのですが、世帯を構成する人間がいますので、世帯の中身がわからないと十分な検討ができないことが懸念されます。非標本誤差を検討するにあたって世帯単位でしかデータが出されていませんが、できればその中身についても情報があるとよいと思います。世帯数が減っているのが多いのですか。

○中村室長
 減っているというか、転入・転出があって、その中でなおかつ未回収の部分まで加味しますね。それを加味すると大体イメージとして国勢調査で
100 世帯あって2年9か月くらいで実際にはこういう出入りがあり、そのうち回収できるものが8割くらいになっているというイメージです。 世帯構造までは見られない。

○津谷委員
 もちろん世帯単位で転入・転出する場合もありますが、世帯はそのままで人間が動くこともありますので、それを心配しています。そういう場合はどうなのでしょうか。

○中村室長
 例えばいままで夫婦世帯であったのが、片一方が亡くなられて単独になった。その場合でもその世帯がそこにいて回収できれば、ここで言う、「回収」に入るわけです。でも丸々どこかに世帯ごといなくなってしまうのが転出。

○津谷委員
 それは世帯のことですか。

○中村室長
 はい。ですから、三世代が夫婦と子どもだけになってしまった場合もその世帯がそこに存続すれば残るということになります。ですから世帯数の異動しか分かりません。

○中井参事官
 世帯は残るけれども世帯属性が変わることはあるということで、そのカテゴリーが動くということですね。

○中村室長
 それはあります。

○津谷委員
 1人になってしまったので、家を売ってマンションに引っ越すなどという場合はどうなりますか。

○中村室長
 それは転出になります。

○津谷委員
 同じ地区に住んでいても。

○中村室長
 その地区にいれば異動なしになるのですが。もし回収できればここで言う、「回収」というグループに入ってきます。

○津谷委員
 決して批判しているわけではないのですが、面接不能とか転出・転入という場合は、先ほど言われたように借家の場合が多いとか、若い人で1人世帯が多いとかではないでしょうか。面接不能が都市部に多いというのは、たとえ家にいても出てこない、居留守を使うということですが、これが非標本誤差につながるのではないかと思います。同居する人がたくさんいたら、会ってくれる確率も上がると思いますが、若い女性が1人で住んでいたら、たとえ在宅していても会わないこともあるだろうし、仕事に出ていれば当然なかなか会いにくいということがありますので、非標本誤差を少しでも減らしていくという最終的な目的を考えたときに、世帯単位だけでなく、もう少し細かい情報があれば、さらに有効な対策を考えることができるのではないかと思います。これを作られるのに大変な労力をお使いになっているのはよく分かっておりますが、私たちがここに来させていただいている意味は、これを見て、もう少しこういう情報があったらさらに良いアイデアを出せるのではないかということを示すことであると思いますので。世帯単位でしか出ないのですよね。

○西郷審議協力者
 津谷先生がおっしゃりたいことは分かったつもりです。ただ、集計が調査区を集計単位としてやっていますので、こういう表が中心になると思います。ある地区の中に入っている単独世帯数同士でクロスするとかはできるのではないでしょうか。単独世帯数に注目してクロスを作ることはできそうな気がするのですがそれは無理でしょうか。そうすると減り方が単独世帯の場合はこれだけ下の方に動いているけれども、そうではない世帯ではあまり違いはないなどといった比較はできそうな気がするのですがそれは難しいでしょうか。

○中村室長
 例えば単独と単独以外に分けて変動がどうかという見方をするということでよろしいのでしょうか。

○中井参事官
 特に若い人は単独の方がよく動くのではないかということですね。

○津谷委員
 あるいは会ってくれないのではないかということです。

 おそらくこれだけですと、これから先にはいけないような気がします。先生が言われたように今は地区数、世帯数になっていますが……。

○中村室長
 そこは次までにできるかどうか検討させてください。

○西郷審議協力者
 基本的に調査区を1つの観察単位として勘定をしているわけです。この場合には世帯数を調査区の特性値と見て勘定をしているわけですが、それを例えば単独世帯数だけを勘定する、あるいは2人世帯だけを勘定するとすればできそうな気がするのですが。

○中井参事官
 つまり、ここをそれぞれ世帯構造に分けて取り出し、それぞれで同じようなことがどうなっているかを見れば特徴が分かるのではないかということですね。

○西郷審議協力者
 それと同じことになります。

○中村室長
 次に向けて検討させてください。

○廣松座長
 単独、単独以外で十分でしょうか。あるいはもっと細かく割る必要がありますか。

○津谷委員
 年齢など、そこまで細かく割る必要はないのではないかと思います。ただ、ヘッドカウントくらいは欲しいですね。あと地区の特性は分かりますか。

○中村室長
 例えばどういうような。

○津谷委員
 例えば大都市、中都市、小都市、郡部といった地区の属性が。

○石井委員
 地区の情報ですね、例えば農業をやっているところなどの属性でしょうか。

○津谷委員
 地区の属性の数が多いので費用対効果を考えなくてはなりませんが、もう少し世帯の特性と地区自体の属性からみて、どこでたくさん減っているのかなどが分かれば。

○中村室長
 層化の中に地区の属性がありますので、そういうもので区分けして例えば人口集中や非集中とか、そういう見方でよろしいのでしょうか。

○津谷委員
 はい、結構です。これですと地区の中の世帯だけを比べて「ああそうですか」というくらいしか分かりませんので。

○中村室長
 そこも含めまして検討させてください。

○廣松座長
 その作業自体も、統計局が国勢調査の調査データをもう少しちゃんと出してくれればいいのですが。

○津谷委員
 統計法による縛りが何かあるのですか。

○中村室長
 統計局内の調査世帯一覧の閲覧の取扱要領のようなものがあるようですね。

○津谷委員
 これは研究会のためなのでだめだということでしょうか。

○中村室長
 研究会ということではなくこういう使い方が。

○西郷審議協力者
 どういう情報まで出してよいかについて統計局内のルールがあり、それに照らすとできないという話だと思います。それはどこかで言った方がいいと思います。

○廣松座長
 そのあたりはよく分かりませんが、新統計法になってからかえって窮屈になったのでしょうか。

○中村室長
 従来からそういう要領はあるのではないでしょうか。

○廣松座長
 では議題1の資料3及び資料4に関しましてはよろしいでしょうか。

 まず資料3に関しては分布の情報が欲しいという要望ですので、それを次回に対応をお願いしたいということ、また先ほど解釈の仕方のところで御議論があったかと思いますので、多数の表やグラフをつくっていただいていますが、これを最終的な報告書として公表する場合には読み方に関して注をつけていただいた方が誤解が少なくなるのではないかという気がします。

 資料4につきましては、単独世帯とそれ以外とは別のカテゴリーで地区の属性別にデータが取れるようであればそういう形で資料4に対応するような情報を出していただければと思いますので、よろしくお願いいたします。

 

(2)国民生活基礎調査の推計方法に係る検証・検討

○廣松座長
 本日はもう1つ議題がございまして、国民生活基礎調査の推計方法に係る検証・検討について、資料5を用意していただいておりますので説明をお願いします。

○中村室長
 資料5は平成
22 年度に成蹊大学の岩崎教授を座長として取りまとめいただいたものです。その当時も研究会を開いており、西郷先生、稲葉先生、石井先生にも御参画いただいております。この研究会の報告の中の「全部不詳データの補正について」というところを抜粋したもので、既に統計委員会の人口・社会統計部会にもこの資料で報告し、一度は皆様に御覧いただいているのですが相当時間が経過しておりますので、改めて簡単に御説明させていただきます。

 現在世帯票の回収率は大体8割程度で2割は回収できていない。これをどのように補正するかということで平成 19 年のデータを用いて3通りの方法で推計値の補正を試みています。

 「1の世帯票・健康票の推定について」、1つ目は1(1は丸の中に数字)にあるように世帯票の調査区別有効回答世帯数を用いる方法です。国勢調査区の一調査区当たりの世帯数を標準的には 40 世帯程度と考えて、実際にその調査地区から回答が得られた数が 40 世帯に満たない場合は回答世帯をnとしてn分の 40 という倍率で調整を行うものです。そしてその調整係数で調整した都道府県・指定都市別の世帯数の合計と、それぞれの6月1日推計人口との比をもって修正拡大乗数とし、調整係数、修正拡大乗数の積をウェイトとして各推計値を算出するものです。

 2つ目の2(2は丸の中に数字)は世帯構造に世帯主年齢階級別世帯分布を用いる方法です。ここは2つに分かれており、(1)は国勢調査の結果を利用する方法です。層別に世帯票有効回答世帯数と、 17 年の国勢調査の世帯数の比を調整係数としまして、1(1は丸の中に数字)と同様に修正拡大乗数の積をウェイトとして推計数を算出します。

 3つ目は(2)で所得票の有効回答世帯数の割合を用いる方法で、調整係数としては所得票の回収率の逆数をとる以外は(1)と同じ方法によります。なお書きで所得票の対象世帯が存在しない場合については適宜全国値を代入して補うといった3つの方法で推計して、世帯構造別の世帯数の構成割合や世帯員の年齢階級の分布を確認しました。

 2ページの上の方のグラフは世帯構造別の世帯数の構成割合の平成 17 年国勢調査との差を示しております。5本棒がありますが左から2番目の水色のものが現在の国民生活基礎調査の推計方法による推計値です。単独ですとアンダーエスティメイト、それ以外ですとオーバーだったりアンダーだったりということになっております。左から3番目のオレンジの世帯票の調査区別の有効回収世帯数を用いる方法でも現在のやり方と近い形になっておりまして、補正の結果があまり芳しくないという状況です。

 右から2番目、黄色はほとんど出ていないのですが、そもそも国勢調査の世帯数に合わせにいっておりますので、これは差が出ないのが当たり前ということになります。

 一番右の赤の部分は所得票の有効回答世帯数を用いる方法ですので、これでもやはり補正の状況は完全にいかないという結果になっております。

 上が世帯数の構成割合、下のグラフが世帯員の年齢階級別の人数の分布の差を見たものです。先ほど国勢調査に合わせにいった場合の黄色の部分は上の図の世帯数は差が出なかったのですが、年齢階級の人数の分布を見ますと若い方で上の方に上がっていたり、高齢の方では下に突出しているというようなものが出ております。これ以外のオレンジや赤の部分もオーバーだったりアンダーだったりということで、どの年齢階級をとってもあまりよい補正にはなっていないという結果になっております。

 3ページ目は所得票・貯蓄票の推定で、基本的には先ほどの世帯票と同様の方法を用いますので異なる部分だけ御説明します。

 1(1は丸の中に数字)の所得票の単位区別回答世帯数を用いる方法ですが、所得票は調査地区を区割りした単位区で行っておりますので、単位区ごとの回答世帯数が 20 に満たない場合はn分の 20 で調整を行います。また拡大乗数につきましては現行の拡大乗数をそのまま使ってウェイトしております。

 2(2は丸の中に数字)番目の世帯構造と世帯主年齢階級の世帯分布を用いる方法も2通りありまして、(1)の国勢調査の結果を用いる方法は、所得票の有効回収世帯数を使う以外は先ほどの世帯票のやり方と同じです。(2)の所得票の有効客体数の割合を用いる方法は、国民生活基礎調査はまず世帯票の回収を行い、回答が得られたところからさらに所得票の回収を行うという2段の回収を行っております。この2回の回収で同じような偏りが発生すると仮定するという条件で、都道府県・指定都市×世帯構造×世帯主の年齢階級別の3つのクロスの調整係数として回収率の逆数の2乗を用いるというやり方です。これらによって先ほどと同じようなものの分布を見たものが4ページになります。

 上が世帯構造別の世帯数の平成 17 年国勢調査との差です。この方法ですと先ほど直接合わせにいって合うのが当たり前であった右から2番目の黄色の部分もアンダーになったりオーバーになったりということで完全に補正しきれません。ほかの方法でも程度の差はありますがやはり完全に補正しきれないという結果になっております。補正の結果、アンダーかオーバーかも、まちまちになっています。下の世帯員数の年齢階級別の構成割合を見ますとおおよそ若い方でアンダーになって、中高年の方がオーバーになっている傾向になっており、これもやはり補正がしきれないということになっております。

 次に5ページ目。所得というのは分布が重要ですので、補正によって所得分布がどのように変化したかを見たものです。左から2列目が現行方式。平均所得が 566.8 万円に対しまして右側の3種類はいずれの補正も若干低い値になっているということです。また中央値や所得五分位値も同様に低い値になっています。下のグラフの分布を見ていただきますと、左から2番目の現行方式の青の部分に対しましてやや低い階層のところで高くなり、高所得の階層で若干薄くなるというような形になっております。

 6ページ目。こちらの補正に当たりましては、世帯構造と世帯主年齢のクラスの補正を行っているのですが、実際にクロスを行うと所得票の有効回答世帯数がゼロになってしまうところがあり、そもそも総所得の調整ができない場合があります。そういうものを解決するためにまず世帯構造のみで国勢調査に合わせにいった場合ということで条件が加わり、所得の分布がどうなるかを見たものです。

左側の現行方式に比べまして世帯構造だけを合わせにいった場合は 539 万円ということで、 27 万円ほど低くなります。先ほどに比べるとかなり低い値になっておりまして、下のグラフで見てもピンクの部分が 300 万円未満で厚くなり 400 万円を超えると薄くなっています。

 次に7ページ目、年齢階級別の構成割合の差を見ますと、緑色の世帯構造のみを補正にいった場合は若年のところでアンダーに出て、中高年のところはオーバーになっているということで、これも補正しきれないところは一貫しています。

 次に下の帯グラフは4(4は丸の中に数字)のところに書いておりますが、世帯票が回答されて所得票が未回答という世帯を用いた補正ということです。これまで所得票の回答世帯について補正を行っておりましたが、今回のここにつきましてはそもそも所得票の対象世帯そのものを補正対象とするということで、世帯構造別の割合は真ん中のところですが所得票の回答世帯の分布より、より国勢調査の結果に近い分布になったという結果になっております。

 8ページ目。所得票の対象世帯を国勢調査の世帯構造別で補正を行った場合ということで、現行の 566 8,000 円に対して平均所得が 559 万円ということで、先ほどの所得票回答世帯を補正した場合に比べて、そこまで低くないのですが現行より若干低い結果になっており、これは票の分布を見ても、下のグラフを見てもそれが分かろうかと思います。

 このように幾通りかの方法でやっても、その所得金額は現行の方式より低い値になっておりまして、これまで国民生活基礎調査と総務省の全国消費実態調査については貧困率でも結果の差異の分析の中で所得階級の分布を見ると国民生活基礎調査の方が低い方に分布しているという結果になっているわけですが、今回こういう試算をしますと、なお低い方に出るというようなことになってしまいまして、その方法をとるというのはやはり対外的な理解もなかなか得られないのではないかと感じております。

○西郷審議協力者
 全国消費実態調査は学生は対象になっていますか。

○中村室長
 外れております。

○西郷審議協力者
 でもこちらは入っているのでその違いもあるのではないかと思います。

○中村室長
 そういう対象の違いも当然あります。それ以外に向こうは家計簿を取る。どうしても断るところが多いので協力してくれるところが中間所得層に集まりやすいという有識者の見解もあります。

 最後に9ページ目は当時の研究会の報告書の抜粋です。6行目の「しかし」のところからですが、3通りありましたが「どれも一長一短で、補正結果が補正しない場合よりも良くなっているかどうかを含め、有効性が判断できなかった」という評価となっております。ただし、平成 22 年につきましては国民生活基礎調査と国勢調査が同じ年で実施されています。この前は平成 19 年の国民生活基礎調査でやったわけですが、平成 22 年のデータを用いてもう1回試算してはどうかというようなことがここに書かれておりますので、2回目の研究会で 22 年のデータを用いた同様の試算結果を御提示させていただきたいと思っております。

 以上です。

○廣松座長
 ありがとうございました。この推計方法に関しては平成
23 年に公表された報告書の抜粋の形で御説明いただきました。これは平成 22 年度の検討結果なわけですが、次回の研究会では、平成 22 年に国勢調査と国民生活基礎調査が同じ年に実施されていますので、この資料5の方法に基づいてその推計をしていたたき、その結果を皆様に御検討いただきたいということです。

 資料5に関しては、ここにおいでの方々も研究会のメンバーとして入っていらしたということですので、何か補足の説明等がございましたらいただきたいと思いますがいかがでしょうか。

○稲葉委員
 報告書は少し忘れてしまったのですが、いま補正の対象となる規模について、最初に世帯票については回収が8割ということでしたが、2番の例えば3ページの所得票の対象になっていたのはどうかとか、最後の7ページの世帯票の回答があり、所得票の回答がなかった部分の規模がどのくらいであるのかの情報についてはいかがでしょうか。

○中村室長
 まず所得票の回収率ですが、大規模年が大体
75 %くらい。

○稲葉委員
 全体ではなく世帯票の回収の。

○中村室長
 まず所得票だけに限っていいますと、世帯票が回答されてそこを対象にして。

○津谷委員
 それを
100 とするわけですね。

○中村室長
 はい。で、所得票の回収率が大体
75 %くらいです。

○津谷委員
 全体から見ると
0.8 をかけて。

○中村室長
 全体から見ると
0.8 0.75 掛けということになります。

○稲葉委員
 最後の7ページのところは
0.8 × 0.25 くらいでしょうか。

○中村室長
 そのくらいですね。

○稲葉委員
 分かりました。次もそこの情報も合わせていただけるとありがたいです。

○津谷委員
 これは所得票対象者ですから、回答した人もしなかった人も2番目の場合には含まれているということですね。

○中村室長
 そうです。

○津谷委員
 分かりました。

○稲葉委員
 前回はかなり細かい様々なことを実施したのですが、今回はどういう予定でしょうか。

○中村室長
 基本的に個別の一部、例えば項目が不詳というのはいろいろな形で、傾向スコアなどでやったのですが、今回宿題になっているのはこういった全部不詳データの推計方法について、今やっている推計方法の妥当性がどうなのかと、何か新しい推計方法が考えられないかについてもう一度有識者の方々から御意見を伺い、何かいい提案があれば試算をしてみて評価をいただきたいと考えております。

○津谷委員
 いま1の1(1は丸の中に数字)でおやりになっているわけですか。

○中村室長
 いいえ。
グラフでいうと2ページの青い部分ですね。

○津谷委員
 2つ目のトルコブルーのような。

○中村室長
 水色の部分が今のやり方。

○稲葉委員
 参考資料の3です。

○中村室長
 参考資料3が、今まさに拡大乗数でこういうふうにやっていますというのをお示ししています。推計人口に合わせて。

○津谷委員
 それプラス1、2、3とおやりになって。

○中村室長
 別のやり方を3通りしてみたということです。

○津谷委員
 この検討会でおやりになったわけですね。

○中村室長
 水色が現行のやり方です。

○津谷委員
 濃い青色は何もウェイトをかけない、トルコブルーの棒が今のやり方で、ここに示されているこの3つが残りのアースカラーのような茶色っぽい棒ですね。

○中村室長
 そうです。

○稲葉委員
 今回の研究会の対象となっている非標本誤差を考えた際には、いまのお話ですと全項目、つまり所得票が回収されなかった分であるとか世帯票が回収されなかった分に対する検討を行うという理解でよろしいのでしょうか。一部項目未回答を入れるのかどうかということですが。

○中村室長
 そこは今のところ考えていません。

○稲葉委員
 その単位としては所得票、世帯票という単位で考えるのでしょうか。つまりここでいうと7ページにある4(4は丸の中に数字)の検討をするのかどうかということなのですが。

○中村室長
 7ページの4(4は丸の中に数字)についても、平成
22 年のデータを用いてこれと同じものをまず作るということは考えております。それ以外のここでやったやり方以外に何か別の推計方法の提案なりがあれば、それはそれでまた試算してみるというようなことも考えたいと思っていまして、そういうことも含めて御提案なりをしていただければと思っております。

○廣松座長
 この答申の中ではわざわざ注をつけて、世帯属性別の事後層化を用いた推計方法についても検討しろというような書き方になっておりますが。

○中村室長
 そう書いているのですが、実は資料5の1ページ目の2(2は丸の中に数字)、国勢調査の世帯構造×世帯主年齢階級はまさにそういう事後層化でやってみたということなのですが、そういうことを答申に書かれているので、改めてこのやり方を年を変えてやってみるということは考えております。

○津谷委員
 今度は国勢調査と国民生活基礎調査が同じ年度の
2010 年に実施されているものを使って、もう1回これをやったものをお見せいただくわけですね。

 ほとんど全てでいいというものがあれば問題はないのですが、やはりいい部分もあるけれども誤差の大きいものもあります。先ほど申し上げましたけれども、ウェイトが一番かかる部分の補正が一番うまくできるものを中心に検討する。つまりカテゴリーの一番大きいところの補正がうまくいっているものがいいと思います。たしか国民生活基礎調査の所得票を使って日本の政府は貧困率を計算をしているのですよね。

○中村室長
 そうです。

○津谷委員
 そうですよね。かつて統計委員会で貧困率が高すぎるのではないかという意見が出されたことがあります。当時、私はこの調査の検討をするワーキンググループの座長でしたが、所得票を確率サンプルで取るべきではないかという意見もありました。がだ、費用対効果を考えたときに、国民生活基礎調査は所得を調べる調査ではありませんので、難しいと思うのですが、貧困率は政策的にもそうですが、社会的にもインパクトのあるトピックですので、非標本誤差を少なくすることは重要です。こういうふうにやっていく中で特にどこに一番割合としてウェイトがかかってくるのかをみて、これは
2010 年のデータの結果を見せていただいてからの話になると思うのですが、それも含めて検討していくべきではないかと思うのですが。

○中村室長
 そもそものいまの集落抽出のやり方自体は基本的に変えない前提で、推計方法の部分で何か方法があるのかということを検討するのが宿題という認識です。

○津谷委員
 例えば、2ページの上の世帯構造別のグラフを見たときに、この中で単独世帯もありますが例えば夫婦と未婚の子のみの世帯、これが俗にいう核家族世帯です。そうしたときに現状のやり方ですと、国勢調査ではほとんど差がないということなのですが、特に構成割合が大きいところであまり差がない方がいいかなと思います。全ての場合で、これが裁量のやり方であるということはおそらくないというふうに思います。

○中村室長
 本日この場でなくてもこういうものを試してみてはどうかという御提案がございましたら、メールなりでかまいませんので御提示いただければ個別に相談させていただいて、どういうやり方をすればいいのか検討させていただきたいと思っております。そういうことも含めて、この研究会はあと3回ほど予定しておりますので、よろしくお願いいたします。

○廣松座長
 ほかに御発言ございませんでしょうか。

○稲葉委員
 一点だけよろしいでしょうか。参考資料1のウ、回収率の向上に向けた調査方法の検討のところの第2パラグラフで「欠票情報」というものがあるのですが、これはどういった情報か、また完全に得られているのかどうかということについてはいかがでしょうか。

○中村室長
 これは世帯名簿というものを調査のタイミングでつくるのですが。

○稲葉委員
 現在行われている推計方法自体は
missing at random といって、この層においてはランダムにミッシングが行われているという仮定を持っているので、それを変えるとするとこういった欠票情報を使ってモデル化を行うという方法が1つ考えられるわけです。それはこの欠票情報がかなり完全でないとできないのですが。

○中村室長
29 年の調査から調査対象外になる場合ということで、例えば転出してしまったというものが1つ。または長期不在。それと調査不能ということで、例えばおおむね3か月くらい一時不在で会えないもの、または外国人で日本語が分からずに調査票が書けない、または何回行っても会うことすらできない面接不能、拒否。それから、例えば認知症とか高齢で耳が聞こえないとかある程度理由が明確に書ける場合と、理由が不明確で回答が得られない場合というような区分で、調査員が調査票を回収できない理由がどれかという形で記入します。

○津谷委員
 なぜ回収できなかったという理由が欠票情報ですね。

○中村室長
 特に今問題になっているのは世帯票は
12 14 %くらいが面接すらできない。ですから2割くらい回収できていないうちの 12 14 %が面接すらできていないというのが一番大きいものです。

○稲葉委員
 ありがとうございます。

○中村室長
 それで、郵送回収で少しでも上乗せできないかを今試験調査をし、それをこの研究会で評価をいただきたいということです。

○廣松座長
 ほかによろしいでしょうか。

 では議題2に関しましては平成 22 年調査を用いた試算を次回お示しいただくということですので、改めてそこで御議論いただければと思います。先ほど中村室長から依頼がありましたが、もしこういう推計方法があり得るというようなアイデアがございましたら事務局まで御連絡いただければと思います。

 きょう委員の方々からいただきました御意見等に関しては、事務局で整理していただきまして、次回研究会で対応を御提示いただければと思います。


(3)その他

○廣松座長
 予定しておりました議題は以上ですが、全体を通じて委員の方から御発言はございますでしょうか。

 それでは審議はここまでにいたしまして事務局へお返ししたいと思います。

3.閉会

○中村室長
 本日は暑い中長時間にわたりまして御議論ありがとうございました。1回目の研究会につきましてはこれで閉会とさせていただきます。次回2回目の研究会につきましては
11 月ころの開催ということで、日程につきましては後日また調整させていただきます。引き続き、御協力のほどよろしくお願いいたします。

 本日はどうもありがとうございました。


(了)

ホーム> 政策について> 審議会・研究会等> 政策統括官(統計・情報政策・政策評価担当)が実施する検討会等> 国民生活基礎調査の非標本誤差の縮小に向けた研究会> 第1回国民生活基礎調査の非標本誤差の縮小に向けた研究会 議事録(2017年7月6日)

ページの先頭へ戻る