- ホーム >
- 政策について >
- 審議会・研究会等 >
- 政策統括官(統計・情報システム管理、労使関係担当)で実施している検討会等 >
- 毎月勤労統計の「共通事業所」の賃金の実質化をめぐる論点に係る検討会 >
- 2019年2月28日 第2回毎月勤労統計の「共通事業所」の賃金の実質化をめぐる論点に係る検討会 議事録
2019年2月28日 第2回毎月勤労統計の「共通事業所」の賃金の実質化をめぐる論点に係る検討会 議事録
政策統括官付参事官付雇用・賃金福祉統計室 政策統括官付参事官付統計企画調整室
日時
場所
(中央合同庁舎第5号館6階608号室)
出席者
構成員(五十音順、敬称略、○:座長)
石原 真三子 |
○ 今野 浩一郎 |
神林 龍 |
樋田 勉 |
野口 晴子 |
山田 久 |
事務局
土田政策立案総括審議官 |
吉永審議官 |
瀧原統計管理官 |
細井統計企画調整官 |
田中審査解析官 |
村木雇用・賃金福祉統計室長補佐 |
議題
(2)その他
議事
○細井統計企画調整官
それでは、定刻より少し早めですが、皆様おそろいですので、ただいまから第2回毎月勤労統計の「共通事業所」の賃金の実質化をめぐる論点に係る検討会を開催させていただきます。構成員の皆様方にはお忙しい中、御出席いただきまして誠にありがとうございます。今回、事務局メンバーに追加がございますので御紹介をさせていただきます。土田政策立案総括審議官でございます。
○土田政策立案総括審議官
土田でございます。よろしくお願いいたします。
○細井統計企画調整官
吉永審議官でございます。
○吉永審議官
吉永でございます。よろしくお願い申し上げます。
○細井統計企画調整官
また、野口構成員を御紹介をさせていただきます。早稲田大学政治経済学術院教授の野口晴子様でございます。
○野口構成員
第1回は欠席して大変申し訳ございませんでした。野口です。よろしくお願いいたします。
○細井統計企画調整官
なお、本日は稲葉構成員からは御欠席の御連絡を頂いております。それでは早速ですが、以降の進行については座長にお願いをしたいと思います。
○今野座長
それではお手元の議事次第に従って進めたいと思いますが、前回、本系列と共通事業所の数ページの関係で、我々はいろいろな宿題をお願いしたので、多分、全部の対応は無理だったと思いますが、まずは対応できた範囲内で報告をしていただいて、それを議論の出発点にしたいと思います。では、よろしくお願いします。
○瀧原統計管理官
では、私のほうから資料の説明をさせていただきますが、今回、資料1と資料2を用意させていただいております。そのうち、まず資料1を御覧いただければと思います。前回、お示しさせていただきました論点の例と同じものを今回も付けさせていただいております。これにつきましては表題は書いておりませんので、論点の例としてですけれども、前回、この論点につきましてこういう論点があるかなという形で御議論のスタートとしていただいたということがありまして、今回も同じものを付けさせていただいております。前回の分が特にこの論点1の実質化を検討するにあたり、「本系列」と「共通事業所」の集計値の特性をどう考えるか、という部分にいろいろ宿題と言いますか、御指示がありましたので、それについての資料をこの後の資料2で説明させていただきたいと思っております。そのほか論点2、論点3もアンダーラインを引いておりますけれども、共通事業所の集計値の実質賃金指数の作成についてどう考えるか。あるいは論点3として、実質化の本来的な意味に照らし、この数値はどのような意味を持つのか、という部分も引き続きの論点として挙げさせていただいているものが資料1です。
では、そのうちの論点1につきましての少し分析をいたしましたので、資料2を御覧いただければと思います。本系列と比較した共通の集計値の特性という形で一部わかったものを御紹介させていただきます。まず、資料をめくっていただきまして1ページ目につきましては、前回と同じものになります。繰り返しになりますけれども、共通事業所の集計値というのは上の点線囲いにありますように、調査対象事業所の部分入れ替え、あるいは産業構造の変化に伴う労働者ウエイトの変化、ベンチマーク更新と言ってますけれども、これらの影響を受けないように集計したものという形で参考値として公表しているものです。実際、受けないようにするということで〇1の部分入れ替えを受けないという意味では、1年前と当月との両方に回答している調査対象事業所に限定してそこで集計していると。それからもう1つ、〇2のベンチマークの影響を受けないということで、1年前と当月のベンチマークを同じものにして計算しています。この2点のポイントがありますので、今日の分析もこの部分も含めて、念頭において見ていただければと思っております。
次の3ページ、右下の所の3と書いてある所で、共通事業所の集計値の特性についてということで、ここは今の部分を少し整理しただけですけれども、一応、その紙を用意しましたので少し御説明させていただければと思います。まず、共通事業所の集計値は、今、申し上げましたように、1年前と当月の両方で回答している事業所が調査対象になっている、かつ1年前と当月のベンチマークを同じものとして集計しているという基本的性格を持っているということです。そうするとその場合に次の2点が考えられるということで、サンプルが持つ特性として、ここはこの後、データを見て、改めて皆さんの御意見を頂ければと思いますけれども、本系列と比較して、賃金が少し高い水準にあるのではないかという部分で、これにつきましては前年から継続して回収できている、回答いただいている事業所のみが調査対象事業所となるということで、事業所規模別・産業別のサンプルに偏りがある可能性があるのではないかと。また、この後も分析がありますけれども、サンプルの偏りの結果、「本系列」と比較して、パートタイム比率とか男女比率も異なる可能性がありますということで、これはそういうサンプルの選び方をしていることによって出てくる特性があるのではないかということです。
それとは別に集計方法ということで、1年前と当月を比べるということもあって、その比べる月が前年なのか翌年なのかということで、賃金額が2つあるという特性が、特殊な性質があるというところが1つ目のポツです。それからこれは継続的に調べているということですので、新しく入った事業所はそこには反映されないということ。あと、これはもう、計算上のことですけれども、「本系列」とは違って、ベンチマークの影響を受けないような形で計算しているというものがあるということです。それを念頭に、以降の分析を見ていただければと思います。
では、4ページです。まず、「本系列」と「共通事業所の集計値」の回答事業所がどういう形で分布しているかというもので、おおむね「共通事業所の集計値」につきましては1万サンプル程度になります。まず、これは事業所数ですけれども、見ていただきますと、まず右側の共通事業所の集計値は縦に産業別、横に規模別になっております。一番下の欄が産業計でありますけれども、その一番右端、5人以上で産業計の所、これが1万サンプル弱というところになり、そのうちの規模別の割合で見ますと、半数ぐらいが5~29人になっておりまして、残りは500人以上が多いのですけれども、それの残りを100~499人と30~99人というのでほぼ同数程度という形になっております。一方で、本系列のほうはどういう分布をしているかといいますと、全体で2万5,000ぐらいのサンプルになりますけれども、半分ぐらいが5~29人というところは同じような感じなのですけれども、500人以上の部分というのは、先ほどの共通事業所に比べて全体から見た割合は低くなっているという状況が見て取れるかと思います。
これは数字だけでは少し分かりにくいので、次のページを見ていただければと思うのですけれども5ページです。本系列は全ての部分、そのうちで共通事業所は一部を占めておりますので、共通事業所の占める割合がどうなっているかということで見ますと、そもそも2万5,000事業所のうちの1万弱ということで、全体でいきますと4割ぐらいが共通事業所の割合、共通事業所として集計されているのですけれども、規模別で見ると、5~29人の所が3割程度、100~499人と30~99人については4割強となり、500人以上の所が8割ということで非常に高い割合になっているということです。上の所に書いてありますけれども、500人以上事業所では80%程度の割合、5~29人では30%程度ということで、規模の構成というのはやはりかなり違ってきているというふうな状況です。
なぜ、このようなことが起きているかというところは、次の6ページの図を見ていただければと思います。共通事業所というのが、1年にわたって、1年前と当月とで両方に存在することになります。500人以上事業所につきましては、基本的には全数調査です。今般、東京都で全数調査をやっていなかったという不適切な取扱いがありましたので、そこの部分は今後、修正しないといけないところではあるのですけれども、原則として全数でやっておりますので、そうすると500人以上規模は、基本的には1年前も当月も取れるということになります。一方、30~499人という中規模の所は、ここはローテーション・サンプリングというのを平成30年1月から入れたので、部分入れ替えが起きます。現在は2分の1ずつ入れ替えるということになりますので、そうすると1年前と当月の両方に存在する確率は2分の1になるという形になりまして、半数ぐらいがこの共通事業所の対象になり得るということです。
一方、5~29人につきましては、これは3分の1ずつ6か月ごとに入れ替えるという形のローテーション・サンプリングを以前からやっておりますので、1つの事業所でいきますと調査対象事業所になってから18か月間、継続して調査対象となって、18か月が終わると新しいサンプルに替わっていくという方式を取っております。この場合で1年間継続して存在する、例えば平成30年1月に存在している事業所が1年後まで調査対象になっている可能性ですが、全体のうちの3分の1は6月までということで7月に新しく替わります。ちょうどこの矢印でいうと真ん中の所です。さらに3分の1は12月までで、1月に新しいサンプルに替わるということで、1月に存在して次の1月まで調査対象となっているのは3分の1のみということになります。ですので、ここで仮に回収率、回答が100%であったとしても、5~29人については全体のうちの3分の1のものになると。一方で、真ん中の30~499人では半分、そして500人以上であれば全てが対象となり得るということで特性が出てきます。ですので、前のページに戻っていただきますと、その規模別で共通事業所に入っている割合というのが違ってくる、本系列に占める割合というのが規模で違ってくるという数字は、今のような、そもそもの事業所の入れ替えのシステムによって表われてくるという部分があります。
ちなみに、この5ページの所で、産業別のほうも御参考までに見ていただければと思いますけれども、一番右側の規模計といいますか、5人以上の所を見ていただければと思うのですけれども、高いのがどの辺りかといいますと、上から3番目の製造業が46.7%、その下の電気・ガス業が47.7%となっている。一方で、上から7番目にあります卸売業、小売業が32.8%でありますとか、あるいは飲食サービス業等が34.0%となりまして、もちろん小規模事業所が多いかどうかというところも効いてくるかとは思いますけれども、事業所規模ほど極端ではありませんけれども、産業においても若干の高い低い、共通事業所に多く含まれている、含まれていないという傾向が見られるのかなと思っております。以上が事業所規模と産業別の状況の御説明でございます。
それから続きまして7ページになります。これは、1年前と当月と両方に出していただいた事業所と、そうならなかった未提出事業所とでどういう違いがあるかを見たものです。平成29年1月と平成30年1月の2つの月で共通事業所となった部分の比較をさせていただいております。カテゴリーとしては、平成29年1月と平成30年1月のどちらも調査対象で、かつどちらにも調査票を提出いただいた事業所、いわゆる共通事業所を〇1としております。一方で、〇2として、どちらの月も調査対象なのですけれども、平成29年1月には提出いただいたのですけれども、平成30年1月に提出いただけなかった事業所、これを未提出事業所として集計させていただきました。
その上で、平成29年1月時点の賃金を比較したものが下の表でございまして、まず、実際、どれぐらいサンプルがあるかということをこの表の一番右端に用意させていただきました。5人以上事業所でいいますと、共通事業所が9,860あるのですけれども、その同じ時期に調査対象になっているのだけれども平成30年に出していただけなかった企業というのが1,000ほどという形になります。本系列のほうは全体が2万4,000ぐらいあるので、そのうち1万ぐらいが両方とも調査対象になっているのだけれども、1割ぐらいが未提出事業所になったという形です。これにつきましては、その下に規模別で出しております。規模別で見ると、共通事業所に対して未提出事業所が1割前後かなということになりますけれども、ここはまだ私どもも分析できていない部分がありますけれども、未提出事業所になる割合は実は500人以上規模が少し高めに出ています。ただし、その本系列に占める割合は、先ほど言いましたように大体どちらかに入り得るという形になっている一方で、一番下の5~29人でいきますと本系列のほうは1万5,000ほど集計しているのですけれども、平成29年1月と平成30年1月の両方とで調査対象になり得るというのは、先ほど申し上げたように3分の1程度、5,000ぐらいで、そのうち4,657というのが共通事業所になって、その約1割ぐらいが未提出になっているという状況です。100~499人や30~99人も同じような形なのですけれども、この2つは10%を切るぐらいで未提出事業所になっているということで、若干、表われ方というのには差があるということです。
その上で、賃金と労働時間を共通事業所と未提出事業所とで比較してみたのがこの図でございます。現金給与総額の所を見ていただきますと、〇1の共通事業所がブルーで色付けされておりまして、その下段に〇2の未提出事業所がありますけれども、共通事業所のほうが金額が高くなっている傾向が全般的に見られます。それで1点、下の注でも書いたのですけれども、参考までに「本系列(再集計値)」をそこに並べておりますけれども、これは直接は比較できないものだということを御留意いただきたいというのがございます。これはサンプル数を見るのにはいいかなと思ってはいるのですが、共通事業所の平成29年と平成30年を比べているものですので、ここに書いている現金給与総額はあくまでも平成30年のベンチマークを計算したもので、平成29年時点でのベンチマークを計算したものではないということです。これは〇1〇2共通です。ですので、〇1〇2は両方ともベンチマークはそろっておりますので比較は可能なのですが、3つ目の行になります本系列につきましては、これは平成29年のベンチマークで集計した数字が出ておりますので。端的に言いますと、ベンチマークは平成30年にそろえたほうが高くなるというのが平成29年と平成30年の間にはありますので、本系列のほうが低くなっているという数字が全般に見受けられますけれども、共通事業所は本系列より高いということではないという部分は御留意いただきたいと思います。
これをもう少し丁寧に説明させていただきますと、11ページを御覧いただきたいと思います。これは(参考1)という形で前回、第1回のときに示させていただいた資料なのですけれども、例えば平成29年1月の本系列の実額は、1月の所の左から2番目の所、27万1,855円になりまして、これが実は先ほどの7ページの所に書いてある本系列の5人以上の数字と同じなのです。実はこれは平成29年1月のベンチマークを使ってますので、これと比べられる共通事業所の集計値といいますのは、11ページの水色に塗っている欄の実額の平成29年1月の上のほうの値になります。ですので、この27万2,965円と27万1,855円は、これは同じベンチマーク、同じ母集団労働者数に復元しているということで比較可能なのですけれども、先ほどお示ししました7ページの表は、この下のほうの数字を使っておりますので、平成30年と平成29年のベンチマークの差で金額が下のほうが高くなるという傾向が出ますので、ここと比較してもあまり意味がないものであります。
もちろん、この11ページの図を見て、本系列の実額、例えば平成29年の1月、2月と、例えば共通事業所の平成29年の1月、2月の上の欄というのを比べていただいて比較することは可能です。その場合で言いますと、1月でいうと共通事業所のほうが上ですけれども、2月でいうと本系列のほうが高くなるということで、ここは明確に分析できているわけではないのですけれども、ここの数字を見る限り、明らかにどちらが高いという形にはなっていないというのが、本系列と共通事業所の賃金額の比較という部分です。ここは必要があれば、また分析いたしますけれども、今の時点ではそこは比較する形にはなっていないというものであります。
注釈が長くなりましたけれども、7ページの所で、これから見受けられるのは上の四角の最初のほうの矢印で書いておりますけれども、未提出事業所のサンプル数の割合というのは、10%程度になっているという一方で、「共通事業所の集計値」の賃金額というのは、未提出事業所の賃金額と比較して相対的に高い傾向があるということです。共通事業所、1年前と当月と両方に存在する事業所というのは「サバイバル・バイアス」というのがプラスという形であるのではないかというのが、この表から見て取れるところかなと思っております。
それから次は、もう少しシンプルな表になって恐縮ですけれども、8ページの所です。これは単純に、本系列全体のパートタイム比率と、共通事業所という形で集計されている事業所のパートタイム比率でございまして、それで見ますと、共通事業所のほうがやや低く出ているのかなというものです。同じように毎勤では男女の比率が取れますので、男性100とした場合の女性の比率という形での計算をしたものが次の9ページの所です。これも、パートタイムと同じ傾向というのは違うのかもしれませんけれども、共通事業所のほうが若干低くなっているという傾向が見られたというものです。そこから以降は基本的に前回に示した部分と同じでございます。おさらいの意味で共通事業所のどこを捉えているかというもの、それから(参考1)と(参考2)で数値的な部分やその経緯、そして毎勤統計の概要なりを(参考3)と(参考4)に整理して、再度資料として提出させていただきました。事務局からの説明は以上でございます。
○今野座長
ありがとうございました。それでは、御質問いただければと思います。
○神林構成員
1つ確認なのですけれども、このアトリッションの頻度が30~499人の所ところで、ちょっと小さくなる、8%ぐらいになって、そのほかの規模。
○今野座長
何ページですか。
○神林構成員
7ページ。
○今野座長
7ページだよね。
○神林構成員
7ページで、一番上の〇1の共通事業所と〇2の未提出事業所の一番右側を見ていただくとサンプル数が書いてありまして、この1,048というのが脱落した事業所の数です。なので、9,860と1,048を比べて、この資料では未提出事業所のサンプル数の割合は10%程度と計算をしております。それを事業所規模別に見ると、500人以上と5~29人で高くて、30~499人で低いという傾向が見られます。先ほど瀧原さんがおっしゃったように。
○今野座長
比率計算するとね。
○神林構成員
比率計算すると。この原因なのですけれども、自分が以前、毎勤のマイクロデータを使ったときに、少し困惑したことがありまして、追加指定の扱いです。もう7、8年前ですけれども、追加指定をするときに、同じ一連番号の所に追加指定した事業所を放り込んでいるということが当時ありまして、30~499人の間に。途中で脱落したサンプルの所に追加指定で別の事業所をポンと入れてしまっていて、そうすると、数字上は1月と1月に存在するのだけれども、実は別な事業所であるということがあり得ないのか。それで、追加指定している分が、このアトリッションが小さいというところに表われているのかもしれないと、ちょっと思いまして。そこは、今はもう違うデータになっているのでしょうか。
○瀧原統計管理官
そこは確認しますが、今は番号自身は違った番号を付けてやっています。
○神林構成員
このときはもう追加指定は違った番号を付けている。
○瀧原統計管理官
付けてはおりますので、それにはなってないと。
○神林構成員
分かりました。ありがとうございます。
○今野座長
ということは、事業所番号が固有名詞にちゃんとなっているということですね。
○瀧原統計管理官
ですので、どんどん新しい番号を振り出していくという形にはしております。
○村木雇用・賃金福祉統計室長補佐
5~29人の事業所は調査員調査になっていますので、その点が、ほかの事業所規模と比べて異なることに留意が必要であるというのは1つあると思います。
○神林構成員
ちょっと資料がなくなっちゃっているので、10年ぐらい前の話なのでうろ覚えですが。当時、このアトリッションを計算したときに大体、毎月2%ぐらい出ていたのです。6月にサンプル替えがあるので、ちょっとポンと減って、数年に1度の1月にガバッと大きく変わるというのが見て取れて、毎月2%とすると、この10%ちょいというのは、ちょっと低いのかなと思います。
○今野座長
低いですね、半分ぐらい。
○神林構成員
最近回収率が上がるという話は聞いてはいないので、少し自分の中で理解するのが難しいのが、この2つの数字ですね。毎月2%というのと、1年で10%という数字を理解するのが今はできていないという、そういうことで質問しました。
○瀧原統計管理官
実際、回収率でいいますと、やはり規模が高い所のほうがいいというのがあります。未提出の割合でいうと500人以上とか結構低くなっているのですが、ここでは未提出の割合が高くなっていますので、そこは実は若干まだ、すっきり分析できてないなというところがありまして。ただ、そこも、例えばいろいろなパターンが考えられまして、一定程度回収率が低い、未提出なのですけども、その出さない企業が固定的なのか、発生がばらついているのか、どちらかで表れ方はきっと変わっていて。もう出す所はずっと出していて、出さない所は出さないでいると、この共通事業所になる割合は高くなるのですけども、一方で出したり出さなかったりとなっている企業がいろいろあって入れ替わりが大きいと、共通事業所になる割合は低くなってしまうということがありますので、そういうのが効いているのかどうか。それから、これ自身は1月と1月の比較のみのものですので。
○神林構成員
単月ですからね。
○瀧原統計管理官
ええ、単月、この1月時点でちょっとそこまでの判断ができるのかと言われると、これはちょっと、やっぱり時系列的に見て2月、3月で。先生が先ほどおっしゃったみたいに、月によって回収率というのが明らかに下がる月と上がる月もありますので、そこまで見たものではないというところが今の時点です。
○神林構成員
恐らく、それはちょっと注意点だと思うのですけれども、前年同月比を取るときに、今サバイバル・バイアスがどれぐらいあるかを見ているわけですが、多分1月に関しては分かるのですが、この1月のサバイバル・バイアスというのが2月、3月、4月のサバイバル・バイアスと同じだというふうには今のところ言えないですよね、そういうことになると。なので、その辺は、ちょっと気を付けておかないといけないかなと思います。
○今野座長
ということは、月ごとに見てこいと言いたいわけですか。
○神林構成員
まあ、マイクロデータをこちらに渡していただくのが一番早いんですけども。
○今野座長
でも、一度見ておいたほうがいいということですよね。
○神林構成員
そうです。これをもう、ひと月ごとにずっとずらしていって、12か月分全部作るというのが理想的だとは思います。
○石原構成員
その共通事業所を見る意味というのは、なだらかに変化するところを見たいということだと思うのですけれども、月ごとに対象がばらばらになってしまうと果たしてどうか。もしかすると、月ごとになってしまう可能性もある。では、全部を出している所だけにすると、ものすごい偏りのあるサンプルになってしまうということになると思います。その辺も問題点ではあると思うのですけれども、何かしろと言うわけではなく。
○瀧原統計管理官
いえいえ。
○山田構成員
流れでちょっと。私もそれを思いました。この共通事業所がもともと出てきたのは、多分、本系列を今回ベンチマーク改訂のときに調整しないとした、そうすると時系列で比較ができないので、それに代わるものとして、共通事業所というのが出てきていると、そういう流れだと思うのですけれども。そうすると、そのときに共通事業所というものが、サンプルを持ってきて調査をしていくわけですけれども、さっきの回収率の話もあるのですが、一定期間ごとに入れ替えていくので、サンプルを入れ替えたとき、回収率が100%だと想定すると安定しているのですが、共通事業所として計算するサンプルはばらっと入れ替わってしまいます。そうするとその連続性というのは、もともとサンプルなので、これは限界があると思うのですが、サンプル自体の、もともと母集団を見るためにそれを持ってきているわけですが、母集団との間の関係で安定的なのかと。要はもっと具体的に言うと、4ページの共通事業所の集計値の所で産業別・規模別にセルがあって数字が載っていて、5~29人の例えば飲食サービスは292、生活関連サービスは162という回答数になっていますが、例えば飲食サービスは5人~29人と言っても、実はその具体的な事業所の属性はかなりばらつきがあるのではないかと。あるいは特に生活関連サービスには多様なものが入っているので、そうするとある年は特定の所を取ってきて、違う年になるとまた違う所を取ってきているということになると、ざっくりと産業グループで特性が安定していると想定してやられてると思うのですけれども、実際はそうではない可能性があるなと。もっと具体的に言うと、もともとの5人~29人の、ここで言っている産業ごとの賃金のばらつきがどれぐらいあるのか、母集団ではできないかもしれませんが。ある程度、賃金センサスなどで出ているのかもしれませんけれども、そのもともとのばらつきが大きいと、毎年で変わってきますよね。そうすると、時系列に本来見るためにやっているのだけれども、そこが不安定になってしまうということになると、全く駄目だということではないのですけれども、非常に不安定なものを見ているという解釈を入れないと、間違ってしまうということになるのではないかなと。ユーザーとしては、前から申し上げているように時系列はあるものですから、同じ流れなのですけれども。
○今野座長
今、言ったことは例えば飲食サービスで言うと、ある年は共通系列はファミレスばかりをピックアップしていて、次の年は飲み屋ばかりをピックアップしたと、そういうことを言いたいわけですよね。
○山田構成員
そうです。そうするとかなり水準が違うだろうと、あるいはフレンチレストランと牛丼屋だと多分、全然水準が違うと思います。それは完全にそう二極化するわけではないと思いますが、そこが不安定だと実は時系列的に安定性が担保されていないことになるのではないかなという、そこはちょっとチェックする必要があるのではないかなと思います。
○瀧原統計管理官
正におっしゃるとおりだと思います。今、図らずもおっしゃられた18か月という話で、18か月ごとに替わっているのは5~29人の所です。それは実は非常にポイントで、5~29人ではなくて30人以上の所は、我々は第一種事業所と呼んでいますが、これについては、今の分析、平成30年12月までに存在する事業所というのは、実は平成27年1月にサンプル替えをしたもので、それが2年間のものだったのを、更に2年延長したという4年間のものなので、今出ている30人以上は、みんなそこに入っている人たちなのです。ですので、サンプル替えが実は起きていないということになります。ところが、5~29人は18か月なので、これはサンプル替えが起きているということになります。30人以上については、実は次に発表になります平成31年1月で初めて対象が替わるということがありますので、そこでどのようなギャップが出てくるかというのがあるのと、細かいところでいうと、今の時点では5~29人の所を分析すると、1月と1月をやりましたけれども、平成30年7月と平成29年7月、そこを変えたらサンプルが替わっているので動きが不連続になっている。特に5~29人は、数がちょっと少ないので、今おっしゃったようなところが表れている可能性が。
○山田構成員
正にその今回のベンチマーク改訂のとき、分析をこれとは違う所で出されていますが、5~29人の所ですごくぶれてベンチマークの断層が生じているという分析をされていると思うので、ここの部分が実は結構悪さをするというか。我々も分析するとき、結構この数字はぶれるなという感じは持っていました。完全に使えないという結論ではないとは思うのですけれども、どの程度不安定なのか、あるいは逆に言うと、どの程度安定的なのかというのは、ちょっと何か示す必要が。使うサイドに誤解を与えないという意味で大事だと思います。
○瀧原統計管理官
ランダムサンプリングですので、極端に、この間までは全部居酒屋で途中からファミレスということはさすがにないですけれども、とは言えサンプル数も必ずしも大きくなく、特に共通事業所にするとサンプル数が小さくなってしまいますので、本系列ほどの安定性はなくて、おっしゃるとおりのがたつきが、全体の中では分からないのですけれども、そこを見ると出ている可能性が。そういう意味では、これは1月だけしか、今できていませんけれども、ちゃんと各月というのは必要だと。
○山田構成員
ついでにちょっと……ですけれども、産業分類で例えば製造業というと、さっきの資料だと5~29人で897とあります。これは製造業全体でサンプルを取ってきているのですか。製造業というのは、ものすごく細かく分かれていて鉄鋼もあれば、半導体もあれば、そういうことを関係なしに製造業全体でされているのですか。
○瀧原統計管理官
それは切っています。製造業で言いますと比較的、細かく切って。
○山田構成員
ということは、安定。
○瀧原統計管理官
そうですね、一応、そこの部分は配慮したという形にはなっています。
○山田構成員
サービスなどは、多分、結構不安定だと思います。
○瀧原統計管理官
サービスは結構、大くくりになっています。
○野口構成員
関連して、前回、質問が出たかもしれないのですけれども、すごい細かい点で差し支えがあったら結構なのですが、そもそもランダムサンプリングというのは、どうやってやられるのですか。
○瀧原統計管理官
ランダムサンプリングのやり方自身ですか。
○野口構成員
はい。
○瀧原統計管理官
基本的には、事業所データベースから事業所を持ってきて、それを縦に並べて、例えば8分の1で取るとしたら、1~8でサイコロを振ってスタート地点を決めて、あとは等間隔で取っていくという形になっています。
○野口構成員
8つずつ。
○今野座長
その場合の1からずっと番号を振っていく、番号の振り方は大きさの順でばっと。
○瀧原統計管理官
基本的に企業センサスを持ってきて、企業規模の大きい所から並べて。
○今野座長
出発点を乱数で決めて、それで等間隔で。
○瀧原統計管理官
ソーティングの順位はもちろん決めていますけれども、企業規模なり産業なりという形で並べて、その並べたものに対してスタート地点を決めて、等間隔で取っていくという形です。一応、ソーティングの最初が優先的になるわけですけれども、その中でランダムにはなるようになっています。
○野口構成員
入れ替えるときに、またランダムサンプリングしますよね。そのとき、事業数が多いので起こり得るかどうか分からないですけれども、前に入っていたサンプルは除くのですか。
○瀧原統計管理官
その場合は、まず除かずに同じようにランダムでやります。ただし、ぶつかったときはその前か後ろを取るという形で、同じ所には当たらない。
○野口構成員
当たらないのですね。
○瀧原統計管理官
前か後ろかも一応ランダムで5割の確率でやるという形ですので。同じ所には、さすがに事業所の負担がありますので、当たらないようにはしています。
○今野座長
石原さん、ついでに資料を出していただいたから、今ざっとしゃべっていただいて、議論のネタにさせていただければと思います。
○石原構成員
そうですね。私が送りそこねてしまったので、さっきコピーしていただいたのですけれども、確認したいことを考えてみた資料がありますので、そちらを見ていただきたいのですが。どういうふうに調査をしているかというのを私の理解でまとめたので、ここが違うという点もついでに確認していきたいと思っています。2017年までの調査方法から2018年は変わったという理解で、平成29年までは前の取り方で。
○瀧原統計管理官
そうですね、サンプルの総入れ替え方式からローテーションサンプルに変えたのは2018年からです。
○石原構成員
平成30年からですね。で、主にここで見るのは昔のデータで、昔のデータと今のちょうど接続なので、2017年までの調査方法も頭に入れておく必要があると思い、両方を確認したいと思ったのです。2017年までは、500人以上事業所は全数調査で、ただし東京都については、2004年から標本調査になっている。30~499人の事業所は標本調査になっていて、それはそのときの最新の経済センサスの名簿から、先ほどおっしゃったような形で抽出している。2017年までは、対象事業所は2015年から3年間固定していたということですね。
○瀧原統計管理官
はい。
○石原構成員
これは事業所センサスの間隔で固定していた。
○瀧原統計管理官
そういうわけでもないです。事業所センサス自身の全数調査、でも昔はそうだったのかな、今はセンサスが5年間隔になっていますので。
○石原構成員
別にそういうわけではないですね。
○瀧原統計管理官
いわれはちょっと。
○石原構成員
最新の経済センサスの名簿から抽出している。5人~29人の事業所は標本調査で、先ほどからあるように、これも最新の経済センサスの事業所名簿から抽出して、半年ごとに3分の1、18か月調査対象ということで抽出していた。
○今野座長
6分の1。
○瀧原統計管理官
全体で言うと、半分が5~29人で、それの3分の1ずつ。
○神林構成員
経済センサスの……。
○瀧原統計管理官
いえ、これ自身は。
○石原構成員
違うのですか。
○瀧原統計管理官
調査区調査は二段階になっています。調査区を決めた上で、調査区内の5~29人とやりますので、30~499人の母集団データベースなり経済センサスのデータベースから取るというのとは、ちょっと違うやり方になります。
○石原構成員
では、この名簿は。
○神林構成員
調査区内の名簿は、経済センサスから。
○瀧原統計管理官
経済センサスの調査区に基づいてやっています。経済センサスが今の最新だと、約22万区前後、調査区としては分けていますので、そこから区を選んで。
○石原構成員
区を選んで、その名簿は経済センサスの最新の。
○田中審査解析官
経済センサスではなくて、その組の調査開始前に伺って調査区内の事業所を調査しているはずです。その後、その中から5~29人をピックアップしているということです。
○石原構成員
では、ここはもう全然、経済センサスではない。
○田中審査解析官 調査区だけは、経済センサスのものを幾つかくっ付けたものをやって。
○今野座長
そうなんだ、誤解していた。
○田中審査解析官
もう一回、経済センサスをベースに同じ県の統計課の方で担当されますので、そういう意味では。
○石原構成員
調査区自体は、経済センサスを使って、その中身は足で。
○田中審査解析官
前回作った調査区要図などをお借りして、それをベースにもう一回新しい事業所があったりするかどうかも含めて確認をして、5~29人の名簿を作っているということになります。
○石原構成員
ということは、一番小さい事業所に関しては、割と経済センサスよりも最新な。
○瀧原統計管理官
そういうことになります。
○今野座長
経済センサスの時点ではなかった事業所も、対象になるようにと。
○田中審査解析官
先ほど、2、3年に1度という表現がありましたが、これは昔、事業所・企業統計調査という調査がありまして、これが3年に1度行われていた時代があったかと思います。この後、事業所・企業統計調査が変遷をしていく中で多分5年に1度の調査になって、間に簡易年という形で民営だけを行う調査がありましたが、そのときの関係でちょっと変わってきているという形になります。
○野口構成員
1個だけ質問させていただいていいですか。二段階で抽出するとおっしゃいました、調査区をランダムに選んでその中からということでしたが、要するに調査区が同じ所にランダムに当たった場合は、やはり前後で選ばれますか、それはそのまま。
○田中審査解析官
調査区も避けているはずです。確か何区かまとめて、何回分かまとめて抽出しているはずですので。
○野口構成員
調査区に関しては、その場合に当たったものは抜いて、ランダムサンプル。
○田中審査解析官
はい。
○石原構成員
もともとの問題としては、30~499人の固定されていたサンプルが入れ替わるときに、ギャップが生じてしまうので、何とかしたいという問題意識だったということですね。
では、そのギャップに関して、何が起こっているのかちょっとよく分からないというお話だったと理解したので、少し考えてみました。皆さん、基本的なことなので実は分かっていらっしゃるとは思うのですけれども、私は学部1年生などを担当しているものですから、こういうすごく簡単な説明を確認のためにさせていただきたいと思います。まず3ページ目ですけれども、現実の経済はどうなっているかというと、3年目に入れ替わるという昔の取り方に関して考えてみました。1年目の1月は、経済センサスでまあまあ経済全体を網羅したものを取ってきている。500人以上は全数なので、標本の問題があるとするとそれ以下の小さい事業所で、そこに関しては、標本を取ってきて復元するという形にして、1年目の1月は現実の経済をちゃんと表したものとなっているはずです。それが3年目の12月になると、変わってしまう。変わってしまうのは何かというと、途中で脱落してしまうものと、入ってくる事業所、新設や規模が変わったり、産業が変わったりいろいろあると思うのですが、入ってくる事業所があるので、こっちからこっちに経済が移行していって、この人たちがいなくなってしまうというふうに経済は動いている。
次のページですけれども、紙芝居の4ページ目ですね。ところが毎勤の標本の30~499人に関しては3年間動かないので、この標本がそのまま動くとすると、何が起こるかというと、脱落していく事業所は標本からも脱落していくわけですが、入ってくる事業所に関しては、経済センサスの名簿が新しくならない限りは入ってこないということになってしまうのです。ですので、標本の問題としては、脱落する標本という問題もあるのですが、新しく入ってきた事業所が、標本の中に入ってこないという問題も同時に起こっているということがあると思います。ここが途中で経済センサスの新しい名簿ができて、そこから取ってくるのであれば、この新しく入ってくる事業所というのは標本の中にも入ってくるので、この標本が経済全体を表すに当たって、大丈夫になってくる可能性があるのですが、経済センサスはそれほどちょくちょく更新されないので、脱落する標本と入ってくる標本の両方で、今あるサンプルが経済全体を表していなくなってしまう問題が発生しているということになります。この標本と、次に3年間が終わってサンプルが全取り替えにあったときの標本は、かなり差が出てきてしまうというのが、多分、ギャップの問題ではないかと、理論的に。
5ページ目ですけれども、問題としてギャップが何で起こるのかというと、この脱落した所と、それから本当は3年間で入ってきていたはずのものが入っていなかったというこの部分と、もう1つ先ほど野口先生からの御質問にあった、どうやってサンプルを追加しているのか、何を、どの事業所を追加しているのかという問題、これらの3つがそのギャップの原因として考えられるのではないか。これがサバイバル・バイアスを作っている。
○今野座長
この場合、3年目の12月のときはつぶれた会社は脱落標本なので、例えば平均賃金を計算するときに入っていないわけですね。
○石原構成員
入っていないです。
○今野座長
そうするとギャップで出てくるのは、結局、標本が違う新設部分だけですよね。
○石原構成員
そうですね。ここには入っていないです。標本が上に上がっている感じです。脱落した部分を何で埋めているかという問題に。
○今野座長
でも、そのときに脱落標本によってベンチマークが変わってきてしまう。
○神林構成員
3年目12月の標本というのは、その真ん中の部分が標本になっているわけですよね。
○今野座長
そうそう。
○神林構成員
けれど、この標本というのは、実は1年目1月の全体を本当は復元しないといけないはずの標本なのだけれども、その部分がずれているので、1年目1月にサンプル替えしたときの名簿を使ってベンチマークの修正をして、この部分をぐっと増やしてもってくるということをやっているのですよね。三角修正しているのでがががっではないですけれども。この三角の部分をそれで修正するというのが、今までやってきた修正方法ということになります。
○石原構成員
そうです、そういうことですね。そもそも標本自体にゆがみというか偏りがあって、3年間で蓄積してきたギャップの原因というのは、標本自体の偏りが原因になっているわけなのです。それは経済センサスがちょくちょく調査をしないので、どうしようもないことなのかもしれないのですけれども、それをちゃんと認識しているというのが、結構、重要だと思いましたので、こういう学部生の授業のようなメモを作ってみました。まず調査がどのように行われているのか、標本をどのように作っているのかというのを確認したいと、それを分かっていないと出てきた数字のどこを見なくてはいけないのかというのが分からないと思ったので、確認したいことは、先ほどからの質問にもありましたが、〇1は先ほどの野口先生の質問ですね。補充はランダムサンプリングしているということでいいですか。
○瀧原統計管理官
そうですね、実際、脱落のみで補充がないというものではないので、補充が実際どれぐらい起きているかというのは、次回お示ししようと思います。ただし、30~499人でお聞きいただいているのですけれども、この確認したいこと、6ページの所で言いますと、まず〇4の5~29人については、調査区でやって調査員調査でやっていることもありまして、抜けたときにはすぐにそこの中から別の所を選ぶという形を取っているので、比較的に即時的に入れる形にはしています。ただ、そこはちゃんと整理しますけれども、5~29人は比較的に数は安定させて取るという形にしているのですけれども、30~499人については、逐次の追加指定はしていません。年に1回程度です。ただ入れるときには、その抜けた事業所を考慮した形、抜けた部分の産業規模で入れていることになりますので、全くランダムに、製造業が抜けたからサービス業を入れているということにはなっていないということにはなるのですけれども、その自身の名簿がどの時点の名簿かと言いますと、すみません、そこはちょっと確認させてください。
○石原構成員
それはいいのですかね。抜けているわけですよね。
○瀧原統計管理官
はい、抜けて新規に入れるという作業は。
○石原構成員
同じ産業・企業規模で。
○今野座長
当然。
○瀧原統計管理官
入れているはずです。
○今野座長
その場合、普通に考えると無回答なのかいなくなったのかというのは、確認が難しい。
○瀧原統計管理官
基本的に調査票が出てこなかっただけでは、指定は解除しません。明らかにその企業がなくなった、あるいは移転したなど、そういう事実があって初めて指定解除になります。そういう意味では、実は100%の回収率とするとこの議論が非常に、コアな話なのですけれども、実は回収率のほうが影響は大きいのかもしれません。
○石原構成員
すみません。同じ産業・企業規模でいいのかというのも私は疑問で。
○今野座長
抜けたときに。
○石原構成員
はい。
○今野座長
入れるものが。
○石原構成員
はい。つまり例えば廃業してしまった会社は、いなくなってしまう。
○瀧原統計管理官
それはですね。
○山田構成員
産業構造が変わっている。
○今野座長
母集団、平均して変わってるということだな。
○瀧原統計管理官
それは先生のおっしゃるとおりで、産業構造が変わることによって、そこの事業所数が減っているとか増えているということは、それは正にベンチマークの問題で、経済構造が変わるときにやることですので、一応継続してやっているときには最新の経済センサスの事業所規模、産業構造を固定してやっているので、抜いた所に加えるという形。だから、そういう意味では産業構造の変化は反映されていないという形になります。
○石原構成員
分かりました。そうすると、ベンチマークを固定しているためのギャップが発生するというのは、もう仕方がない。
○今野座長
しょうがないというか起こるわな、当然。
○瀧原統計管理官
30~499人のところで、どの程度的確に抜けた所を戻せるかというのが、この図でいいますと斜めに上がっている所をちゃんと反映しているかということになるのですけれど、そこは限界があるというか、ここまできれいにはいっていないというのと、産業構造は固定してしまっているというところが効いてきますが、ギャップの発生要因としましては、回収率もやはり結構効いています。100%ですと、どれかが抜けてもどこかを加えていれば平均は変わらないのですけれども、回収率があると、答えている所と答えていない所の差があって、計算結果の平均賃金は答えている所の平均になる。それが、入替時に全部総替えになりますから、そうすると、ずっと答えている所の平均だったのが、ある瞬間から全企業の平均に、スタート日が始まってしまう。そこが、ギャップの要因の1つになる。入れ替えに伴って発生する……。
○石原構成員
では、このほかに回収率もギャップの原因になっている。
○瀧原統計管理官
サバイバルというのは、企業として存在しているという意味もあるのですけれども、回答者として存在し続けているというところが表れてくるということになると思います。
○野口構成員
それは識別できますか、統計上。回答者としてサバイバルしているのか、本当になくなっているのか。
○瀧原統計管理官
そうですね。先ほど未提出事業所という形で分けていましたけれども、限定的にはなりますけれども、ある月に回答していた所のうちで、例えば1年後とか翌月に回答しなかった所と続けて出した所とでどう差があるかという分析は可能ですし、先ほど見ていただいたように、恐らく継続して出しているほうがややいいというのが出ているのではないかと思います。
○神林構成員
それは、原理的には指定解除されたときには追加サンプルを追加するはずなので、識別しているはずですよね。この事業所は3か月連続で出さなかった、よく調べてみたら廃業していたので、追加サンプルを追加しました。この事業所は3か月連続で答えてくれなかったけれど、まだオペレーションやっているので、では、翌月も頑張って電話を掛けてみようみたいな意思決定をしているはずですよね。未提出のうち、どの時点で指定解除をされたのかというのは、記録は残っていますか。
○瀧原統計管理官
網羅的にはあれですけど、最新、今近い状況だと、ある程度は見られると思います。
○神林構成員
マイクロデータを見たときに、IDがふってありますよね。この月は答えていた、次の月は無回答というか欠損、欠損ときて、多分マイクロデータでずっと時系列を作ると、廃止された事業所もその後ずっと欠損になると思うのですけれど、欠損になったときに、その代わりにほかの事業所を入れていたとしたら、それは廃止されたとみなしているということですよね。
○今野座長
そうだろうな。
○神林構成員
けれど、入れていなかったら、それは答えてもらえていないと認識していたということです。後でまた回答が復活した場合には、答えてもらえていなかっただけだと判断できるのですけれど、そこで例えばサンプルが切れて、後で総入れ替えになりましたというときに、その事業所は答えてくれていなかったのか、それとも廃止されたと判断したのかという、そちらの判断がフラッグか何かで付いているということはありますか。
○瀧原統計管理官
ただ、指定開始以降は明らかにデータとして残っていますので、ここは指定を解除したというのは分かるはずです。
○神林構成員
指定解除というのが、シグナルが入っている。
○瀧原統計管理官
はい。そこは完全に外しますので。
○神林構成員
それが代理変数になりますよね、それが廃止されたということの。
○瀧原統計管理官
分析の前段階になるかもしれませんけれど、先ほどの実際に指定解除になっている所と、それから新たに指定している部分と、実際に未回答の部分も含めてですけれど、数的にどれぐらいになっているかというのは、少し整理してお示しするような形で。
○今野座長
直感的には全ての事業所の固有名詞がくっ付いているから、できますよね。ずっと後どこかでなくなったとか、ここで登場したとか、固有名詞を追い掛ければ、ここは回答したけどここは回答してない、入れ替えで消えたとか、全部分かるよね。
○神林構成員
先ほどのお答えだと、1事業所は固有のIDを今は使っているということでしたよね。ただ、毎勤は共通事業所番号は使っていないですよね。そのかわり、独自番号をふっているとおもうんですが、一連番号として。
○瀧原統計管理官
そうですね、はい。
○神林構成員
その一連番号自体は、使い回していないということですか。
○瀧原統計管理官
どこまで遡るかによるかと思いますが、基本的には比較するような部分では使っていないです。
○神林構成員
使っていない。
○田中審査解析官
同じ番号を多分使っている可能性がある場合には、抽出替えを繰り返したときです。1回が、0から4で始まっている番号です、4桁の左から1桁目がです。
○神林構成員
なるほど、なるほど。
○田中審査解析官
その次がスタートするのは5,000番台以上ということで始まって。
○神林構成員
次の抽出替えのときには。
○田中審査解析官
そのときには、また0から始まるということになりますから。
○瀧原統計管理官
直近1回前後、1回前後までは大丈夫ですが、そこから戻ると。
○神林構成員
少なくとも抽出替えをした後指定をしている範囲の中では、固有な番号になっているということですね。
○山田構成員
関連して。効果を考えるとき、さっきおっしゃった回答率の時系列的にどのように変化してきているというのは、普通に考えると少しずつだんだん落ちてきて、サンプル替えというか、もともとの抽出替えをしたときに上がって、それで落ちてくるという、そういう経緯をたどるのですかね。そうすると、もともとのバイアスがどう起こっているかというのはある程度推測できるわけですね、時系列的に。大体、脱落するほうが賃金が低いということであれば、だんだん残ったデータには上方バイアスが掛かってきて…。そういうのは作業が大変だったらちょっと。
○瀧原統計管理官
そうですね。それはスタートから期間が終わるまでの間の回答率の動きですよね。それは多分少し。
○山田構成員
もし、ということで。いろいろ制約があると思うので。すみません。
○今野座長
それで石原さん、まだあるからやってしまいましょう。言いたいこと言ってください。
○石原構成員
それで6ページ目、確認したいことの〇1が終わって、〇2ですね。東京都についてですけれども、東京都の全数調査ではなかったというのもデータの中に入ってきていますので、どういう調査になっていたのか。標本になっていて、それが30~499人の事業所と同じような感じで標本を取っていたのか。
○瀧原統計管理官
そこはそうですね。基本的には標本の取り方は同じ。
○石原構成員
同じ。3年間固定で。
○瀧原統計管理官
そうですね。はい、そうなります。
○石原構成員
それから〇3、500人以上事業所が標本になっていて、しかも標本調査が悪さをすると思いますので、ギャップの問題がそれによって大きくなっているということはあるのでしょうか。
○瀧原統計管理官
それは出ていると思います。古いデータなのであれですけれども、ある程度のギャップのところは見えて。実際ギャップは結構発生するのです。ベンチマークのこともありますし、先ほどの入れ替えの場合はその部分もあって。ここの部分は明確には見えていないのですが。
○石原構成員
例えば古いデータがあったとしたら東京都だけを抜いて、この悪さをしているものだけを抜いた数字と入れた数字を。
○瀧原統計管理官
ここまで戻る雇用データというのは厳しいと思います。
○石原構成員
そうですか。
○神林構成員
個票データ、どこまで残っていますか。
○瀧原統計管理官
そこは、今にわかに回答はできませんけど。
○田中審査解析官
個票は大分残っていると思います。
○神林構成員
分かりました。
○田中審査解析官
個票自体は昭和のところぐらいまでは残っているはずなので。
○野口構成員
電子化されていますか。
○田中審査解析官
電子化されています。
○石原構成員
というのもあるかなと思うので。そもそもそれで数字が変わっている可能性も結構あると思いますので、問題を大きくしている可能性があると思うので、そこは調べるべきなのではないかと思います。
○今野座長
何か私の印象は、いつの時代も大体2%ぐらいでしたか、ギャップが出るというのは。
○瀧原統計管理官
そうですね。平均的には。
○神林構成員
結構図を書くと。
○石原構成員
上がったり下がったりする。
○今野座長
上がったり下がったりはあるのですけど。
○神林構成員
階段状になります。
○瀧原統計管理官
ベンチマークの影響ですね。入れ替え自身の影響は、やはり下がるという傾向が大体強いのですけれども、ベンチマークは本当にどっちに振れるか分からない感じですね。
○石原構成員
〇4は先ほど。
○今野座長
やりましたね。
○石原構成員
分かりました。
○神林構成員
本当に5~29人の事業所って脱落標本を補充しているのですか。
○今野座長
さっきそう言ってた。
○神林構成員
分かりました。これは自分が間違っていました。
○今野座長
さっきの話だと、調査員が。
○田中審査解析官
そうですね。その名簿を作って、5~29人のうち、基本的には1調査区10事業所を抽出しておりますけれども、そこから抜けた部分や廃止になったもの、それから規模上昇で一種に切り替わったものにつきましては抜けますので、そこを、5~29人の残りの名簿の中から拾ってくるということになります。
○野口構成員
その拾い方はランダムですか。
○田中審査解析官
そこがどういう手続、同じ産業のものを拾っているのか等、どのようにしているのかというのは。
○石原構成員
産業などが結構難しそうな。
○瀧原統計管理官
調査区の層番号をそろえるというのはあるのです。ポイントはまず産業分類をそろえている。同じ中分類から取るという形が、ベースとしてはあるようです。どうしても中分類がないときは、大分類で同じ所という形のジャンルからやっていく。
○石原構成員
7ページ目、新しい調査です。確認ですが、500人以上事業所は全数調査で、東京都については標本調査、同じですね。30~499人事業所に関しては、2017年の調査対象事業所から2分の1を2018年に入れ替えたと。そして2020年から3分の1ずつ入れ替えという方針ということで、先ほどの経済センサスの事業所名簿から抽出していますということですね。ここは少し違いました、5~29人の事業所は、抽出方法としては変わらないということですね。
○瀧原統計管理官
同じです。
○石原構成員
その次の図ですけれども、共通事業所に関して、入れ替えることになったのと同時に共通事業所を取ってみましょうという話になっていると思うのですけれども、共通事業所というのはどこかというと、先ほどの図の標本の中から取っているので、先ほどの標本の偏りと同じ問題が共通事業所にも発生するということですよね。
なぜ、このような確認をしたかというと、問題は、サンプルの偏りがあって共通事業所にも同じ問題が発生するのだということ、これを皆さんで確認したかったということです。それで確認は、2分の1の標本というのは、どのように入れ替えたのですかということです。
○瀧原統計管理官
これにつきましては、共通事業所は、まだ始めてから試行的な感じがありまして、最初に平成30年と平成29年の比較から始めましたので、平成30年1月に半分入れ替えをしていて、残りの入れ替えなかった半分の中で、共通事業所というのが存在しているということになります。それで、実は平成28年なども同じベースでやっておりますので、入れ替えは、この1月に初めて発生するということになります。今までの共通事業所の数字というのは、入れ替えはまだ起きていないと。
○神林構成員
なので、6ページの図ですけれども、これを平成27年のところまで伸ばしていって、平成27年のところに1回、総入れ替えをしているわけですよね。
○瀧原統計管理官
はい。
○神林構成員
そこから現在のサンプルが始まっていますので、それでこういう地図を書いていただくと、どの時点で標本に載っているサンプルは、いつ抽出されたのかというのが分かるように図を書くと、分かりやすいと思います。これをもうちょっと伸ばすと、ローテーションがきれいに始まることになると思うのですが。平成32年ですよね、ローテーションが完成するのは。
○瀧原統計管理官
そうです。平成32年以降。
○神林構成員
平成32年1月以降、ローテーションがきれいにできるようになるのだと思います。なので、ここの30~499人の事業所の2つの系列というのは、抽出されたのが同じ年で、平成27年1月に、この2つの系列というのは同時に抽出されていて。
○瀧原統計管理官
すみません、この図でいうとずれていまして、この図でいうと上だけです。下の図は。
○今野座長
もう入れ替えているか。
○神林構成員
もう入れ替えている。
○瀧原統計管理官
平成30年1月に入れ替えた数字ですよね。
○今野座長
そうか、そうですね。
○瀧原統計管理官
ですから、今、神林先生におっしゃっていただいた、この30~499人に2本の矢印があるのですけれども、この上のほうの矢印は平成27年1月に選ばれていまして、そこからずっと継続していますので、この矢印の中で共通事業所が選ばれてきたという形です。今までは、ずっとここだけだったのです。それが今度の平成31年1月になりますと、ここの分が途切れますので、下の矢印に移行して、平成31年1月以降のデータにつきましては、今度は下の矢印の中で1年間、前と合った所を選んでいくという形になります。これがずっと1年間続いて、そこは今度は3分の1が入ってくるので、少し部分的にややこしくなりますけれども。
○今野座長
ややこしくなりますよね、今は過渡期ですからね。
○神林構成員
もっときれいに書いてくれると嬉しいかなと。
○瀧原統計管理官
ですので、今、お聞きになった2分の1標本をどう入れ替えたかというのは、正に今回初めてやる、共通事業所では発生してくるという形で。ただ、実際にどうやったかという意味で言えば、ランダムに選んだという形にはなるのですけれども。
5~29人は、先ほど少し申し上げたけれども、今、下の矢印は3本の系列がありまして、平成30年と平成31年を比べる場合には、6月まではこの上の矢印に乗っているものから選ばれてくるのですが、平成31年7月以降は、次は真ん中の矢印に乗っている事業所から共通事業所が出てきますし、平成32年1月分からは、更にもう1個下の所から出てくるという形で、先ほど山田先生のお話にもありましたけれども、明らかに対象が替わる度に替わっていく、全く入れ替わってしまって重なりがないという形になるのです。
○山田構成員
11ページに前の資料の時系列が出ていますけれども、共通事業所の所で、これは性格上、毎年対象となる比較の賃金というか、例えば平成29年は2つあるという話ですが、今の段階では共通事業所というのは結果的に共通に回答しているのを取ってきているということだから、実際には毎月ずれているということですよね。
○瀧原統計管理官
ずれています。
○山田構成員
でも計算上は、一旦サンプルのもともとに一回戻すようなことをやって、一応、連続性を取っているという、そういう。
○瀧原統計管理官
戻すというのは復元するという意味ですか。
○山田構成員
復元ですね。回収率100%というような想定を置いて、戻すわけですね。そして比較しているという、そういうことですよね。だから、今、発表されている共通事業所に関しては、一応復元したものというのは、共通しているという、そういう想定になっているということですね。
○瀧原統計管理官
そうですね、月々で回答事業所は変わりますし、当然、企業規模構成も変わりますけれども、極端に言いますと、それをただ単純平均すると、ある月は大企業の回答が多かったから高くなるとか、ある月は中小が多かったから低くなるとか、そういうことは排除して、あくまでも大企業なら大企業はどの程度のウエイトを持っているか、小規模はどの程度のウエイトを持っているかというので復元をしていますから、比較可能な形にはなっているということです。
○山田構成員
今の段階では、もともとの復元の元というのは、共通になっているということですね。
○瀧原統計管理官
共通になっている、そうですね。
○山田構成員
ところが、それ自体が、今後は入れ替えによって変わっていくということですね
○瀧原統計管理官
それは、ベンチマークを変えない限りにおいては同じにはなります。
○今野座長
ルールとしては一緒だと、手順としては。
○山田構成員
手順は一緒か。
○今野座長
ただ、今の場合、確かに復元するからいいのですが、サンプル構成は、例えば5~29人がすごくサンプルが小さくなってしまうとか、大企業は比較的サンプルが大きいとか、復元するときの誤差が全然違う。
○瀧原統計管理官
そうですね、ですから、最初のほうの資料でお話したときに、共通事業所は大企業割合が高い、構成比を見るとすごく高くなっているというのが現実的にあるのですけれども、だからといって、それをそのまま読み込んだ形で平均賃金が上がっているかというと、そうではなく、大企業は大企業でこれぐらいのウエイトを持つというのは固定されていますので、そこまでの影響は出ない。では、何が違うかというと、大企業の部分は非常に精度が高いというか、1つの企業・産業別の枠の中で、たくさん取っていると。一方で小企業の産業別のところで言うと、本系列だったら例えば100ぐらいあるところが、共通事業所ですと30ぐらいしかなかったり50ぐらいだったりするので、ぶれが発生しやすくなるという形が起きていると思います。
ただ、戻し方は同じ形で戻していますので、一応、平均賃金の捉え方というのは合っている。ただし問題は、本系列は一応ランダムに取って、各分布が一定という前提の下で復元していますから意味があるのですけれども、共通事業所は実は本系列が想定しているような復元の元にはなっていないので、それを本系列と同じ復元の仕方でいいのかというのは、根本的には問題としてあるのでしょうね。
○樋田構成員
2ページの「共通事業所の集計値」を計算するときの事業所の乗率diについて確認させてください。例えば、本系列について、産業・規模別のあるセルで、40分の1の確率で10事業所が抽出されると、それら10事業所には40というウエイトが掛けられて集計されます。
○瀧原統計管理官
そうですね。
○樋田構成員
共通事業所にはそれら10事業所のうち5事業所が残っているとすると,各事業所に掛けられるウエイトは、40から80になるはずです。
○瀧原統計管理官
そうですね。
○樋田構成員
セル内で事業所がランダムに脱落していれば、このような復元で問題はないと思います。しかし、実際にはランダムな脱落ではなくて、そのセルの中において、規模が比較的高い事業所や賃金が高い事業所が残っている様な状況ならば推定で問題になる可能性があります。
例えば4ページで本系列と共通事業所の集計値を比べると、本系列では全体の12%程度が500人以上ですが、共通事業所では25%で、2倍違っています。500人以上の規模は乗率が1なので、推定値に対する影響はすくないかもしれませんが、乗率が高い5~29人でも、本系列では63%、共通事業所は47%で差があります。
5~29人は改廃や入れ替わりが多いので、18か月残っている事業所は、そのセルの中で比較的業績が良い所や賃金が高めの所になりそうです。共通事業所の集計では、もともと大きなウエイトを持っていた事業所のウエイトが更に大きくなっている可能性があります。先ほど山田先生から御指摘がありましたが、もともとばらつきが大きい5~29人の事業所に、大きなウエイトを割り当てているので、ばらつきが大きくなったり、精度が悪くなったりする可能性があるのではないかと思います。この辺りを精査していけば、共通事業所と本系列の違いがいうのは分かってくると思います。
同様に、共通事業所に含まれる事業所の変化率と、本系列の事業所の変化率を比べることによって、本系列の賃金上昇率と共通事業所の賃金上昇率の乖離の要因を調べることが必要かと思います。
○瀧原統計管理官
今の樋田先生のお話で、私も改めて思いますけれども、残っている所、共通事業所になり得る所は、先ほどの別なデータにもありますが、賃金が少し高めかなというところがあって、一方でそういう所は規模で見ると、規模の大きい所がそういう傾向があるかなと、何となくボヤッとそんな感じがしたのです。ただ、問題になるのはそうではなくて、同じ事業所の規模の中で、高い所と低い所が共通事業所とそうでない所で選別されて、共通事業所のほうのが残ると。それの影響度合については、500人以上などではなくて5~29人などの小さい所での差の部分が大きく影響している可能性があると。
○樋田構成員
可能性はあると私は考えています。
○山田構成員
しかも、そこのばらつきがちょっと不安定なので。ちょっとこれは見ていないのですが、これまで発表されている共通事業所の伸び率のばらつきと、本系列のばらつきを見たときに、多分、前者のほうが大きいのではないかと。やはりそこは不安定になっているかなと。ちょっと分からないですが。
○今野座長
今、言われた問題も、ちょっとからんでいるのですが、もともとあるセルに1,000社がありまして、その中から10分の1を抽出して100社調べましたと。それで、この本系列も出しましたと。共通系列になったら、これが50社に減りましたと。したがって戻すときに本系列は10倍だけれど、共通系列は20倍にしますと、そういう話ですよね。でも、実際に使っているデータは、セルはそこのトータル賃金ではなくて平均値ですよね。
○瀧原統計管理官
はい、平均値になります。
○今野座長
平均値だから20倍、今の例で本系列で10倍で戻して、あれで20倍に戻すということにはならないと思うのですが。
○神林構成員
なので、平均値を取ったときに、100を取ったときの平均値と50を取ったときの平均値が、両方ともランダムサンプリングしているのだったら、平均値は基本的に一緒になるのだけれど、そこでサバイバル・バイアスが入ってきていて、50の標本というのは、どちらかというと生き残るほうにバイアスを掛けてサンプルしてしまっているはずだ、というのが自分たちの予想です。
○今野座長
そのセルの中でもね。
○神林構成員
それが多分、今日、確かめられたと思うのですけれども。
○今野座長
それは大きいですよね。
○神林構成員
なので、平均値そのものがずれていくということがあるのですよね。それで、ずれた平均値をもっと大きく、ずれるだろうという平均値をより大きくウエイトを掛けて復元しているので、倍々計算で最後に出てくる平均値は、もっとバイアスが掛かってしまうというところだと思います。
なので、標本自体はセルで区切ってサンプリングをしているので、セルの中で発生するバイアスと、それをアグリゲートする、総計するときに入ってくるバイアスと、それが両方あるわけです。それを見ないといけないのですが、どちらがシリアスかといわれると、自分は前者かなと思います。後者のほうは今までのベンチマークみたいな方法で。
○今野座長
ベンチマークの問題ですね。
○神林構成員
ウエイトを何とか計算して。
○瀧原統計管理官
正に前者はそういう形で、セルの中のものが大きく出ている。総計をするときのバイアスというのは。
○神林構成員
なので、この式を見ていったほうが早いと思うのですが、2ページ目の式を見ていただいて、もともとバイアスが発生するかしないかというのは、「産業、規模別各種平均値の推計方法」の当年の所で、aのところにバイアスが掛かってしまうわけです。先ほど来のウエイトというのはdのところで、dというのは分母・分子に掛かっていますから、平均値を推計するときには、dというのはそれほど大きな問題にはならないだろうと。
ところが、これはアグリゲートするときに、推計比率のところでキャップEというのを使いますよね。これが経済全体の、いわゆるベンチマークと呼ばれるもので、ここで調整するわけですが、このキャップEとdとのずれというのが、aのずれと相関しているということ。そうすると、aのずれがあって、かつ復元するときのずれが乗せられてしまうので、推計比率、最終的に全国に膨らませるときに、両方のバイアスが掛かってしまうという考え方だと思います。
多分、今日頂いた資料で、dとaのバイアスというのが関係するかどうかというのが分かるはずだったのですけれど、いまいちよく分からなかったです。これはやはり、ちゃんと分析したほうがいいのではないかと思いますけれども。
○樋田構成員
今、神林先生がおっしゃったことですが、aの式でdは分子・分母に掛かっているので、ある程度は相殺するはずですが、どこまで相殺できているかは分からないと思います。
○神林構成員
それは分かりません。
○樋田構成員
推定比率の確認なのですが、推定比率は大体1に近いのですか。それなりにばらつきがあるのですか。全体として推計値にあまり効いてこないのではないかなと思うのですがどうなのでしょう。
○瀧原統計管理官
そこそこ効いてくると、と言いますのは、回収率が掛かってきますので。
○山田構成員
これは回収率ですね。
○樋田構成員
これを戻しているということですね。
○瀧原統計管理官
ここで補正しますので、そこそこの値で効いてはくると。
○樋田構成員
そうすると、最初のaでのずれと、最後のrでのずれが、無回答を通じて、相当効いている可能性があるということですね。これをどのように定量的に示すのかが、これからなのかなと思います。
○今野座長
もう計算してもらったほうがいいですよね。セルごとにセル内のずれは、本系列のセルのデータがあるではないですか。それで共通系列のセルのデータがあるではないですか。この平均値を比較するということでしょうか。
○神林構成員
というよりは、未提出事業所と提出事業所の差を見ると。
○今野座長
そうか、そうですね。
○神林構成員
その2つの事業所というのは、最初に計算を始めるときは、ちゃんとランダムにサンプルされているという前提ですけれども。
○野口構成員
できれば廃止と識別できると、かなり。
○今野座長
今日のデータで、共通事業所と未提出事業所、すごいですね、これは差が大きいですね。
○山田構成員
ですが、そのセルの中のばらつきみたいなものも見せてほしいのです。サンプルがどれぐらいばらついているか。
○神林構成員
なので、これは多分、分散が大分違うのですよね、未提出事業所と提出事業所と。自分も初めてこの数字は見たのですけれども、平均値がこれだけ、直感的にちょっと大きいと感じました。なので、共通事業所のほうの標準誤差は多分小さくて、未提出事業所のほうの標準誤差は大きいので、この平均値自体が統計的に違うかどうかというのは、ちょっと微妙だと思うのですけれど、その辺はきっちり計算していったほうがいいと思います。
あとは、この規模自体は、その7ページの下の表で規模別に集計していただいたので、規模はコントロールできますが、産業とか立地はコントロールできていないので、産業と立地、規模ぐらいをコントロールした後で、この共通事業所と未提出事業所というのが違うのかどうかというのを、統計的に検定していく、そういう作業が次のステップなのではないかなと思います。
そういう意味では、説明変数に持ってくるか被説明変数に持ってくるか、どちらか分からないのですが、その男女比とかパート比率というのも考えながら、提出事業所と未提出事業所というのが、どのように違うのかというのを明らかにして、その違いをウエイトに反映させるということで、1個目の数字を作れるわけです。その後、そのキャップEとのギャップというのを、どう埋めるかということを考えれば、一致指数はできるという手続になるのではないかと思います。
○樋田構成員
そうですね。
○神林構成員
ようやく名目ができるという話ですね。
○山田構成員
そう、実質がまた。実は前にも言ったように、集計するときのウエイト付けが問題になる。総額の平均値なのか、変化率の平均なのかというのは、実は意味合いが違うというのも本当はあると思うのです。そもそも個人にとっての賃金が増えているかどうかということが問題なのであったら、総額を平均するよりは、それぞれの変化率を平均するほうが実感に近くなるということがあるのではないかと思います。
○今野座長
結局、今、神林さんが言ったことをちゃんと確定しないと、そこから先に行ってもしょうがないということですね。
○神林構成員
実質化するときの議論と、多分すごく関係していると思うのですが、共通事業所の名目指数を実質化するときに、マクロのCPI、これ1つで割ってしまえという議論があると思うのですが、それは、この共通事業所というのが経済全体の中で偏って存在していると、あまり意味をなさないわけですよね。ただ、どう偏るかというのが分かれば、その後、物価をどう調整するかという話になって、そこはお願いしたいという感じになるところかと。
○樋田構成員
共通事業所で求めようとしているものは、経済全体の平均賃金等の推計ですよね。経済全体の復元をしているので、もし物価で割り引くのであれば、経済全体の物価で割り引くことになると思います。
○神林構成員
復元がうまくできればですよね。
○樋田構成員
はい、そうですね。復元がうまくできなくて、何か特定の物価で割引くために、消費者物価指数から適当な系列を選び出すのは難しいかなと思います。
○今野座長
そのときは本系列との関係はどうなのでしょうか。それでずっと見られるのなら本系列は要らないのでは。ちゃんと正確に復元できて、誤差も考えながらやったら、どういう関係になるのでしょうか。結果が一緒だったらいい。
○石原構成員
本当は本系列がちゃんと経済全体を見れているべきだし、誤差の関係というのは。
○今野座長
でも、今、神林さんが言っている、いろいろあって共通系列というサンプル数が小さくなったけど、いろいろな誤差も考えながら全部上手に復元すれば、オールジャパンの状態になるというのだったら、本系列は要らないのではないかという話、素直に。
○樋田構成員
しかし、その共通系列には相当な統計的な処理が入っていて、脱落等を補正するために使ったモデルが妥当であるという下で妥当な数字になります。
○今野座長
そうですね。
○樋田構成員
それを考えれば、本系列がメインであると考えています。
○今野座長
そうすると、あくまでも参考だと。
○樋田構成員
そうですね。適当な推計ができても参考だと思います。
○山田構成員
本系列のベンチマークのときに、水準の調整をしないというようにしてしまったので、時系列で見るには、やはり別の共通事業所を使わないと駄目だというのが、今回あるわけですよね。
○今野座長
そうすると、極端なことを言うと、水準には使わないと。つまり水準が高いか低いか、大体どういう動きになっているかな、ぐらいしか。
○山田構成員
共通事業所はそういうために使うということですね。
○今野座長
例えばですけれども。
○山田構成員
そういうことですね。
○今野座長
ということは逆に言うと、そうやって上手に調整できれば、今日の論点からすると、一種の指数化はできるのですね。時系列で見られると。
○神林構成員
指数のほうがいいのではないですか。
○山田構成員
本質的には指数ですね。絶対数字は意味がないと。
○今野座長
そういうことですね。
○瀧原統計管理官
それは先ほど山田先生がおっしゃった、前年同月比で見るというのは、やはりあまり意味がないといいますか、やはり指数で作った上で見るという、そういう感じになるのですか。
○山田構成員
でも、それは表裏一体ではないでしょうか。前月というのは意味があるのかな。というのは、何に使うかによるでしょうが、普通、マクロでやるときは季調を掛けてしまうので、前年だと時系列でやるということで、そこは。
○今野座長
とにかく神林モデルか何かを作ってもらって、上手にオールジャパン。誤差、いろいろと推計が入るけど、戻しましたと。今年も戻した、去年も戻したと、こうやっていくと、推計の誤差というのは、すごく入るので、だから実額は示しませんと、でも、この金額で大体系列は作れますと、そういう意味でしょう。
○樋田構成員
そうですね。
○今野座長
だから、実額自身は分からないけれど、金額は基準年があったとして、もともと誤差が入っているから、次の年の金額が出るではないですか、同じ誤差だから比率でいけば、さすがに相殺し合うから、系列はできてくることに。
○山田構成員
系列は作れるけれども、ばらつきがすごい大きいのではないかなということで、どの程度信頼できるか、誤差が大きいので。その信頼区間が極めて広くなってしまうという。だから、本当は合っているのかというのは、よく分からないわけですね。
○今野座長
分からなくなると。でも、いずれにしても今の議論の前提は、神林モデルができて、いろいろな推計があったとしても戻せるというのを。
○神林構成員
まずは、その共通事業所の属性をできる範囲で検証するということです。変数はあまりないので、あまり時間は掛からないと思いますけれど、どういう産業、どういう規模で、どういう事業所が1年間提出しやすいのかというのを、まずは確かめて。特に賃金水準と労働時間に関して、労働時間が長い、あるいは賃金水準が高いような事業所から提出しやすい、又はその逆なのかというようなことを確かめていくというのが、第一歩だとは思います。
○今野座長
何か、それからですね。それが終わってから、次を考えましょうか。
○野口構成員
資本金とか、そこまでは分からないのですよね。
○瀧原統計管理官
それは分からないですね。
○神林構成員
やはり、毎勤に入っているデータで、サバイバル・バイアスみたいなものというのを考えるというように制約したほうがいいでしょうか。それとも、他からデータを取ってきて、こうやってくっ付ければ、こういう。
○野口構成員
マージすればいいのですよね。
○神林構成員
こういう変数を使えるでしょうというところまで見込んで考えるべきなのか、ただ、月次ということを考えると、そうは変数はないと思いますけど。
○瀧原統計管理官
もちろん御議論として両方あるかなと思うのですが、ただ、今自身が共通事業所系列を毎勤の参考値で出しているというのは、やはりあくまでも毎勤の中の調査の下に出された数字という形なので、他のものというと、ちょっと加工統計的な話になってくるので。そうすると、それはあってもいい議論だとは思いますけれども、メーカーとしては、ちょっとそこまでいくと、一歩外に出る感じはします。
○今野座長
先ほどの話をお聞きしていると、何か指数の系列を作るというのは天気予報と一緒で、大体、当たり30%とかいうような成果で。
○山田構成員
そんな感じはするのですよね。
○神林構成員
もともと共通事業所をターゲットにした標本設計になっていないのですよね。「さあ、どれぐらい出てくるのか」というのがちょっと。
○今野座長
でも、将来的に共通事業所に基づく統計を残すのだったら、そういう情報もセットで出してあげたほうがいいですよね。「このぐらい間違えそうだぞ」とか、統計で考えると。
○山田構成員
本当はそうですね。
○今野座長
ユーザーとしてはそうですよね。
○山田構成員
そうです、信頼区間がどれぐらいで、どういう出し方があったかですけど。
○瀧原統計管理官
あと前回、小売統計のときに既存店の話をされていましたが、その際に小売の売上げを見るときには、トータルで見るのか、既存店だけで見るのかで、使い分けるということがあると思うのですけれども、毎勤の場合も全部の本系列のような取り方と、共通事業所を抜き出して、そこから作っていく数字というのは、この使い分けの意味というのは、何らかあるという感じで考えるのですか。
○山田構成員
小売の場合は、ちょっと今回と違って。母集団が毎勤の場合は全部事業所、全従業員ということですよね、ところが小売の場合はスーパーや百貨店業界なので、全体の小売業ではないですね。何かちょっとそこが違っていて、例えば百貨店の前年比というのは、それぞれの既にある既存事業所の売上げがどうなっているのかという形で見ますけれども。百貨店では例が悪いですね。例えばスーパーだったら、既存事業所というのは、常にある比較できるもの、ところがスーパーというのは、やはり新規出店とかも結構出てきますので、それも含めたのが全体ベースです。だから、ちょっとアナロジーに過ぎないのです。似ている部分はあるのですけれども、例えばスーパーのほうは割合的には新規のものがかつては多かったけれども最近は少ないとか、そういう性格のものなので、それを使う人たちは皆、大体理解して使い分けしているということです。
かつ、サンプル調査というより対象を固定してやっていますから、だからちょっと入れ替えはあるのですが、この共通事業所の場合は、サンプル自体が替わってきますよね。そちらはもっと安定しているわけです。だから時系列で見るということの、多分、信頼区間は狭くなると。でも、今回はそれはかなり大きくなってしまう可能性があるということで、ちょっと1対1では話は持ってこれないかなということです。
○今野座長
いずれにしても先ほどから神林さんが提案されていることとか、皆さんがおっしゃっていることがどこまでできるか、ちょっと検討する。するしないは別にして。
○瀧原統計管理官
ちょっと整理して。
○今野座長
検討していただいて、何か先ほど神林さんの話だったら、すぐできると言っていたから。でも、データ数はせいぜい1万件ぐらいでしょう。
○神林構成員
経験から言うと一番面倒なのは、未提出事業所と、あとは提出事業所、特に未提出事業所を区別するというのが一番面倒です。それが既にフラッグとして立っているのであれば、もうあとは自動的に0、1を回帰すればいいだけなので、右側にどんどん変数を持ってきて。
○今野座長
ちょっと待って、でも今日、未提出事業所のデータをもらっているのだから、フラッグは立っているのではないですか。
○瀧原統計管理官
ただ、結構、面倒くさくて。
○今野座長
面倒くさいですか。
○瀧原統計管理官
いわゆる未提出事業所というカテゴリーがあるわけではなくて、この場合、29年と30年でやればここがあってとなりますけど、これを正に月ごとにずらしていくと、どんどん変わっていく話なので、比べる月を固定したときに、初めて未提出事業所という定義が可能になるわけですので。
○神林構成員
これはローリングしていくので。
○今野座長
ええ、ローリングしていますね。
○瀧原統計管理官
手間が掛かるのは確かです。
○今野座長
……私たちもちょっと書いておいたら。
○瀧原統計管理官
御相談させて……。
○今野座長
やるかやらないかは別にして、今日はそういう作業は非常に重要だなということになったので、どこまでできるかなということを検討していただきたいことと、論点2、論点3をもし考える場合でも、それができているケースで考えるのか、できていないケースで考えるか、多分、皆さん全員、議論が違うと思うのですよね。ですから、その辺が出発点かなと。できていないケースはどうなりますか。実質化とか。でもあまり意味がないですよね。全然意味がないですよね。分母が全然駄目だったら意味ないですよね。やはりそれが出発点ですね、どう考えても。
○神林構成員
自分の感覚としては、できていないのだったら、そのCPIでバッと割るといのは算数ができればできるので、ユーザーの方が。
○今野座長
勝手にやってと。
○神林構成員
やってくださいと考えるべきかなと思います。メーカー側が責任を持てる範囲をちょっと超えているような気がしますので。
○石原構成員
でも、その数字の意味がどれだけあるのかという。
○神林構成員
それはユーザーの人が判断すればいいのではないかと思います。
○今野座長
でも、ということは、ここで最後にどういう報告書を書くか分からないけれど、「そのままやったらメーカーとしては責任を負えません」というのが一筆入ると。表現の仕方いろいろあるけれど。あるいはユーザーの方が使うときは、こういう問題がいっぱいありますから気を付けてくださいと、問題点をバーッと書いていくとか。
○山田構成員
ディスクレーマーですね。
○今野座長
そういう書き方になるわけですね。
○石原構成員
それはすごく今回思いました。どうやって調査しているとかがあまり分からないのですが、調べてもあまり出てこなくて、でも、それはやはり出しておいて、こういう問題がありますということは、言っておくべきかなと、すごく思いました。
○今野座長
どうぞ、御遠慮なく。
○樋田構成員
神林先生のモデルとは別に、今、公表されている共通事業所の数値は、偏りがあるかもしれないサンプルに基づいているということは明らかにしておかないと、誤用が広まってしまうと思うので、その点は強調しておく必要があると思います。その上で可能であれば、モデルを使って補正をするとこういった数字になるということを示す。しかし,これはモデルに基づく加工度が高い統計なので参考値であるというところが限界なのではないかなと思います。
○今野座長
今、おっしゃられた第一段階にしても、どういう歪みがあるかと、「歪みがありますから、よろしく」ではなくて、こういう点とこういう点とこういう点と書かなくてはいけませんよね。
○樋田構成員
それはセルごとの状況を検証することがベースだと思います。
○今野座長
どちらにしてもね。では、そうしましょう。何かそこの作業手順が決まらないと、ここであまり議論してもしょうがないのではないかと思うのですよね。
○瀧原統計管理官
確かに、実際の手間暇の問題ですが、材料的には別に何か新たに持ってくるわけではなくて、毎勤の中の世界のデータの話ですから、ちょっとそこは神林先生と御相談させていただきます。
○神林構成員
皆さんに相談してください。
○瀧原統計管理官
分かりました。
○野口構成員
データを渡したほうが早いのではないでしょうか。
○今野座長
みんな賛成してくださっている。
○山田構成員
どうぞと。
○今野座長
では、そういうことを前提に。次の検討会は大体、予定が決まっていますよね。
○瀧原統計管理官
はい。
○今野座長
どうしましょうか。
○神林構成員
それまでに頑張っていこうかと。
○今野座長
予定されているのは何日後ぐらいでしたか。
○細井統計企画調整官
次回、それから次々回の予定をしておりますが、次回につきましては、3月6日。
○今野座長
その次は。
○細井統計企画調整官
その次は翌日の予定をしておりまして、前回に御提案がありましたヒアリングも含めて、調整をさせていただければと思っております。
○今野座長
この後、もう決まっていましたか。
○野口構成員
どちらかという話ではなかったでしょうか。
○細井統計企画調整官
次回が3月6日、次々回が7日でお願いできればと考えております。
○今野座長
では、その日にちを押さえておいて、もう一度事務局と相談させていただいて、私の今の意見は、ここで議論を進めるには、先ほど言ったような作業が前提なので、ですから、それとの兼ね合いで検討会は設定すべきだと。ただ、今後の議論を考えるときに、ちょっと専門家を呼んでヒアリングをするという必要があれば、そこでつまんでというのはおかしいですね、勉強する時間ができる、ということは、作業をする時間ができるので、その辺の兼ね合いも含めて、相談をさせてください。
○瀧原統計管理官
はい。
○今野座長
そういうことでいいですか。また最終的に日程が決まりましたら、御連絡を事務局から差し上げてください。一応、今、仮置きされている日程は押さえておいてください。また確認しますか。
○細井統計企画調整官
お時間につきましては3月6日水曜日が10時から12時、それから3月7日木曜日が15時半から17時で、予定させていただければと存じます。
○今野座長
それでは、そういうことで今日はありがとうございました。大変活発な意見をどうもありがとうございました。終わりましょう。
○細井統計企画調整官
本日は、長時間にわたりご審議いただきありがとうございました。第2回検討会を閉会させていただきます。
照会先
政策統括官付参事官付雇用・賃金福祉統計室 政策統括官付参事官付統計企画調整室
電話:03-5253-1111(内線7609,7610) 03-5253-1111(内線7373)