- ホーム >
- 政策について >
- 審議会・研究会等 >
- 政策統括官(統計・情報システム管理、労使関係担当)で実施している検討会等 >
- 毎月勤労統計の「共通事業所」の賃金の実質化をめぐる論点に係る検討会 >
- 2019年3月29日 第7回毎月勤労統計の「共通事業所」の賃金の実質化をめぐる論点に係る検討会 議事録
2019年3月29日 第7回毎月勤労統計の「共通事業所」の賃金の実質化をめぐる論点に係る検討会 議事録
政策統括官付参事官付雇用・賃金福祉統計室 政策統括官付参事官付統計企画調整室
日時
平成31年3月29日(火)10:00~12:00
場所
中央労働委員会7階 講堂
(東京都港区芝公園1-5-32 労働委員会会館)
(東京都港区芝公園1-5-32 労働委員会会館)
出席者
構成員(五十音順、敬称略、○:座長)
石原 真三子 |
稲葉 由之 |
○今野 浩一郎 |
神林 龍 |
樋田 勉 |
野口 晴子 |
山田 久 |
事務局
藤澤政策統括官 |
吉永審議官 |
瀧原統計管理官 |
細井統計企画調整官 |
村木雇用・賃金福祉統計室長補佐 |
議題
(1)中間的整理(案)について
(2)今後の具体的な検討作業の進め方について
(3)その他
(2)今後の具体的な検討作業の進め方について
(3)その他
議事
○細井統計企画調整官
それでは、定刻になりましたので、ただいまより、第7回毎月勤労統計の「共通事業所」の賃金の実質化をめぐる論点に係る検討会を開催させていただきます。
構成員の皆様方には、御多忙中のところを御出席いただきまして、まことにありがとうございます。
それでは、これ以降の進行につきましては、座長にお願いをいたします。
カメラ撮りはこの辺までとさせていただきます。
○今野座長
おはようございます。
それでは、進めたいと思います。
お手元に議事次第がありますので、それに沿っていきたいと思います。今日は中間的整理(案)についてが一つ、もう一つは、今後の具体的な検討作業の進め方について、議論をしていきたいと思います。
まず、最初に中間的な整理(案)について、事務局から説明をいただけますか。
○瀧原統計管理官
では、議題1の資料といたしまして、資料1と資料2を用意させていただいておりますので、これについて御説明させていただきます。
まず、資料1でございますけれども、本検討会の中間的整理(案)という形で用意させていただいております。少し分厚い資料となっておりますが、このうちの9ページまでが中間的整理(案)の本体になりまして、前回の検討会のほうで示させていただいたものを、委員の先生方の御意見等を踏まえて案として改めて出させていただくものでございます。
この説明をこれからいたしますけれども、後ろの部分は、整理(案)の参考資料ということで用意させていただいております。9ページの次に参考資料という形で表紙になっておりますけれども、そこに書いてありますように、開催要綱、開催実績、本系列と比較した「共通事業所の集計値」の特性は、各検討会で出させていただいた前回までの資料をまとめたものでございます。順番に行きますと、1ページ、2ページ、3ページが開催要綱です。構成員の方々の一覧を載せたもので、5ページが開催実績で、本日、第7回までの日付と議題。その後、7ページからが資料という形になっておりまして、その次の31ページからは、ヒアリングを第3回のときに行いましたので、それの概要と、次の33ページからはそのときに有識者の方から提出いただいた資料2つを載せております。それが参考資料の構成になっております。
本体のほうの、最初のところに戻っていただきまして、資料1の中間的整理(案)について御説明させていただきます。
基本的には、前回のときにお示ししたものをベースにやっておりますけれども、それに加えた部分で、一番大きな修正点は、前回の検討会で、今野座長から「構成について」という形で、特に論点1の部分について、一定の見出し分けをしてはどうかという御意見をいただきましたので、そこを反映したのが一番大きな修正でございます。
具体的に申し上げますと、3ページになりますけれども、(これまでの議論)のところで、(1)「「共通事業所」のサンプル特性について」の部分が見出しとして加わったということで、以前はこの○がずっと羅列した形だったのですが、めりはりをつけた、ポイントを押さえた構成にしたという形でございます。
それと同じ形になりますので、次の4ページで言いますと、(2)(3)という形で下のほうに表題をつけさせていただいております。「「共通事業所」の集計値の特性について」、「「共通事業所」の賃金変化率について」という部分でございます。
その次からが5ページで、(さらに検討すべき課題)という形になりますけれども、そこについても見出しをつけた形で、(1)「「共通事業所の集計値」の意味について」という部分。ここからの部分は、それまでにずっと羅列した部分を幾つか組みかえというか、順番を変えて、そこの表題に合った形での並びにしているというものでございます。
あと、今野座長から幾つか御意見、指摘がございました部分を追加しております。具体的には(1)の2つ目の○の部分です。共通事業所の集計値について、日本全体の状況を知るための指標ではなく、本系列の代替というわけではなくて、共通事業所の状況を知る意味を考えることになるだろうという部分でありますとか、あるいは集計値の意味、サンプルの特性という形で、特に最初の○の部分は、現状のサンプルの精度評価が必要であると。今野先生の「構成について」に書いていることでありますけれども、その前に、稲葉先生からだと思いますが、ローテーション・サンプルが変わっていて、今の時点はまだ経過措置期間であるということで、精度評価をするにしても、平準化以降ということが、ちゃんとやるには必要ではないかという御意見も書かれております。あと、非共通事業所がサンプル特性の偏りに及ぼす影響でありますとか、最後の○ですけれども、非共通事業所の特性、脱落とか未回答という部分を確認する必要があるだろうというところも追加しております。
(3)は復元等の集計方法についてという表題をつけて、以前出していただいた部分をそこに組み合わせたという形でございます。
6ページにつきましては、(4)「集計値の偏りについて」という表題、(5)「賃金変化率の偏りについて」という整理をさせていただいたのと、(6)は共通事業所の活用について、集計値は本系列と比べてサンプルの偏りや集計結果に一定のバイアスがある可能性があることから、一定の限界があるというところを書いていたのですが、正しく活用してもらうためにどんな情報提供が必要であるかを検討する必要があると追記させていただいております。
あと、そこに以前書いていた部分はその後ろ、7ページの一番上に白い○で分けて、本系列において何らかの工夫をすべきではないかというところは残しているということでございます。
その次の7ページにつきましては、論点2に入りますけれども、ここは当日の議論で、前回、第6回の議論でやったものを少し追記しております。具体的には(これまでの議論)の3つ目の○でございますけれども、今回、共通事業所の指数化を考える中で、共通事業所というものは違う。計算の仕方自身も変わっているということで、定義が資料にはあるのですけれども、その辺もしっかり示していく必要があるのではないか。これは稲葉先生からのお話であったかと思いますけれども、3つ目の○では、ウェイトの変化の除去をするために、1年前と当月を比較する場合に、労働者のウェイトを当月のものに統一している、一つにしているというところの算定、計算式を用いて、本系列とは異なっているというところを追記させていただきました。
同じそこのまとまりの中で、下から2つ目の○はギャップの除去の話で、これは石原先生からのお話でしたが、ギャップの影響の除去を行っていたけれども、一方でギャップ自身は経済構造の変化等を示すものなので、そこの情報も重要であり、出していくことが必要ではないかという御指摘をいただいたということ。一番下は、公表すべきではないかという意見について、これは今野座長からお話をいただいた部分でございますけれども、この検討会自身は、さまざまな実質化をめぐる論点を統計的な視点から課題を整理することが開催趣旨であるので、引き続きこれも検討していく必要があるという部分を追記させていただいております。
次は8ページになりますけれども、具体的な作業のところで、上のほうのまとまりの中で、上から4つ目の○のところを追記させていただきました。具体的には、これまでこの検討会で出ておりました個票データを使っての分析をして、神林先生から御提案をいただいている部分ですけれども、その辺のところはちゃんとやっていこうという意味での部分を追記させていただいております。
前回の資料からの変更点は以上のところでございます。
これが資料1でございまして、その後の資料2という1枚の紙、これは概要という形で用意させていただいたものです。表のほうで集計値はどういったものかということで、イメージ図と具体的な数字を書かせていただいたのとともに、裏側は実質化に向けた検討状況ということで、前回お示ししたものと比べますと、(これまでの議論)のほうでは2つ目の○のところで、サンプルが異なる、あるいは同じ月で2つの数字が存在するというところを追記させていただいたのと、下のところも、先ほど本体で追記した部分を変えているというところで、あと、(さらに検討をするべき課題)の一番下も、個票データを使っての分析を記載させていただいたというものでございます。
前回からの変更点を主に御説明させていただきましたけれども、この中間的整理(案)と概要の案という形が、今回、お示ししている資料です。
説明は以上でございます。
○今野座長
ありがとうございました。
御質問、御意見はございますでしょうか。
これはあれでしたね。事前に案を皆さんにメールでお配りして、それでまた御意見をいただいて、修正してある。そういうものですね。
○瀧原統計管理官
はい。最終的な御意見をいただいたものも反映した案でございます。
○今野座長
何か御意見はございますか。
この共通系列を考えるというか、出した経緯には、前いただいた資料のどこだったか、どこかにありますね。これでいくと資料集の29ページです。ここでも議論になったのですけれども、29ページに作成・公表の経緯についてという中間取りまとめの後ろ側についている資料集がありますね。29ページなのですけれども、わかりましたか。
要するに、統計委員会の西村委員長の発言で、景気指標として人々が実感するのは、自分の事業所の平均賃金が上がったからだと。ですから、日本全体ではないと。そういう意味では、この言葉で言うと、共通系列みたいなものを見たほうが、実感できる景気指標になるのだというのがこの発言の趣旨ですけれども、こんなことも経緯ではあったので、それを少し書いておいたほうがいいかなと。
そうすると、今日の資料でいくと、資料1の最初に「「共通事業所の集計値」とは」とあるのですが、この中のどこかにそういう経緯を簡単につけ加えておいたほうがいいかなという気がするのです。そういう背景もあって、こういう共通系列の作成が議論になったので、実は、ここで言う西村委員長の言ったことの意味とは何かという、いろいろそれ自身が議論になったのです。これはどういうことを言っているのだということになったのですが、それは横に置いておいて、それが大きな背景の一つではあったので、そこを少し追記しておいたほうがいいかなとは思うのです。そこは短く、そういう指摘もあるので、「それを対応する指標として」、ちょっと文章は考えますけれども、「それに対応するための」、それもよくないな。文章は任せて、せいぜい1行か2行ぐらいで追記しておきたいと思いますので、よろしいですか。
ほかに、私がちょっと気にしていたのは、神林さんが前から何度も言っている、多分、入るとしたら7ページ目の一番上のところで、本当は我々のミッションではないのですけれども、一番上に「本検討会の検討事項を超えているが、今後「本系列」において何らかの工夫を」と書いてある。要するに、本系列もちゃんと考えろよという話なのですけれども、それに関連して、本系列のデータを使って対前年比較をしたときに、その間で賃金が何%上がりましたといったときに、ここの言葉で言うと、共通事業所で何%上がって、新規が入ってきたから何%上がって、出ていったから何%上がるという一種の要因分解みたいなものもちゃんとしたほうがいいのではないかということを神林さんが何度も言っていたのが印象に残っているので、7ページの○の2行の後ろからちょっとくっつけておいたらどうですか。忘れないように、どうですか。
○石原構成員
すみません。神林さんからいただいた論点整理は、随分前のもの。
○今野座長
汚い手書きのものですか。
○石原構成員
そうではなくて、きれいな論点整理のほうなのですけれども、これのどこかに、今おっしゃった新規事業所と、脱落事業所と、継続事業所を分けられるのでという話があるので、それは非常に重要だと私も思いましたので、ぜひ。
○今野座長
追加に賛成ということだね。
○石原構成員
賛成です。
○瀧原統計管理官
よろしければ、その資料が、これは検討会の資料として出しているものではなかったのですが、一応そこの部分を読み上げさせていただいたほうが、共通の理解になるかなと思いますので、いただいたペーパーを読み上げさせていただきます。
「したがって」という接続詞があるのですけれども、「毎月勤労統計は、賃金支払総額の変化を、継続就業事業所における賃金支払総額の変化と、新規開業事業所によって新たに発生した賃金支払総額と、廃業事業所によって失われた賃金支払総額に完全に分解することができるという本来の機能を有していることがわかる。将来的に、この数値を推定して公表することは必要と考える。」この部分でしょうか。
○今野座長
それは難しいから、それをもっと簡単に書いて、ごめん。少し長いから、それを1行ぐらいに短くして、7ページ目の一番上は、多分、唯一この研究会で本系列について物を言っているところなので、この後ろか何かに追加しておいたらいいかなということです。
それでは、他にいかがですか。
どうぞ。
○石原構成員
もう一つ、神林さんからいただいたきれいなほう。賃金変化率の偏りについて、6ページの下のほうの5に書かれているのでいいかなとは思ったのですけれども、私は、割とずっと共通事業所の指数に関して否定的、ネガティブな気持ちを持っていたのですが、何もこういう問題点とかを考えずに、データの意味は何かなと考えたときには、本系列にはないものは、ある一つの事業所の1年前と1年後の数字がある。それは本系列にはないことなので、その数字は非常に重要な情報を持っているというふうに考えられるので、もし本当にバイアスが全くなくて、変化率が全体を代表できるものなのであれば、それを確認するというのは非常に重要なことかなと思いました。
そんなことはないですか。
○神林構成員
前回は欠席して申しわけございませんでした。自分が出した論点整理はチャラになったとばかり思っていたので。
○今野座長
そんなことはないよ。
○神林構成員
そうですか。全く今回は気にとめていなかったのですけれども、自分が出した論点で、恐らくこの論点整理にも反映されてはいるのですが、賃金水準を求めることと、賃金変化率を求めることは全く別だと。そういうことを明確にしておいたほうがいいだろうと思います。
毎勤の標本設計は、あくまでも賃金水準を求めて、結果として賃金変化率が求まるという設計になっていることを明示したほうがよいということです。賃金水準に関しては、実は、毎勤は結構データがありますので、共通事業所と呼ばれている事業所がどれぐらいのバイアスを持っているのかは、ある程度統計的に推定できると思います。ただ、賃金水準のバイアスが、賃金変化率のバイアスと同じなのかというふうに言われると、その根拠はどこにもありません。
○今野座長
それがここだね。
○神林構成員
賃金変化率については、母集団を正確に表章する統計はありませんので、毎勤の共通事業所の賃金変化率が全体に対してどれぐらいバイアスを持っているのかということは、現時点では判断が全くできないと考えたほうがいいでしょう。
あり得るとすると、賃金水準と賃金変化率の間に、ある種のロジカルな関係があるので、これを想定して、賃金水準にこれぐらいバイアスがかかっているから、賃金変化率に対してもこれぐらいバイアスがかかるはずだと。そういう推測はできるはずです。ただ、この推測に関しては、自分はちょっと自信がないというふうに書いたつもりでございました。
なので、そもそも賃金変化率を求めるということと、賃金水準を求めるということは別であるということと、共通事業所で、西村さんが恐らく念頭に置いているのは、賃金変化率そのものを求めにいくということを念頭に置いて、継続事業所というか、共通事業所だけをピックアップしたほうが、バイアスがないのではないかという話をしていると思うのですけれども、多分、自分の言葉で言うと、それは見当違いである。
データの特性をよく理解していなくて、単にパネルデータであるということしか恐らく考えていらっしゃらなかったと思うのですが、ちょっと誤解がそこにあるのではないかということが自分の意見です。ですので、先ほど今野さんからさらっと、西村さんの統計委員会の言葉についてというお話がございましたけれども、参考資料3の第126回統計委員会のところで、統計委員会としては労働者全体の賃金の水準は本系列、景気指標としての賃金変化は共通事業所を重視していくというふうに意思決定されているわけですが、どういう理由でそういう意思決定をしたのか、今のところ自分は手元に全く資料がアクセスできていないので、これは直接お話しになった方をお呼びしても構わないですし、事務局経由で資料を手に入れて、こちらに回していただいても結構ですし、そこはこの検討会として理解するべきポイントだというふうに考えています。
まずはそういうことです。
○今野座長
ということは、中間報告の中では、6ページの(6)ぐらいの表現でいいかな。それで、実はこの背景に言われていることがあるということを我々は共有化しておけばいいので、最後、神林さんが言われた点は、前からここで問題になっている。よくわからないということと共通してですね。
○石原構成員
私も何回も聞きましたけれども、出てこなかった。
○今野座長
さらに神林さんの最後の提案は、本人をここに連れてこいと。誰が本人かはわかりませんけれども、意図をちゃんと聞こうという御提案も含んでいたということで、これから研究会は続きますので、もっと作業レベルに落ちていくので、そのときに、そういうことが必要だったらまた考えるということにさせていただきたいと思います。
どうぞ。
○神林構成員
自分の意見がチャラになっていないのであれば、自分が改めて読んでみて、整理の仕方でいま一つ混濁しているなと考えたところがあります。1つはサンプル特性がどれぐらいずれているのかという話と、もう1つはそれを全国の平均値に集計するときの手順です。そういう話はやはり別に考えておくべきで、一応括弧書きで別になっているのですけれども、それぞれの論点があちらに行ったりこちらに行ったりしてしまっているので、再整理をしたほうがいいだろうと思います。
異論があるかもしれないのですけれども、例えば(2)「「共通事業所の集計値」の特性について」というところで、ここは集計の問題を見ているわけですが、最初のポツのところで標本数が少なくなるため、標本誤差が大きくなる。これはもちろんそのとおり、集計するとそうなりますということがあるとは思います。ただ、2つ目のポツの新規事業所の影響が反映されておらず、標本に偏りがある可能性というものは、これはサンプルの特性だと考えるべきだと思います。それを集計するときに、復元倍率でこの部分を補正するというのが今までの戦略だったわけですけれども、もともとサンプルにそういう偏りがあるので、集計するときにどういう手順が必要になるのかというプロセスを踏まないといけないという関係になろうかと思います。
なので、それは分けて考えると、集計をする際に、全体の本系列のウェイトをそのまま流用しているということが集計をするときの最も大きな問題点の一つになっているはずです。共通事業所の集計値を計算するためには、共通事業所の復元倍率をつくらなければいけないというのが本来の姿ですが、これを本系列の復元倍率で代替することによって、どのような問題が発生しているのかということはきちんと理解しないといけないかと思います。
あとはここの項目で言いますと、後者2つですね。稲葉さんがおっしゃった、現時点でのデータは多分、安定していないので、ここで例えばバイアスが0.2%ありますよみたいな話をしても、それが未来永劫そのまま安定するかというと、必ずしも保証の限りではないという話がございます。ただ、これはサンプルの構造というよりは、現時点での一時的な経過が問題になるところですので、少し時間がたったとしても解消されないサンプルの偏りということと、十分時間がたてば解消されるであろうということは、ちょっと分けて考えたほうがいいのかなと思います。
○今野座長
私の意見は、今、神林さんが言った意見はみんなここに入っている。特に重要なのは前者で、実は、前回の研究会は、前者のところですごく議論があった。だから、復元して戻すけれども、戻す先は何なのだという話なのだね。それを前回はオールジャパンなのか、オールジャパンの共通事業所なのかというふうに分けて、どちらの母集団に持っていきたいのだということが非常に議論になって、それは既に何カ所かに入っていると思いますので、いいかなと思います。
○神林構成員
わかりました。
○今野座長
それと、今の提案で、最初の点ですけれども、神林さんが言ったのは4ページの(2)の小さい点の2つ目、新規事業所の影響が反映されず、標本に偏りがある可能性があるというのは(1)のほうに持っていったほうがいいという話だね。それは移動なので、瀧原さん、いいですか。
○瀧原統計管理官
はい。
○今野座長
大きい○にしてもらって(1)に移動する。
他にいかがでしょうか。よろしいでしょうか。
どうぞ。
○稲葉構成員
1点だけサンプル特性に関して、前回申し上げたところで、現状の共通事業所は抽出から4年目以上ですので、それも含めてサンプルの特性であるということを含めていただければと思います。
以上です。
○今野座長
どこかで入れたほうがいいね。5ページにある(さらに検討すべき課題)の(2)の最初の○のあたりのどこかですか。
○瀧原統計管理官
もしあれでしたら、4ページの(2)の、先ほどの白いポツの後に黒いポツが4つあります。4つ目の経過措置期間に起きているということでもいいのかなと思います。
○稲葉構成員
そうですね。サバイバル・バイアスが気になったので。
○瀧原統計管理官
そうですね。多分、今のデータを分析するに当たっての留意点ではありますけれども、将来的に言うと、そこはなくなる話だとは思いますので、さらに検討すべきというよりは、そこを踏まえた上で今は分析すべきというお話かなと。
○今野座長
4ページの(2)の最後の点のところで、何かそういうことを追加するということですね。言ってみれば、今は時期が悪いという話だね。
○瀧原統計管理官
そうかと思います。そういう感じでよろしいでしょうか。
○今野座長
どうぞ。
○樋田構成員
7ページの最初のところに、本系列について何らかの工夫とあります。何らかでは何を指すのかわからないと思うので、可能であれば、ゼロセルの問題や欠測の扱いなど具体例を幾つか挙げたほうがいいかなと思います。
以上です。
○今野座長
私の気持ちは、申しわけないのだけれども「何らか」にしておきたいなと。つまり、そこはあまり具体的な表現は、今の段階ではしたくない。
最終的な報告書には、本系列に対しての要望とか希望をきちんと整理したほうがいいと私は思うので、それはそれで別途きちんと全体で議論したいと思っているので、今の段階では「何らかの」でどうですか。
○樋田構成員
そういう御判断でしたらそれで結構です。
○今野座長
他にいかがですか。
何点か修正点がありましたので、その修正点を修正した上で、これで中間的整理は完成というふうにさせていただいて、具体的な文面については、事務局と私にお任せいただければと思います。
それでは、中間整理は終わりということで、次の議題に入りたいと思います。
次は今後の進め方でしたか。お願いします。
○瀧原統計管理官
では、今後の具体的な作業の進め方という形で議論いただきたいと思いますけれども、最初に、今日の御議論という形になろうかと思いますけれども、資料3はいつもの本系列と比較した集計値の特性という形ですが、今回、資料を追加いたしましたので、今後の議論の一つの参考になるかなと思って、御説明させていただきたいと思います。
具体的には、資料3を少しめくっていただきまして、7ページでございます。共通事業所と本系列のサンプルの特性を、今後、神林先生に分析いただけるかとは思っておりますけれども、事務局のほうでちょっとやってみたというところを御参考にさせていただければと思います。
ちょっとわかりにくいかもしれませんので、説明させていただきますけれども、まず、共通事業所と本系列のサンプルそのものにどういった特性があるか、何かうまく見られないかなと思ってつくったものでございまして、復元とかは一切しておりません。それぞれのサンプルそのものを集計したもので、その際、先ほど樋田先生からもセルの話が出ましたけれども、実際に集計するに当たっては、毎月勤労統計においては、単位集計区分という形で企業規模と産業ごとに細かく区切って、そこの中で平均賃金を出し、それにウェイトを掛けて、規模計なり産業計なりをつくっていくという作業をとっておりますので、その基本となっている単位集計区分をデータのベースにしまして、それぞれで平均値あるいは標準誤差を計算してみました。
その際に、共通事業所に該当しているもので、具体的には、7ページで言いますと、30年と比較する29年分、かつ7ページについては1月分のものでございます。大変恐縮なのですが、ちょっと書き忘れているところが1つありまして、これはきまって支給する給与についてやったものでございます。一番肝心なところが抜けていて大変申しわけありません。きまって支給する給与につきまして、共通事業所に相当するもののみで平均値をとったものと、それから、本系列ですから、全体で平均値をとったものを、1つのセルごとに散布図をつくってみました。
縦軸が共通事業所、横軸が本系列という形になります。もちろん基本的には毎勤のサンプル全体としては本系列ですので、そのうち共通事業所になったものの平均値がどうなるかということで、例えば共通事業所が完全に本系列から無作為抽出になって出たようなものであれば、統計的な誤差はあるにしても基本的には同じ値、つまり、45度線に乗っかるだろうというイメージを持った上で、その45度線から仮にずれるとした場合に、共通事業所になっているものの特性になり得るのではないかという前提でやっております。
縦横の散布図をつくったものがこれで、それを規模別に1,000人以上、500~999、100~499などという5つの規模段階に分けてやりました。一応参考までに、近似曲線ですね。線形回帰のもので、かつ原則としては、これは原点を通るラインに乗るのが本来ですので、あえてY切片をゼロとした形でつくってみたものでございます。当然ですけれども、かなりの部分が真ん中に寄ってくるわけですが、やはりそのぶれはあるという形で、それが規模ごとにどうなっているかというふうなものでございます。
単純にここの数字だけを見ると、規模の大きいほうは、もちろん全部がほとんど1なのですけれども、Xの係数が1なのですが、規模の大きいほうが実は1よりちょっと低くなっていまして、30~99とか5~29のほうは1を少し超えているような形になります。これは1との前後の関係でいきますと、1を切っている場合は本系列のほうがやや高い。1を上回っている場合には、共通事業所のほうがやや高いという形になっております。今までの議論では、全体での平均値なりを見た場合には、共通事業所のほうが高くなっているのではないかという感じが出たのですけれども、ここの数字を見る限りは、規模の大きいところではちょっと違う形だなと。
○神林構成員
瀧原さん。これは本系列の中に共通事業所は入っているのですか。
○瀧原統計管理官
入っています。
○神林構成員
共通事業所と非共通事業所を比べるのであれば、目の子で何となくつけ足さないといけないということですね。
○瀧原統計管理官
そうですね。ですから、すみません。これでやってしまって、本系列の比較でやっておりますけれども、完全に実は引き算で、残ったものでやると、もうちょっと明確に出たかなとは思います。
○神林構成員
そうすると、共通事業所の本系列に対するシェアは、規模によって大分違うということですね。
○瀧原統計管理官
違います。まさに8割ぐらいあるところと、3割ぐらいになっているというところが出ているということになります。
○神林構成員
わかりました。
○瀧原統計管理官
あと、平均値を出すときの一つ大きな違いは、当然平均値を出す前には各セルにウェイトがかかっているのですけれども、これは1点、1つのセルは1というウェイトになってしまっているので、ウェイトのかかり方も適切にはなっていない。適切という意味は難しいですけれども、適切になっていないので、その影響は、小さい、労働者数が少ないセルもウェイトが逆に相対的に高く出てしまっているというようなことはあります。
そういう試算の域を超えないものなのですけれども、一応こういう形で出たということとあわせて、下のほうが標準誤差でございます。こちらのほうは、標準偏差でサンプル数、あくまでも母集団に対してサンプルとしてとったものであるという前提ですので、そういう意味では、共通事業所も、本系列も、もとの母集団は同じで、そこからのものという強い前提があるので、適切かどうかは御議論があろうかと思いますが、それで標準誤差も同じような形で分布をしております。散布図をつくってみました。
そういうことですので、今、神林先生からお話がありましたように、シェアが実は結構違っておりますので、シェアの影響が強く出ていると思われますけれども、実はこの場合に傾きが、これも同じような形で、45度線に近いところにはなるのですが、こちらは顕著に規模が小さくなるほど傾きが強くなっておりまして、標準誤差は共通事業所のほうが大きくなるという形になっております。これはまさに規模が小さいほどサンプル数は減ってきているということの影響のところかもしれませんけれども、そのような形で、こちらの標準誤差のほうは、当然かもしれませんけれども、上の平均値より分散というか、当てはまり度合いが低いというふうな形になっております。
ちなみに先ほどのゼロセルの話で言いますと、平均値についてはそこのセルがないものについてはここから除かれているという形になります。端的には、そこのセルは共通事業所のデータがなくて、本系列にはあるという場合には、ここの点には乗ってこないということになるので、そういうものはここの点から省かれているというところが1点。もう一つは、標準誤差のほうは、下に※で注を書いておりますが、標準誤差がゼロの点で、端的にはデータが1個になってしまった点ですね。実際にはないのですけれども、理論的には2つの事業所でも全く値が一致するとゼロになるのですが、そういうものというよりは、一個になってしまったものが、赤い点、オレンジの点になっております。ですので、下の図の一番左側の1,000人以上で言うと、下に張りついている点が2点ありますが、本系列のほうでは一定の標準誤差が出たのだけれども、共通事業所になるとデータが1個になってしまって、標準誤差がゼロになってしまったというセルが2つありましたので、そこはオレンジになって、これをそのまま生かすと、近似曲線が下に引っ張られてしまうので、それは除いた形で計算しているということ。除外した上で引いていますということを申し上げております。
そういう標本としての誤差という形で、標準誤差で見ると、やはり規模の小さいところは高くなっているというふうになっております。これを月によって差がないかということで、きまって支給をする給与なのであまりないかなと思いつつも、一応これを1月から2月、3月とずっとやって、少しずつぶれはあるのですけれども、このような形になっています。これを比較的45度線に近いところに集まっていると見るか、やはり分散があるかというような、何らかのバイアスがあるかというところは、これだけでは見切れないという部分がありますが、ただ、ざくっと見るとこんな感じになっているというところを今回はお示しさせていただきました。
○野口構成員
すみません。1個だけ短く確認させていただいて、これは脱落サンプルは入っていない。脱落とか廃業のものは計算に入っていないという理解でいいですか。それとも、全部入っているのですか。
○瀧原統計管理官
脱落というのはどの時点で。
○野口構成員
いわゆる途中でもう記録がなくなってしまったとか、欠損になってしまったとか、要は、そういう出入りがある事業所であるとか。
○瀧原統計管理官
本系列は、例えば最初ですと29年1月の時点でデータがあれば、それは入れています。
○野口構成員
全部入っている。
○瀧原統計管理官
はい。ですので、例えば2月にはなかったり、あるいはその前の月は実はなかったけれども1月に復活していたというふうなものも全部込みでございます。
○野口構成員
全部入っている。わかりましたすみません。
○瀧原統計管理官
ちょうど本系列で、いわゆる毎勤の集計の中に、その月が入ったものであれば全て入ってくる。一方、共通事業所のほうは共通事業所の集計に入るものですので、この場合で言いますと、29年1月と30年1月と、両方とに入ったもののみが集計対象になっているということです。
○野口構成員
わかりました。
○瀧原統計管理官
そういう形で算定してみましたものが12カ月分ありましたので、それ以上の説明がありませんけれども、皆さんの議論の参考にしていただければと思います。今回の資料として御説明は以上でございます。
○今野座長
何か御質問はございますか。
○山田構成員
非常に興味深いなと私は見ていたのですけれども、7ページの平均値のところで言うと、当初何となく仮説で考えられていたのは、共通事業所と本系列をこのようにとったときに、いわゆるサンプルのバイアスで、共通事業所のほうが、平均値が高いというふうに思われたと。そうすると、この45度線より上のほうに傾きが行くということが想定されたのが、必ずしもそうではないと。
小さいところはそうなのですけれども、ただ、これを見ていくと、外れ値が幾つかそれぞれ出てきているのですが、具体的にどういうものなのかというのは、情報をいただくと、まさにそこのバイアスの発生の仕方のもうちょっと具体的なところが見えてくるのではないかと。どういう業種で発生しているのかなというところだと思うのですけれども、今は多分、ないと思うので、主なもので12カ月分でかなり外れているところをリストアップしていただくと、もうちょっと状況がわかってくるのではないかということです。
○瀧原統計管理官
ありがとうございます。
まさにそこはすみません。今、できていなくて、引き続き御提供したいとは思っておりますけれども、外れ値が出ている部分は、恐らく外れ値が出るということは、サンプル数が全体の中で小さい可能性があるのかなと思っていまして、そうすると、実はウェイト的には小さい可能性があるので、そこを先ほど申しましたように、1対1のウェイトになってしまっているので、そういうところに引っ張られている可能性はあるのかなと思っております。そういう意味では、この散布図だけでは、今の仮説が何らかで否定されたとか、あるいは固定されたというところまでは言い切れないという点では、そこにちょっと限界があるかなと思っております。ただ、個々のデータという意味では、分析や興味深いことはあるかなと思っていますので、引き続き分析させていただければと思います。
○今野座長
どうぞ、稲葉さん。
○稲葉構成員
大変興味深い結果であると思いました。まずは2点ほどありまして、1点は、山田先生がおっしゃったところで、分布を見ると、規模1,000人以上のところで随分違う値が出てきているということがよくわかりました。7ページで見ますと、規模1,000人以上のところで、本系列と共通事業所の値が随分異なっているところが何点かわかります。
もう一点としましては、標準誤差について規模ごとに並んでいますが、もしゼロを固定したとすれば、平均値で傾きが決定されるわけですけれども、それを考慮したとしても、傾きの値で見ると、規模が小さくなるほど傾きが大きくなるということで、共通事業所の誤差が大きくなっているということがよくわかる。非常にわかりやすい資料であると思います。
その前といいますか、私が検討会を欠席していまして、確認していないところがあるので、もし議論があった箇所でしたら申しわけありませんが、5ページの点で確認をさせてください。標準誤差の算定にかかわることです。こちらの第二種事業所における記号の確認なのですが、iが産業でjが層、kが調査区となっています。このときのjの層というのは規模なのでしょうか。
何点か質問したいと思いますので、それごとに教えていただきたいと思います。
○瀧原統計管理官
そうですね。調査区内で層がつくられているところのものです。
○稲葉構成員
わかりました。そうしますと、調査区の常用労働者数は、調べた場合の値というふうに考えてよろしいわけでしょうか。記号で言うと、TYiです。
○瀧原統計管理官
そうですね。多分、これはTXiとの並びでいくと、実際の調べた調査結果のほうですね。
○稲葉構成員
調査結果ですね。規模30人以上の第一種事業所の場合の母集団のNiというのは事業所数ですね。
○瀧原統計管理官
Niですか。
○稲葉構成員
Niです。
○瀧原統計管理官
Nijkに当たる部分ですか。下から5番目の部分ですね。事業所数です。○稲葉構成員 今、この資料で正確に判断ができていないのかもしれないのですけれども、この誤差率の算式は、私の印象ですと、達成精度を満たすために、産業規模別に必要な事業所の数を算定するために用いている式であって、事後的に標準誤差を計算するために用いている式ではないように思えてしまうわけです。もし事後的に推定値、共通事業所の集計値という言葉を使われていますけれども、その推定値の精度をはかるためには、最後の比推定の部分、つまり、ベンチマークに合わせる部分を考慮した上で、標準誤差を計算する必要があるのかなと思います。
現在、この式を見ていると、事業所数といったところはあるのですが、先ほど神林先生が言われた経済センサスの労働者数が入っていないというところで、全体的な推定値の標準誤差にはなっていないのではないか。以前の検討会でも申し上げたのですけれども、どちらかというと、達成精度を満たすために必要な事業所の数、そして、その前提となるのは、事業所が全部回答した場合の話で、計算された値は、最後のベンチマークに合わせるところまでではなくて、抽出した段階に戻す第一段階での誤差の算定になるのかなと。理解が足りていないのかもしれないのですけれども、教えていただければと思います。
○瀧原統計管理官
すみません。我々もそこまでの準備ができていないので、そこはちょっと、ちゃんと少し教えていただきながら御回答をさせていただければと思います。
○稲葉構成員
技術的な話に偏ってしまい、すみません。そうすると、今、出されている標準誤差は、共通事業所と本系列の比較は非常に有益であるわけですけれども、この数値そのものが実際の標準誤差ではないかもしれないと思います。もう一点、このグラフが非常にわかりやすいので、推定値の値によって率が変わってくるので、多分、このグラフを見ると、推定値の大きさが大きいところで随分違いが出ているように見えるのですが。
○瀧原統計管理官
今回の標準誤差の話だけで言いますと、すみません。この5ページなりの標準誤差の計算とは全く違いまして。
○稲葉構成員
違うのですか。
○瀧原統計管理官
すみません。説明が不十分だったかもしれませんけれども、これはあくまでもサンプルだけを見て、もとの代表値は入れておりません。
○稲葉構成員
標準偏差ですね。
○瀧原統計管理官
そうです。
○稲葉構成員
勘違いしていました。すみません。私の勘違いです。
○瀧原統計管理官
ただ、標準偏差そのものというよりは、標準偏差ではあるのですけれども、一応母集団からのサンプルという形で、ルートNでは割っているというところです。
○神林構成員
ルートNのNというのは。
○瀧原統計管理官
サンプル数です。サンプルサイズです。
○神林構成員
それぞれのサンプルサイズ。
○瀧原統計管理官
そうです。そこのセルのサンプル、実際のもので割っていますので、そういう意味では、あくまでもそこのサンプルについての標準偏差ではあるのですけれども、一応母集団からとったものという前提のもとで、ルートNでサンプル数で割っているという形です。ですから、そこでちょっと小規模のところは効いてきているのはあるのかなと思います。
○稲葉構成員
わかりました。ありがとうございます。
○今野座長
他にいかがですか。
どうぞ。
○神林構成員
まず、1点なのですけれども、1,000人以上と500~999で分けたのはどういう理由ですか。抽出は全部500人以上ですね。
○瀧原統計管理官
そこは抽出と復元する単位集計区分のつくり方が、単位集計区分自身は1,000で切っております。母集団に戻すときの単位としては、1,000以上と500~999は別物になっているということでございます。
○稲葉構成員
推定式が別ということですね。
○神林構成員
そうなのですか。
○瀧原統計管理官
いわゆる推定比率はそれぞれで計算して、分けてつくっているということでございます。
○今野座長
他にいかがでしょうか。
このデータについて、もういいですか。何か御質問があれば、どうぞ。
○山田構成員
私も統計学のところはそれほど詳しくないので、稲葉先生にちょっと御質問したいのですけれども、今回、事務局のほうで、標準誤差というふうに表記されていますが、ルートNで割った標準偏差と出されて、極めてシンプルな形で出されている。これはどれぐらいの意味を持つものと考えていいのでしょうか。ちょっと変な質問なのですけれども、統計学的にはですね。
○稲葉構成員
いろいろな解釈があると思いますが、単純に比較するという面ではあまり問題はないかと思います。本系列と共通事業所での比較として、資料として提示したいということですので。
○山田構成員
ここの想定は、本系列と共通事業所が共通の母集団を持つという想定を置いて、何となく45度線に乗せようということであれば――それはそうかというのは前回、議論があったように、2通りの考え方があるので分かれるのですが――そういう想定をしたときに、単純にとれば、共通事業所のほうが非常にばらつきが大きいということは、母集団に戻すときの精度が非常に粗いものだということは最低言えるというふうに、私自身は解釈したので、そういう理解でよろしいでしょうか。
○稲葉構成員
それもいろいろ解釈があると思うのですけれども、現状では、私もそうだと思います。それと、最後に先ほど質問をしたところですと、比率としてどのぐらい違っているのか。つまり、推定値のどのくらい分が誤差なのかというようなものが、この図ではちょっと見えないので、そこがわからないというところでの疑問はあります。
○神林構成員
それぞれの平均値についてバンドがついているはずです。そのバンドが下の図のどこかが1対1で対応しているはずです。
それぞれの平均値に対応して、それぞれの標準偏差が入っているはずなので、見比べればわかるはずなのですけれども、どこの平均値の集計単位がどこの標準偏差の集計単位なのかよくわからないので、平均に対して標準偏差はどれぐらいなのか。変動係数がいまいちよくわからないというところがありますね。なので、平均値と、平均値のバイアスがどれぐらいあるのかということと、変動係数の大きさの違いはどれぐらいあるのかを考えて、変動係数の大きさの違いは、サンプル数の違いだけに起因するのかどうかを考えるということが問題点なのかなと思います。もしかしたら、共通系列はちょっとばらつきの大きいところだけをばっととってきてしまっているとすれば、変動係数について系統的なバイアスがかかってしまうということになろうかと思います。
考え方としては、恐らく母集団があって、本系列と呼ばれるサンプリングの仕方をした場合と、もう一回共通事業所という形でサンプリングをしたもの。2つの標本があって、その2つの標本が同じなのか、違うのかということを検討するというのが多分、この検討会のまずはやらないといけないことだろうと思います。
○今野座長
どうぞ。
○樋田構成員
このグラフは大変興味深いと思いますし、先ほどの稲葉先生のご意見に賛成です。
1つ追加をお願いしたいグラフがあります。例えば7ページの標準誤差の散布図なのですが、標準誤差は、この場合、ルートNで割っているということだったので、セルごとにNが大きいのか、小さいのかによって、あるいは共通事業所のNと本系列のNによって値が変わります。そうすると、セル内のばらつきを比較しにくくなります。ですから、普通の標準偏差のグラフも必要かなと思います。
以上です。
○神林構成員
直感なのですけれども、500~999人の挙動と、1,000人以上の挙動が違うように見えるのですね。これがどうしてなのかということが疑問です。単位集計区分は同じですね。500~999人と1,000人以上、つまり、規模以外の集計区分は同じ。
○瀧原統計管理官
産業とか割り方はもちろん同じです。
○神林構成員
同じですね。特に標準誤差の分布を見ると、ルートNで割ってしまっているので何とも言えないのですけれども、基本的に500人以上は全部全数調査のはずなので、本系列と共通事業所のサンプル数はほぼ1対1になるはずだと思うのです。脱落があるので共通事業所のほうがちょっとずれて、8割ぐらいの数になるのではないかと思いますが、だとすると、標準誤差の比率を見ても、ほぼ1になるのは間違いないとは思うのですが、1,000人以上の規模で下のほうに出ていて、500~999人のほうで上のほうにちょっと出てしまうというのは、ちょっとばらつきがありますね。これがどうしてなのかなということがわからないところです。
○今野座長
前にデータであったと思いますけれども、回答率は規模によって大体安定していましたか。例えば1,000人以上はもう全部捕捉できるので全数答えるけれども、500人以上、違う。
○神林構成員
500人以上が全数。
○今野座長
そうなのですけれども、1,000人以上と500~999のグループでは回答率が違うとか、そんなことはあったか。回答率が全体で8割というのは頭に入っているのですけれども。
○瀧原統計管理官
特に規模が大きい、500~999と1,000との違いは、にわかにはお答えできないのですけれども、規模の大きいところは、業種によって結構差があって、サービス系とかは結構規模が大きいにもかかわらず低いとかいう部分はございますので、その辺の影響はあるかもしれません。
○今野座長
先ほど樋田さんからあった標準誤差の散布図を標準偏差でやったら、もっとわっとばらつくだろうね。直感ですけれどもね。
他にいかがですか。
それでは、これから先ほど言いましたように、この研究会ではもう少し具体的な作業をしていこうと思うので、その第一歩として瀧原さんからこういうデータを出していただいたのですが、本格的な作業は次回以降の委員会ですので、ここを回す責任者としては、早く終わるのだったら早く終わりたいなと今日は思っているのですけれども、何かほかにあれば。
○瀧原統計管理官
できれば今回、ホワイトボードを用意させていただきましたので。
○今野座長
では、神林さんから問題提起があるということなので。
○神林構成員
問題提起というよりは、この先に何をやればいいかという話なのですけれども、きれいに書く時間がなかったので。
○今野座長
すみませんけれども、きれいな字で書いてね。
○神林構成員
今、考えなければいけないことは、基本的に、事業所をjとして、時間をtとすると、ターゲットになる変数はここにあります。きまって支給する給与とか、いろいろですね。そういうものがここにあって、これが共通事業所と非共通事業所で違うのかどうかということを考えればいいわけです。
なので、単に、これをt時点、例えば今の最初の図ですと、2018年1月でしたか、スタートポイントで、ここをtと置いて、2018年1月のサンプルに対して、これを共通事業所と非共通事業所に分けたときに、どれぐらいの平均的な違いがあるのかということを見てあげるということを、まずは考えないといけないわけですね。でも、この点については、多分、ほぼ簡単に答えが出て、t時点で定義される共通事業所のダミー変数をこのように置いたとすると、単にダミー変数に回帰すれば平均的な違いが出てくるだろうと。ただ、これは集計単位がかかわってきますので、何か集計単位によって、平均的な賃金水準は変わってきますから、集計単位をコントロールする必要があるだろうというのがここに来ます。
あと、基本的に考えているのは誤差項だけでいいと思うのですけれども、単純に、t時点でのクロスセクションのデータを使って、この2つの集団の平均値がどれぐらい違うのかということを見てあげるということをすれば、これが賃金水準に対する一つのバイアスとして理解することができるだろうというふうに考えられると思います。
これを毎月毎月ずらしながらやっていくということが基本的な戦略といいますか、考えなければいけないこと。ここで実は問題になるのは、この定義なのですけれども、実は2種類定義があって、一つは形式上、共通事業所にならないといけない事業所。つまり、1年後もサンプルしますよと決まっている事業所ですね。もう一つは、実質的というか、本当に実態として共通事業所になった事業所で、実態として、実際に1年後も提出してくれましたという事業所。この2つの種類の定義の仕方があります。
こちらのほう、形式上の共通事業所だけで定義をつくって、これを回帰したときに、共通事業所は基本的にローテーションになっているはずですので、ランダムサンプリングをしているはずですね。なので、形式上共通事業所という定義を使えば、ここはゼロになるはずです。ただ、実際に、本当に共通事業所になったかどうかという定義を使うと、ここで生き残りバイアスがかかってくるので、この分だけβがずれてくるはずです。それが生き残りバイアスを推定する一つの手段かなというふうに考えることができるだろうと思います。これが一つの戦略だろうと思います。
これは各クロスセクションの単回帰というか、単純な回帰ですので、あとはここの説明変数、コントロール変数を何に使うのかということがもう一つの次の問題になるわけなのですけれども、コントロール変数を一つ集計区分単位で使っている産業と企業、事業所規模と、あとは都道府県、この説明変数だけを使うというのが、もしこのβを毎勤を復元するときに使うための共通事業所のバイアスだというふうに考えて、それを当てはめて本系列との関係で復元するときにこのバイアスを修正しましょうということで使うのであれば、ここの説明変数は恐らく集計区分で使っている情報だけに限られると思いますが、その後、実験として、集計区分には使っていないのだけれども、毎勤の中で使える説明変数、例えば男女比率であるとか、あるいはパートタイマー比率を入れてみたときに、それがもし説明力を持ってしまったときにどうするかということになると、Missing Variableがあるということになってしまうので、多分、ここにすらバイアスがかかってしまうという可能性が出てきます。
そうなったときに、それを知った上で、これを平均値のバイアスだと考えて、共通系列から本系列との比較をするときに修正する、インターセプションを修正する。βとして使えるのかどうかということが多分、次に出てくる問題で、これがちょっと、自分としては、こちらの説明変数に男女比率とかパートタイマー比率を入れたときに、恐らく何か起こるのかなと思っていまして、そちらのほうが問題だろうと考えています。
ただ、幸か不幸か、毎勤で使える説明変数の数はかなり限られているので、賃金センサスみたいなことにはならないと思いますけれども、これで基本は行けるのかなというふうに思います。これをやりましょうということですね。今のところ、サンプルが使えるところで、βをどんどん推定していって、このβが季節的に変動するのか、あるいは例えば規模で分割してβを推定したときに、平均値ではなくて、βにばらつきをもって推定するようなことをしたときに、それが規模によって違うのかとか、そのようなことをざっと計算するということがまずは第一歩かなと思います。
既に今日出てきた図で、ある程度インターセプションというものがわかっているわけですけれども、こうすれば個票を使うことができるので、そちらのほうがもっと正確な推定値を出せるのかなということが、ぐちゃぐちゃと書いたペーパーで提示したことです。なので、これを次にやりましょうというのが自分の。
○野口構成員
極めて重要な分析だと思うのですけれども、例えば先ほどおっしゃった属性ですね。女性比率とかパートタイマーの属性とか、それといわゆる形式上の共通であるとか実質共通が、要するに、インタラクションを起こしている可能性があるので、そこの交絡を入れるみたいなことはいかがでしょうか。
○神林構成員
ここでそういう変数の重みがまずはわかる。交絡を入れないでですね。その後、このC=0、これがどういうメカニズムで起こるのかということと、このXの間に何か偏相関がある。例えば男女比率であればコントロールできてしまうので、今言った交絡項みたいなものを入れればいいのですけれども、男女比率みたいなものが影響を及ぼすということがわかってしまうと、何かもっと他のことの影響があるのではないかということが見えてきてしまうとすると、もう完全に誤差項と相関してしまうので、コンシステントな推計ができないかなというふうになってしまいます。
なので、集計区分でまずはやって、その後に男女比率みたいなものを入れて、いや、交絡を入れても大丈夫ですと、インターセプションも大丈夫ですという話になったとすれば、他の観察できない変数との相関は多分ないだろうみたいなことを主張して、これは一致推定ができているはずだから、全体をこれで修正すれば何とかなるという議論ができると思うのですけれども、そこは次のところだと思います。
○今野座長
他にいかがですか。
それはいいですか。半分ぐらいしか理解していないのだけれども、Cはダミー変数なのだね。
○神林構成員
そうです。
○今野座長
そうだね。そうすると、共通事業所だと1、そうではないとゼロで入るわけだね。そうすると、βというのは、1が立ったときにどれだけずれるか。そういう数値になるということだね。
コントロール変数と言っているXというのは、結局は何だろう。ちょっと男女別とか、そういうものは全部除いて、基本は産業規模だとして、産業規模で、よくわからないけれども一番真の値。真の値というのは変だな。だって、XYJに対してそこはプラスだね。掛けるか。プラスですか。掛けるかな、プラスかな、どちらかなと思ったのだけれども、プラスだとすると、何かベースがあって、誤差で最後調整するというのがβだね。そのベースがXだね。そうしたら、そのベースは何だと。
○神林構成員
まず、考えているのは、ここは賃金額なので、賃金額の水準は、やはりまずはコントロールしないとだめだと。各セルの中での賃金額をこれでコントロールしてあげて、セルの中でC=0とC=1の間でどれぐらい差があるのかということを計算してあげて、その平均値がここに出てくるということが統計的には正しいことだと思います。なので、今日インターセプション、相関をつくっていただきましたが、あれにほぼ近い数字がここに出てくるという予定です。それをセル単位で平均値を出してプロットしたのが今日の図なのですが、それを個票単位で相関係数を出してプロットして、その傾きがここに出てくるはずだと。そのようになると思います。
これを多分、すぐにとは言わないのですけれども、もうできると思います。これのフラッグですね。本当は1年後に出さなければいけないのだけれども、結果として出さなかった。そういう事業所が現在は共通事業所から外れているわけですけれども、そうではなくて、1年後も出さなければいけないですよという事業所も共通事業所1として定義をしてあげて、実際に出したというものを共通事業所2として定義をしてあげて、それぞれについてダミー変数をつくってあげて、それぞれについて解決したときにβがどれぐらいずれるのかも見てあげるというのが正解かなと思います。
○山田構成員
わからないのですけれども感覚で、Xの具体的な説明変数として入れていくものの、今、考えていらっしゃるのは、産業とか規模とか地域とかいうことですが、セルの中のデータの、単純に標準偏差がかなり大きいと、うまく推計できないのではないかという感じがするのですね。それは比較的小さいと、きちんと推計できる。そこが大き過ぎると、誤差項に何か問題が出てきて、別の変数を入れていかないとだめだというような感じを受けるのですが、そういうことではないですか。
○神林構成員
それはあると思います。この規模、説明変数によって、誤差項の分散が多分、大きく違ってくると思いますので、そこはそうですね。
○山田構成員
ただ、逆に、セルの使い方が比較的小さい分散のセルごとにそれができるのかとか、多分、一番小さいものでやるということしかないのかもしれませんけれども。
○神林構成員
そのセルの中の分散が、セルのサイズ、サンプルの標本のサイズによっているのか、それとも、そうではないのかということが結構重要な話なのですけれども、セルのサイズによっているのであれば、それは修正ができるとは思います。つまり、例えば製造業に比べてマイニング、鉱業の数字のばらつきは大きい。これは確かだと思うのですけれども、それは製造業に比べて鉱業の事業所の数が少ないから単純にばらつきが大きいのか、それとも、本当に同じサンプルサイズだとしても、鉱業のほうがばらつきが大きいということを反映しているのかということは、こちらで仮定するしかないですね。
○今野座長
やってみよう。
○神林構成員
とりあえずこれをやってみるということですね。
○山田構成員
あともう一つ、その先ですけれども、うまく推計したとしたときに、Cのβを時系列的に見ていったときに、一定の安定性があると、これもおもしろいですね。本系列と共通事業所の間の一定の相関、関係がある。でも、それがそうではないのであれば、全く違うのであれば、かなり全く違う系列というか、この先なのでしょうけれども、うまく推計した後。
○神林構成員
そうですね。ただ、クロスセクションのデータがあれば1年後には推定できる話なので、その月その月でβが推定できて、その月その月の賃金水準を修正していくということは、事後的には可能です。なので、1年後に、1年前にさかのぼって水準を修正するということは、その月その月では可能になっていくと思います。そういう意味で、一定のβをどんとかけて修正をがっとしてしまうというのではなくて、個々の月ごとにβで修正をしていくということをすれば、より正確な統計を出すことができるだろうと。
○山田構成員
それも1年間ではなくて、2年ぐらいとって、例えば1月のβは大体これぐらい、2月のβが、ちょっとそこはサンプルがあるのか。
○神林構成員
データがどんどん蓄積していけばβの挙動がわかって、自分の直感だと、1月と6月は大きいのかなと。サンプルの入れかえがあるときというのは大きいのかな。7月ですか。2月と7月は多分、大きくて、6月と12月になるにつれて小さくなっていくみたいな、季節性みたいなものがあるのかなということは、直感としては思っています。
そういうスタイライズファクトができれば、当たらずとも遠からずということで、過去のデータからとってきたβをそのまま当てはめて、現在、まだ1年後はないのだけれども、現在の数字を修正してしまうというようなことが可能になるのかなと思います。これぐらいしか思いつかないのです。
○今野座長
このときに、例えば共通事業所が、βの値が大きくて、こんなにずれているぞというふうにわかりましたと。修正しましたと。その修正をしたときに、修正した先で何を表現したいかですよ。
○神林構成員
そこで、先ほど出てきたサンプルの特性と集計を分けて考えることができれば、サンプルの特性に関してはβで修正してしまうということができます。
○今野座長
修正をして、結局オールジャパンを出したいということなのですか。
○神林構成員
そういうことです。
○今野座長
オールジャパンだね。オールジャパンの共通事業所ではないね。出したいのはオールジャパンだね。そういうことだね。
○神林構成員
そうです。
○今野座長
やってみる、やってみましょう。
○神林構成員
ただ、これを修正したからといって、後で集計する、アグリゲートするときにどうするのだという話はまだ残っているのですけれども、そちらのほうが結構クリティカルかなと自分は思いますが、ともかく共通事業所の系列を出したときに、どんと平均だけ公表をして、とりあえず平均値は、これぐらいバイアスがかかっていますよという情報と一緒に出すということは必要かなと思いますので、それさえ出すことができればまずはいいのかなと自分は考えています。
○野口構成員
すみません。あまりごちゃごちゃ、もうシンプルにやったほうがいいと思うのですけれども、もう一つだけ、先ほどサンプル数によって、要するに、回答数によって誤差に影響があるという話だったのですが、これはぐちゃぐちゃしてしまうのであまりやらないほうがいいかもしれないのですが、加重回帰するというのはいかがですか。
○神林構成員
難しいですね。できればウェイトは使いたくないですね。各サンプルサイズ、Xのセルはそれぞれ一つ一つ同等だとみなしたいというのがやりたいことですね。
○野口構成員
全国のいわゆる産業、要するに、オールの産業で加重する。
○神林構成員
母集団で加重ですか。ここはいいですけれども、こちらまで加重してしまいますね。
○野口構成員
確かに。
○神林構成員
それがちょっと、どうですか。直感的にはやりたくないですね。
○野口構成員
危険。シンプルにやったほうがいいですか。やりたくないですか。そうですね。
○今野座長
どうぞ。
○稲葉構成員
どちらに入れる方がいいのかなという気がするのですけれども、もし総額とするならば、パートと一般が随分違うので、その扱いを推定でどう行うのか、j、tに加えてもう一つの添え字をつくって、一般・パートを分けるのか、あるいはXの側に一般・パートの比率を入れて考えるのかがちょっと難しいかなと。データを見てみないとわからないとは思うのですけれども、一般とパートは額が随分違うと思いますので、その違いをどこの部分で吸収させるかというところが難しいかなと思いました。
○神林構成員
その部分はセルの切り方をいろいろと工夫していく必要が実際にはあると思います。もしかすると、今、共通事業所と言っていますけれども、パートのデータだけを見たときの共通事業所と全体の共通事業所は違うかもしれませんので、多分、チェックはされていないと思います。なので、それぞれパートだけのデータをとったとき、フルタイムだけのデータをとったときというふうに、別々に推定をするということも試みたいと思います。
○今野座長
今のパートの共通事業所と一般労働者の共通事業所は違うというのはどういう意味ですか。違わないのではないですか。
○神林構成員
パートのところが欠損になっていると。
○今野座長
欠損はゼロ人ね。欠損ではないですよ。ゼロ人という意味だね。
○神林構成員
ゼロ人になってしまうわけです。
○今野座長
ゼロ人のところはあるね。
○神林構成員
例えば18年1月時点で100人雇っていたところが、19年1月時点でゼロになってしまうと、共通事業所から抜けますね。パートの共通事業所からは抜けてしまうけれども、フルタイムは雇っているので、全体の共通事業所には入っているはずです。
○今野座長
やはり共通事業所だと私は思うのだけれども、ただ、パートがいないだけ。
○神林構成員
賃金水準が観察できないからだめです。
○今野座長
そこに数字は入らないね。確かにゼロ円というわけにはいかないね。
○神林構成員
なので、ゼロ円というわけにはいかないので、それはやはり打ち切りですね。廃業してしまうのと全く同じ扱いです。そこはぜひ知恵をいただければと思います。
○今野座長
思いついたことを、いろいろやってみればいいではないですか。
○山田構成員
できるだけセルを属性が同じものに持っていくということがポイントだと思うのですね。先ほどの繰り返しなのですが、本当は年齢とかの情報があると、もうちょっと――それは無理ですけれども、でも、稲葉先生がおっしゃったように、パートと一般はかなり違うので、そこは分けないとうまく出ないのではないかという感じはします。
○神林構成員
分析をやる目的なのですけれども、いろいろやらないといけないことはあると思うのですが、本系列との比較、本系列に対して共通事業所の系列に何が貢献できるのかということを考えると、おのずと本系列で公表されている系列にスタックしてしまうところがあると思いますので、当座はとりあえず本系列に何が貢献できるのかをベースに分析をして、実は毎勤の共通事業所は、本系列を離れてこういう性質を持っているのですというようなことを次の段階で示したほうがいいのかなと思います。
そういう意味では、例えば年齢になると、6月のデータでは賃金センサスと事業所レベルでマッチングできますので、6月のデータを使ってある共通事業所の平均年齢と、非共通事業所の平均年齢を比べるとかいうようなことはできるはずですので、そのようなことも将来的には試みたいと思っています。いいですか。
○今野座長
いいですよ。ありがとうございます。
○神林構成員
では、これは瀧原さんと相談しながらやっていきたいと思います。
○今野座長
他に、いいですよ。
○瀧原統計管理官
1点だけよろしいですか。すみません。これを進めていきたいと思いますので、先ほど今野座長もおっしゃったのですけれども、これ自身はあくまでも共通事業所のサンプル自身が、オールジャパンを代表するものからのサンプルだというところがもとなのですが、前回のときにおっしゃった、実は代表するものが違うのではないかというところに、この分析はどうつなげていけるのかなというところは、今日御議論というわけではないのですけれども、前回のところの部分は今後どうやっていくかなということは、課題としてあるのかなと思っております。
○今野座長
今日あった、統計委員会の西村委員長が言う、景気指数としては横に置いておいて、共通して働いている人、ずっと働いている人は賃金がどう上がったかということが非常に重要だということを重視すると、オールジャパンの共通事業所の統計、データをする。ここみたいにオールジャパンに戻すのではなくて、オールジャパンの共通事業所に戻す。それが前回、問題になったことですね。では、オールジャパンの共通事業所の母集団はどこにあるのかという問題になっていますけれども、これもやらなければいけないのではないかという気がするのです。できるかどうかわからないのですけれども、何となく前回の検討会の議論は、オールジャパンに戻してもあまり意味がないのではないかと。オールジャパンの共通事業所に戻すなら意味があるかもしれない。それは西村委員長が言ったようなこととかなり近いということだと思うのですけれども、これが本当に可能かどうか。
先ほどの神林さんの言い方からすると、本系列にどれだけ貢献するかというか、サポートするかということではなくて、全く別の問題として考えたほうがいい。別の系列としてということなのですけれども、この点も瀧原さん、作業としてはやっておいたほうがいいのではないですか。
○石原構成員
今の西村先生のお話でいくと、おっしゃっていたのは、書いてあることは、変化ですね。本系列は平均を見ていくのだけれども、共通事業所は、同じ事業所にいる人がどれだけ変化したかを見ることができるということなので、共通事業所のデータは変化をとれて、それは本系列の計算ではとれないものなので、意図としてはそういうことなのではないかという気がするのです。それをどうやって考えていくかということがまだわからないのですが、1個の事業所の変化は計算できるので、その分布を出したりとかいうことは難しいですか。
○山田構成員
石原先生がおっしゃったことを言うと、私の仮説は、前から申し上げているように小売店の既存店のようなイメージです。これも絶対数はなくて、変化だけですね。前年。ただ、要は、全数調査というところが違っていて、今回はあくまでサンプルになっているので、全数の既存店ということをどう復元していくかを議論していくという話になってくるのだと思うのです。
それは前回、石原先生が御指摘されたように、今出ている共通事業所を、母集団を戻すときの還元の数式をどうするかということは考えないとだめなのですけれども、今のままではだめだと思うのですが、ただ、私は非常に単純に、今のままをそのまま使えばいいと思ったのですが、石原先生から御指摘があったのは、他のデータもあり得るということ。その後もまた考えたのですけれども、確かにいわゆる既存店、既存事業所のデータは、そのうち共通事業所として回答したものと、実は、本当は存続しているのだけれども、去年答えていて、ことし答えていないものがあるわけです。ここの部分はデータがあるので、これを使えばもうちょっとサンプルがふえて、より母集団に近いものが推計できるかもしれないということはあるのです。
ただ、回答をされていないので、存続しているのか、実はもう廃業してしまっているのかもわからないという問題もあるので、ここをどう判断するか。そのあたりをちょっと考えていくというのが1つの方向かなと。
○今野座長
ただ、前回問題になったのは、共通系列で持っているデータはオールジャパンの状況を知るためにサンプリングされたデータなので、オールジャパンの既存店を探るためにサンプリングをしたデータではないので、そうすると、オールジャパンの既存店の母集団に戻すときにどうやって戻すのだと。母集団がわかっていないではないかと。ここは何か工夫しないと戻せない。片方で、前回問題になったのは、単純にオールジャパンに戻す方式の戻し方をしているのですけれども、それは考えてみればどういう意味かということがあって、こういう形で補正しようかということなのです。
いずれにしても、既存店のデータは、私も有効かなと思いますけれども、そのときに、戻し方をどうするかということについては検討が必要だろうということが、何回も同じ議論がありましたが、この検討会の合意ではないかと。もう一つは、そう簡単にはいかないぞと。いろいろ工夫をしなければいけない。前回は、稲葉さんと樋田さんが提案したやり方がちょっと違っていたとか、そのような段階かなと思います。
○神林構成員
確認なのですけれども、そもそも1年間の継続事業所に関する母集団は、今の日本にはないですね。それはビジネスフレームを使えばわかるのですか。
○今野座長
ないのではないですか。我々はないということで前回は議論していたので、ないと思う。
○瀧原統計管理官
今の経済センサスのデータですけれども、その事業所の設立時期はわかりますね。例えばここ1年でできた企業か否かというのは、何らかの形ではあり得るのかなということですが、すみません、そこはちょっとデータをちゃんと見ているわけではないので。
○今野座長
いずれにしてもあれだね。経済センサスしかデータがないのだから、それは5年に1回しか更新しないわけだから、ある時点、5年後、母集団としては持っているわけで、どうするかな。5年間。
○神林構成員
開設時期はわかるはずなので、後ろから見たときにいつできたのかはわかるのですけれども、いついなくなったのかは、経済センサス上はわからないのですね。結果として5年後にいなくなっていますということはわかるのですけれども、そこを例えばひゅっと線を引っ張って、こんな感じでなくなっていますみたいなことをやって、その継続事業所に関するマップをつくって、それで復元倍率を再計算して合わせるというのはできそうです。
○山田構成員
経済センサスは全数があるので、その間を補助系列として今、使っている雇用保険の統計を使いながら、何かうまくつなげるようなことをやるのかなというイメージですね。
○神林構成員
それは本質的にベンチマーク改定をやっているのと同じなので、統計委員会がやってはだめと言っているのですね。過去にさかのぼって。
○山田構成員
いえ、毎年枚数の出入りを正確に、本当は全数調査をしたいわけですけれども、そこはわからないので、ただ、2点だけはわかっている。そこの動きを線形というのはあまりにもひどいものだから、出入りを何かで知りたい。そうすると、とれるというのは雇用保険の統計なので、そのデータと何かわかりませんが、動きをうまく戻していくということなので、統計委員会で言っていることとちょっと違うのではないかと思うのです。
○神林構成員
そうすると、例えばt年に経済センサスがやられて、t+5年のときに母集団が分かれます。そのときに、初めてtからt+5の間にどれだけの事業所が出入りしたのかということができて、これをベースにして復元をすることができるわけですね。そうすると、t年にデータはあるのだけれども、t+1年までの賃金変化率をつくって、共通事業所で復元しようとすると、t+5年まで待たないと、tからt+1年までの賃金変化率は復元できないということになりますね。
それを見切り発車でとりあえずやっておいて、t+5年に至ったときにウェイトを修正しましょうということができないので、5年ごとに賃金変化率を出しますということであれば、ロジカルには問題ないのかもしれないのですけれども、毎月勤労統計はそういう性質を持った統計ではありませんから、月次でちゃんと出すということに関して、ちょっと矛盾してしまうかもしれませんね。
○山田構成員
だから、かなり推計の推計が、想定の想定が入ってくるということですね。もともと統計委員会が言っているのとはやはりずれてきて、むしろこういうものとして新しい、神林先生が以前おっしゃっていたところで言うと、既存事業所と、新規と、廃業の動きを見ること自体は意味があるから、今回、これを機会にちょっとこういうものを考えていくという意味で、それをして加工度は高いのだけれども出してみるという意味づけですね。
○神林構成員
全国的に見たときに、どれぐらいそれが差があるのかということは、全国の日本の労働市場に対してどれだけ貢献をしているのかということはわからないけれども、集団として継続事業所と新規の事業所と廃業事業所を見たときに、平均的にこれぐらい差がありますよということをこのβで示すことができる。それが全体の中でどれだけシェアを持っているかということはいまいちよくわからないのですけれども、これだけずれているのですよという情報は出すことができるだろうし、この方法を使えばパンクチュアルに、1年後に情報を出すことができるだろうと思っています。
○今野座長
では、やってもらおう。
また結果を見て、それはできが悪いとか、いいではないかとみんなで議論して、よくしていけばいいと思いますので、その方向で一つ。
○神林構成員
とりあえずはこの方向でお願いします。
○今野座長
何かありますか。
○樋田構成員
今のことと直接関係するわけではないのですが、今後の検討対象として、何度か議論に出ているのですけれども、賃金の変化率の計算方法をあげたいと思います。賃金の変化率を計算する方法は大きく2通りあって、平均値の比を計算するか、それとも、比の平均を計算するかです。これは平均する対象が同質であれば、どちらで計算しても同じような値になるはずなのですけれども、平均する対象の中の異質性が高いときには、どちらで計算するかによって数字が変わってくることがあります。
これまでのところは平均の比に注目してきましたが、増加率を正確に推定する方法として、どちらがいいのかということも検討していく必要があるかなと思います。
以上です。
○今野座長
これもモデルをちょこちょこと変えて、今の。
○神林構成員
今、樋田さんがおっしゃったことは、このモデルが正しいのであれば、両者一緒ということになると思います。このモデルが正しいのであれば、変化率の平均と平均の変化率は等しくなるけれども、恐らくここでいわゆる固定効果みたいなものが入っているということになって、さらに固定効果自体をキャプチャーするときに、正確にキャプチャーできているのであれば、偏微分を差し引いたときにここは消えるはずなのですが、クロスセクションで推定をすると、ここの平均値とここの平均値はずれてくるので、平均の差と差の平均が変わってくるということがここの項ですね。ここの項がどれぐらい重みを持っているのかということは、この推計をするときに、先ほどのここに入ってこない変数がどれぐらい重要なのかということと関係してきていて、それはやってみないとわからないかなというふうに思います。
多分、直感として、このずれ、例えばサンプリングの方式を変えたり、あるいはベンチマークの更新をしたりしたときに、この分布が同じ事業所なのだけれども、t時点で定義したときの事業所の平均値と、t+1時点で定義したときのその事業所の平均値が、本来だったら一緒になるはずなのだけれども、実は違ってきてしまいますという話があるので、統計委員会のほうは、共通事業所だと偏微分を引いて変化率の平均値を出せというふうに言おうとしているのではないかと思います。
少なくとも共通事業所にしたときには、t時点で平均をとったときの固定効果と、t+1時点で平均をとったときの固定効果は、平均的には一緒になるということが統計委員会の解釈だと思うのです。全体で平均をとってしまうと、この分布がサンプリングの話とか、あとは復元の話でずれてきてしまうので、全体の平均の変化率はバイアスがかかります。変化率の平均のほうはバイアスがかからないのだけれども、実はそれは、自分もそこは統計委員会が本当に何を言っているのかよくわからないのですが、共通事業所にして、共通事業所の平均値の変化率をとれというふうに彼らは言っているのだと思うのです。本来の趣旨であれば、共通事業所であれば変化率の平均値はとれるはずなので、変化率の平均値をとれと言っているのではないかと自分は勝手に解釈しているのですが、そうだとすると、多分、ここの影響を削除することができるので、そちらのほうが正確になるだろうと。
ただ、これは冒頭に自分が言った繰り返しになりますけれども、それは確かに考えることができて、推計をすることはできるのですが、それを全体に戻すときに、全く賃金変化率に関する母集団がないので、どうやって戻したらいいかさっぱりわかりませんという問題がすぐに横たわっていることがわかるので、自分の意見としては、あくまでも平均値の変化率を求めるという方向で、この統計は議論を構築したほうが、正確な統計を生み出すことができるのだろうなということが直感です。
ここは多分、意見が分かれるところかもしれません。
○今野座長
そういうことで、わかりますか。
○樋田構成員
おっしゃることはわかります。このモデルの推計がうまくいくのかということがまずは大事だと思います。私が言いたかったのは、その上での話なのです。これがうまくいけば確かに理論的にはどちらをとっても同じことになるのかと思います。ですが、そうならなかった場合には、どのような集計がベターなのかという問題が出てくると思いますので、今後の検討課題に入れておいてもいいのではないかという意見です。
○今野座長
それでは、そろそろ時間ですから、これを有力な作業として、瀧原さんと神林さん、神林さんだけですか。他の人はやらないのだね。
○瀧原統計管理官
他の構成員の方々もぜひ。
○今野座長
では、野口さん。
ちょっと作業をしていただいて、今度はその結果を見ながら段階的に進めていくということにさせていただければと思います。
それでは、今日はそのほかにありますか。
○瀧原統計管理官
議題としては特にございませんので、今日の議題(1)のほうでおまとめいただきました、座長一任という部分もありますけれども、中間的整理(案)につきましては速やかに座長のもとでまとめさせていただいて、ホームページ掲載等の各方面への周知をやっていきたいと考えております。
また、今、御議論いただきました、さらに検討するべき課題に向けての検討については、必要な作業、今回の分析、このような部分を進めていただきたいと思いますので、その分、今、神林先生に中心的に言っていただいていますけれども、ぜひ他の構成員の方々も御意見とか、場合によってはお知恵、作業も参加いただければもちろんありがたいと思いますし、その辺は御相談させていただきたいと思いますので、そういう形で今後も引き続き検討会のほうを進めていきたいと思いますので、よろしくお願いいたします。
○今野座長
個票はもう使えるようにしてあるわけですか。
○瀧原統計管理官
今、その準備をしております。
○今野座長
使えなければしようがないのでね。
○瀧原統計管理官
もちろんそれが大事ですので、そこは速やかに分析できる材料を用意して、作業を進めたいと思っています。
○今野座長
わかりました。
それでは、今日は終わります。戻します。
○細井統計企画調整官
本日も長時間にわたり御審議をいただきまして、まことにありがとうございます。
次回の開催につきましては、調整の上、改めて御案内をいたしますので、よろしくお願いいたします。
それでは、これをもちまして、第7回の検討会を閉会させていただきます。本日は、お忙しい中を御出席いただき、ありがとうございました。
(了)
照会先
政策統括官付参事官付雇用・賃金福祉統計室 政策統括官付参事官付統計企画調整室
電話:03-5253-1111(内線7609,7610) 03-5253-1111(内線7373)