ホーム> 政策について> 審議会・研究会等> 職業安定局が実施する検討会等> 雇用政策研究会> 第4回雇用政策研究会(議事録)(2018年7月20日)

 
 

2018年7月20日 第4回雇用政策研究会(議事録)

職業安定局雇用政策課

○日時

平成30年7月20日(金)10:00~12:00

 

○場所

厚生労働省議室

○出席者

委員

樋口座長、大竹委員、神吉委員、黒田委員、佐藤委員、清家委員、鶴委員、堀委員、宮本委員、山本委員
 
小川職業安定局長、小林大臣官房審議官(職業安定担当)、田中職業安定局総務課長、田中職業安定局雇用開発部雇用政策企画課長、松下労働基準局総務課政策企画官、岸本雇用環境・均等局総務課長、志村人材開発統括官参事官(人材開発総務担当参事官室長併任)、大竹政策統括官付労働政策担当参事官室企画官、弓職業安定局雇用政策課長、西川職業安定局雇用政策課長補佐

○議題

(1)自動化(AI・IoT等)が雇用に与える影響・有識者ヒアリング(東京大学 松尾特任准教授)
(2)職種別賃金・労働時間分布について
(3)労働力需給推計について(非公開)
 

○議事

                                
 

○職業安定局雇用政策課長補佐 皆さん、おはようございます。ただいまから第4回雇用政策研究会を始めさせていただきたいと思います。委員の皆様におかれましては、お暑い中、また、お忙しい中お集まりいただきまして、ありがとうございます。本日は、阿部委員、荒木委員、神林委員、黒澤委員、玄田委員は御欠席です。

 また、本日は有識者として、東京大学大学院工学系研究科の松尾豊特任准教授にお越しいただいております。松尾先生は、人工知能・ウェブ工学・ビッグデータ等について研究されており、内閣官房の「第4次産業革命人材育成推進会議」や、厚生労働省の「保険医療分野におけるAI活用推進懇談会」など数多く政府の会議において委員をお務めいただいております。なお、松尾先生ですが、1130分頃に御退席の予定です。

 資料の確認をさせていただきます。本日の資料ですが、資料1として委員名簿、資料2として研究会のスケジュール、資料3として松尾先生のプレゼン資料「AIの発達により我々の生活・産業がどのように変わるのか」、資料4として「職種別の賃金・労働時間分布について」、資料5として「労働力需給推計について」、最後に資料6は議事の公開についてとなっております。御確認をお願いいたします。それでは、カメラ撮影の報道関係者の方は、ここで御退席をお願いいたします。

 それでは、議事に入ります。今後の議事進行は、樋口座長にお願いいたします。

○樋口座長 それでは、よろしくお願いいたします。本日は1番目として、自動化(AIIoT)が雇用に与える影響、2番目が職種別の賃金・労働時間分布、3番目が労働力需給推計の3つについて取り上げたいと思っております。なお、3番目の労働力需給推計については、議事の公開の基準にのっとり非公開とさせていただきたいと考えております。また、労働力需給推計に関する資料5については、研究会終了後に回収させていただきます。よろしくお願いいたします。

 それでは早速、1つ目の議題である、自動化(AIIoT)が雇用に与える影響に関して、松尾先生から御説明いただき、続けて自由議論をしていきたいと考えております。よろしくお願いいたします。

○東京大学松尾特任准教授 よろしくお願いします。最初30分ぐらいでお話させていただきたいと思います。AIの発達による我々の生活、産業がどのように変わるのかということで、お手元に資料があると思いますが、一部、動画でお見せしたい部分がありますので、そのときだけ画面を見ていただければと思います。

 私自身の自己紹介です。人工知能の研究をずっとやっておりまして、日本に人工知能学会がありますけれども、そこで編集委員長22年ほど、倫理委員長を4年ほどやらせていただいて、この6月にまた次の方に引き継ぎまして、昨年は「日本ディープラーニング協会」というのを立ち上げました。特にディープラーニングの産業活用を進めていこうということをやっています。

 3ページ、アルファ碁のことですが、御存じのとおり、Google DeepMindの開発したアルファ碁がイ・セドル九段を破ったというのが一昨年ありました。昨年はカ・ケツ九段に3連勝して破ったと、技術的にはもう人間よりもはるかに強いところまでいっています。昨年10月には「アルファ碁ゼロ」というのが出まして、従来のアルファ碁は、プロ棋士の棋譜データをベースに学習し、ある程度のところまで強くなっておいて、その後、自己対局で更に強くなるとやっていたのですけれども、プロ棋士のデータを一切使わないアルファ碁ゼロというのが現れまして、最初から自己対局だけで強くなるのです。そうすると、囲碁だけではなくて、チェスや将棋、いろいろなゲームに同じアルゴリズムで適応することができるということになりますので、そういう技術が「アルファゼロ」と呼ばれまして、これは昨年12月に出ました。これはゼロの状態、何も学習されていない状態から初めて、僅か2時間の学習で、将棋の場合であれば名人以上のレベルに達してしまうというようなものです。従来の常識を大きく上回るような技術が開発されています。これの中心にあるのがディープラーニングだということです。

 5ページです。今、人工知能という言葉が非常によく言われていますけれども、私は大きく分けてこの3つぐらいに分けられると思っています。1つは、従来のITを言い換えているだけというケースがかなり多いです。これは決して悪いことではないのですけれども、ITが重要だというのは何十年も前からそうですので、それを言い換えているというのが1番の話です。2番目が、データを使って学習するビッグデータを活用しましょうという話で、これも重要なのですが、これも10年前、20年前から重要な話で、特にインターネットの領域などはこういった考え方によって大きく進展しましたから、今更言ってもしょうがないという部分もあります。3番目が、今日お話するようなディープラーニングの話で、ここは非常に大きなイノベーションが、ここ数年で起こっている分野ですし、特に日本の持っている技術あるいは日本の社会問題、こういうのと併せて考えることで、日本にとって非常にチャンスになるかもしれない、そういう技術ではないかと思っております。

 6ページ、ディープラーニングとはということで、結局いろいろな説明の仕方をしましたけれども、やはり技術的な詳細を少し説明したほうが多くの方には分かってもらえるなというように思っておりまして、今日も数式を使った説明をしようと思います。この1文を理解していただくと、今日のディープラーニングとは何かという目的のところは達したかなと思っているのですが、少し読みますと、「入力を出力に写像するために、簡単な関数の組合せで表現力の高い関数(「深い関数」)を作り、そのパラメータをデータから推定する方法」であると。これは、ちょっと何を言っているのか分からないかもしれませんが、この中身について、後ほど説明していきたいと思います。

 7ページ、ディープラーニングで何ができるかというと、おおざっぱに言って、認識、運動の習熟、言葉の意味理解というのが順番にできるようになってくるという技術です。認識は従来から人間にとっては簡単なのだけれども、コンピューターにとっては非常に難しいタスクだったわけですが、その状況が、今、大きく変わってきているのです。

 10ページです。画像認識のエラー率というのが、ここ数年で急速に低下しています。ディープラーニング以前はある画像を見せたときに、これが猫か犬か家かヨットかというようなことを判定する精度、エラー率が25%、26%ぐらいありましたから、100枚あると2627枚ぐらい間違ってしまう状況だったのですが、ディープラーニングが2012年に出てきて、エラー率というのが10%近く下がったのです。その後、順調に下がっていまして、今、2017年の末時点で2.3%まで下がっています。

 画像認識という技術は昔からあるのですが、従来の画像認識と今の画像認識は全く違います。従来の画像認識は、人間の精度にどうやっても太刀打ちできないようなレベルだったのですが、今の画像認識は人間が太刀打ちできないレベルになっている。この表で言うと、Humanと書いてありますが、人間の精度なのですけれども、これを大きく上回っているわけです。ですから、囲碁、アルファ碁がちょっと前までは人間のチャンピオンに全然勝てなかったものが、今、人間のチャンピオンがどうやっても勝てない、こういうのと同じような変化がこの画像認識の分野で、ここ5年ぐらいの間に急激に起こっているということです。こういう技術を使うと、映像の中に何が映っているかというのを四角で囲んでその中にパーソンとか、チェア、セルフォンといったものが出ていますが、これは物体検出、Objet Detectionと言われる技術です。これが「YOLO v2」というモデルですが、47FPS、1秒間に47回こういうのがディテクトできるということで、この生の映像のデータをこのように読み取っていくことができます。更にすごいのが、YOLO v2というのを検索していただくと、すぐに見付かるのです。インターネット上のGitHubという所にプログラムが置いてありまして、これを使おうと思ったら誰でも使えるぐらいのものなのです。これは5年前にはどのような最先端の技術を持っている企業も、こういうことができなかったのですが、今は誰でも使えるようなところまで一気に技術が普及しているということになります。

 今、お見せしたのは画像認識ですが、これと今度はロボットの技術を組み合わせると、ロボットが上手に動けるようになってくるという事例もたくさん出てきています。これは2015年ぐらいからUCBerkeleyを中心にいろいろな所で研究されていますけれども、こういうロボットが、今おもちゃの飛行機の部品を本体に組み付けていて、試行錯誤しています。最初は下手ですが、やっているうちにだんだん上達してくるということが起こります。ロボットの目の所にカメラがありまして、画像認識しながら上手に入れようとしているわけです。これは強化学習と言われる技術なのですが、画像認識ができることによって、このように見ながら上手に作業するということができるようになってきたと、このようにうまくはめ込むことができるのです。従来のロボットのようにカクカクと精密に動くというよりは、うまく見ながら上手に合わせるというような動きが学習されているということが分かります。いろいろな動作ができるようになりますが、例えばこのように入れるとか、靴べらを入れるとか蓋を閉めるとか、いろいろな動作ができるようになります。他にもハンガーを掛けるとか、それから子供が遊ぶようなおもちゃの物にブロックをうまくはめ込むとか、こういうことも従来画像認識の精度が低いときには決してできなかったものですが、これが今はどんどんできるようになってきている状況です。

 プレゼンに戻ります。もう1つ重要なのは翻訳のところですけれども、Google翻訳がディープラーニング方式に変わったというのが2016年にありましたけれども、それによって翻訳の精度が非常に大きく向上しました。この棒グラフがありますが、一番左がEnglish to Spanish、英語からスペイン語への翻訳の精度、ここはスコアが高いほうが良いのです。下側の青いラインはphrase-basedと書いてありますが、従来のGoogle翻訳の方式のスコアです。これが緑のラインにいくと、これはニューラルネットワーク、ディープラーニング方式のGoogle翻訳の精度、一番上のオレンジのラインが人間の翻訳の精度ということで、かなり人間に肉薄するところまできている。英語からスペイン語だとそうなのですが、英語から中国語とか、逆に中国語から英語などを見ると、やはり精度は、まだまだ低かったのですが、次の17ページに移ります。

 それから2年たって、2018年3月には、Microsoftが、中国語から英語への機械翻訳の精度は人間と同じレベルに達したという発表をしました。ですから、翻訳のところは人間と同程度、遜色ないレベルまで今の段階でもきているということになります。

 他にもいろいろディープラーニングを使った面白い技術があります。また画面を見ていただくと、これはNVIDIAがやっている「Super SloMo」というものですが、これを見ていただくと、上側がカクカク動いていますけれども、この上側が実写です。下側の滑らかに動いているのが、その間を補完するように画像を生成しているという技術です。これも左側が実写で、右側が途中のフレームを生成しているという技術で、何でこのようなことができるのか不思議に思うかもしれませんが、この画像を生成する技術というのがディープラーニング、画像認識を逆にすることによってできるのですが、そうすると、このようにフレーム間があるようなものも、うまく生成することができるとか、それから、もう1つお見せしますと、これは自動運転の車で、この画像から上のような、ここが道で、ここが車でというようなセグメンテーションというのをやるのはできるのですが、今度は逆にセグメンテーションから実写の画像を作るという技術もあって、これは今、下にある道路の模様をいろいろ変えていまして、こういう道路にするとかをいろいろ変えています。例えば車の数を減らしたり増やしたり、上側で操作すると、それをうまく合わせるように下側の絵を生成するというふうになっていまして、ですから、ある街並みの緑を増やそうとか、家を増やそうとか、いろいろなことをあっという間に作り出すことができる。実はこれを使うとフェイク画像みたいなのも幾らでも作れるようになります。例えばインターネット上によくあるのは、オバマ元大統領が変なことをしゃべっているような動画を作り出したとか、あるハリウッド女優の方が変なことを言っているのを作り出したとか、いろいろなことができるようになって、実写か、そうではないのかというのが、すごく見分けがつかないようなことも起こっているということで、英語圏などでは、コントラバーシャルな技術になっています。こういうことがいろいろできるのですが、では、これは何でできるのかというのを、もう少し説明します。

 私は、ディープラーニングを維持するというのは、実は経済学の方などは非常に相性が良いと思っていまして、ちゃんと説明すると、一瞬で理解いただけることが多くて、経済学とディープラーニングの翻訳集、用語の翻訳集などを作ったらいいのではないかと思っているぐらいなので、その中身を説明していきます。

 ディープラーニングのような技術が一番多くの方が持っている概念で説明しますと、最小二乗法というのが私は一番近いと思っています。「最小二乗法」というのは何かというと、例えば、ある日の売上げのデータがあって、その日の気温と飲料の売上げのようなデータがあったときに、その2つの項目を散布図に書くのです。そうすると、ある日に温度が何度で、売上げがこのぐらいだったという散布図が描けます。ここにエクセルなどでよくありますけれども、近似直線の追加とやると線が引けます。この線を引くアルゴリズムが最小二乗法です。これをどのようにやるかというと、線ですので、yabxと置きます。これはある種の推定値を表していることになりますから、この推定した値が実際の値とどれだけずれているか。つまり、この各点々が、この線からどれだけ離れているかというのを引き算して、プラスとマイナスがありますから二乗して、全部のサンプルに足し合わせると、これは「二乗和」というわけですが、この二乗和を最小にするようにabのパラメータを決めてやると、この点々の上に一番よく乗るような線が引けるというのが最小二乗法です。

 今、xを1変数としましたけれども、xを2変数にします。すると次ページですが、この絵は三次元空間になって、面を見付けることになるのですが、でも、やることは一緒で、yabx1cx2と、2変数で勤似し、それが実際の値とどれだけずれているかという二乗和を取って、二乗和を最小にするようにaとかbとかcのパラメータを決めてやるということです。今、2変数にしましたが、今度は10000変数にします。10000変数にすると何が起こるかというと、やはり同じで、この絵の所はよく見えないのですけれども、やることはyx1からx10000の1万個の変数を使って近似し、それが実際の値とどれだけずれているかと二乗和を取って、この二乗和を最小にするように、k0k10000までのパラメータを決めてやればいいということです。ところが、10000変数の問題、今御説明したのは、よく使われる重回帰分析みたいな話、説明変数を使って非説明変数を説明するようなモデルを作るということなのですが、通常、一般にマーケティングなどで使われる変数の数というのは、10個から多くても数十個ぐらいなわけです。10000変数なんてないわけですが、では、世の中に10000変数の問題はあるのかというと、これは、実はありまして、100×100の画像に猫が映っているかどうかを判定する問題というのは、正にこれに当たります。つまり、100×100の画像というのは、1万個の値、画素の値が入ってくるわけです。そのときに猫だったら「1」、そうではなかったら「0」を出力するような関数を見付けてくださいという問題ですから、実は、これは最小二乗法で解けるのです。つまり、猫関数というのがあったとすると、猫関数はx1からx10000までの1万個の変数を使った関数ですと。このパラメータはある画像が猫でした、ある画像が猫ではないというデータがたくさんあったら、この誤差を最小にするように決めてやればパラメータは見付かるのです。一旦パラメータが決まれば、新しい画像が入ってきたときに、これは猫です、これは猫ではないというような値を計算できるようになるというのが、要するにディープラーニングがやっていることです。ですから、ディープラーニングというのは、実は最小二乗法を超巨大にしたものと、数万から数億変数あるような最小二乗法だと理解することができます。

 今の説明で大体合っているのですが、1か所だけ嘘を言っておりまして、1か所嘘を言っているのは、今お話したのは重回帰分析の話なのです。線形の関数を仮定しているのです。そうではなくて、ディープラーニングはディープなのです。深いのです。深いというところだけが違う。

 では、深いということはどういうことかというと、25ページです。猫関数を深くすると書いていますが、今までの話だとx1x10000から直接猫関数を定義していたわけです。そうではなくて、x1x2x10000から一旦f1f2f100みたいなそういう中間的な関数を定義し、この中間的な関数を使って、最終的には猫関数を定義するということをやると1段かませていることになるので、これは2層にしたということになります。このように2層、3層、4層と中間的な関数を増やせば増やすほど、層の数が大きくなるということです。これを図で書きますと、x1x2x10000から猫関数が定義されるというのがありますが、これを中間的な関数f1f2f100を定義して、これによって猫関数を定義するとやっているわけです。ディープラーニングだとこういう図が出てきますが、これは何かというと、画像の画素の値が下から入ってきます。x1x2x10000と入ってきます。これに何個か中間的な関数をかませて、最終的にはfとかffのようなものを定義していますと。ただ、パラメータをどうやって求めているかというと、最小二乗法で求めているということなのです。

 次の質問は、なぜ深いほうが良いのかということですが、これは深いほうが良い理由というのは幾つかありまして、1つは、やや哲学的になりますけれども、我々の住んでいる世界が、なぜか階層的だからということなのです。ですから、関数も階層的なほうが良いという理由が1つです。もう1つは、表現力とパラメータのトレードオフというのがありまして、一次関数から二次関数、三次関数、四次関数としていくと、曲線としてはグニャグニャ動けるわけなので、表現力は上がるのですが、パラメータの数が増えるのです。パラメータの数が増えると、通常、データの数を増やさないといけなくなる。ディープラーニングの場合、パラメータが1億とか数億とか非常に多いですから、普通にやると、このデータの数がすごく必要になるのですが、パラメータの数をできるだけ節約しつつ、表現力をできるだけ高めようということを考えると、一番良い方法が簡単な関数を組み合わせて複雑な関数を作ると、表現力の高い関数を作るというアプローチが一番パラメータを節約できることが分かっていますので、そのように階層を重ねたいと、深いネットワークを作り、そのパラメータを最小二乗法で見付けるということを何十年もの間、研究者たちはやりたかったのですが、できなかったのです。

 できなかった理由は、今となって考えると、数万とか、数億変数あるような最小二乗法ですから、コンピューターの処理能力が足りなかった。それからデータが足りなかった。この2点の問題によってできなかったのが、今ようやくできるようになってきたということなのです。

 ディープラーニングの場合、例えば、画像に適した関数の作り方とか、時系列のデータに適したこの関数の作り方というのがいろいろ研究されていまして、画像認識の場合は、この全部の結合をつなぐのではなくて、一部の結合を省いていいとかと、ここの重み、ここの重みを同じに、パラメータを同じものを使っていいとか、そういうことをすることによって、よりデータの数を少なく現実的にうまくいくようなモデルというのがいろいろな形で提案されています。CNNRNN、深層生成モデル、深層強化学習、こういった辺りが有名ですが、結局、これをやっていることは実は全部同じでして、最小二乗法なので、全部xyの関係なのです。xに何を置いて、yに何を置くかというだけの話で、xに画像を置いて、yにクラス、つまり、それに猫や犬とかを置くと画像認識になりますし、xに画像を入れて、yにバウンディングボックス、つまり、この四角の座標と、そのクラスというのを入れると、先ほど動画でお見せしたような物体検出になるわけです。xに英語の文を入れて、yに日本語の文を入れて学習させると、これは翻訳になりますし、xに今ある囲碁の盤面の状態、yにそのとき打つべき手を入れるとアルファ碁になるわけです。xに、例えばあるフレームと、あるフレーム、yにそのフレーム間の画像を入れると、このフレームを補完するようなモデルになるということで、実はxに何を置くか、yに何を置くかという工夫次第で何でもできるという、そういう技術になります。

 結局、やっていることは全部一緒で、最初に御説明した難しそうな文をもう1回読みますと、入力を出力に写像するために、簡単な関数の組合せで表現力の高い関数を作り、そのパラメータをデータから推定する方法ということです。ですので、xyを決めて、そのxyをつなぐような回路を決めて、最小二乗法のような損失関数を決めて、この損失関数を最小にするようにパラメータをデータを使って学習するということをやっているだけです。私は、原理は非常に簡単だと思っていますし、簡単であるがゆえに、私はこの時代観で言うと、数十年に一度の技術だと。インターネットとか、トランジスタ、エンジン、電気に匹敵するような技術なのではないか。正にトランジスタが信号を増幅するということしかできなかったのが、それが集積してIC,LSI,VLSIになり、それによって、電卓ができ、ラジオができ、パソコンができ、携帯、スマホができたことと同じような変化が起こってくるのではないかと思っています。

 従来、私は、何でディープラーニングをこれだけ強調するかというと、従来の技術、machine learningは関数が浅いのです。ディープラーニングは、この名前のとおりディープなのです。ディープというところは、かなり本質的に重要で、それによって表現力がすごく上がりますので、データをたくさん集めればいろいろなものが学習できるというのが、正にディープラーニングによって、ようやく稼動になってきたということです。

 最初に3つの分類をお話しましたけれども、1、2、3というのを、そういう観点で振り返ると、1の話は、基本的にプログラムをすることで、データから学習するようなものではないということです。2は、データから学習するのだけれども、浅い関数を使っているということ。3は、深い関数、表現力の非常に高い関数を使っているといった違いがあります。

 今、お話したようなことを、もう少し一般向けに簡単に言うと、私はいつも眼の誕生ということを言っているのですが、これは画像認識の精度が大きく向上したと。深い関数を使うといろいろなことができるのですが、やはり典型的に分かりやすいのが、この画像認識の精度が上がったということで、このカンブリア爆発がなぜ起こったかということを書いたアンドリュー・パーカーの本がありまして、これは眼が誕生したからだと。それまでの生物というのは高度な眼が無かったので、のろのろ動いて、ぶつかると食べるという、非常に緩慢な動きしかできなかったものが、眼を持つことによって、見つかったから早く逃げようとか、見つからないように擬態しようとか、いろいろな戦略ができた。生物の戦略が眼によって多様化したのだという説ですけれども、これと同じようなことが私はこれから機械とか、ロボットの世界では起こると。つまり、今までの機械やロボットは画像認識はできなかった。深い関数を作れなかったために眼が見えていなかったわけです。それが見えるようになるということで、従来できなかったタスクというのが大幅にできるようになるのではないかと。

 34ページを見ていただくと、その典型例が、私は農業とか建設、食だと思っていまして、特に労働集約的な産業ほど、なぜ人がやる必要があるのかというのを改めて考えてみると、ほとんどの場合、それは眼に原因があるのです。農業で例えば、トマト収穫ロボットはないわけです。トマトはマーケットも大きいですし、収穫にコストは非常に掛かるわけですが、トマト収穫ロボットはない。これは、なぜないのかというと、理由は簡単で、トマトがどこにあるのか見えなかったのです。ところが今、画像認識の精度がすごく上がってトマトが見えるようになったので、あとはハードウェアを作れば、トマト収穫ロボットはできるような状況にきていると思います。農業が何で人手不足で困るか、後継者不足で困るかというと、ほぼ全ての産業に眼を必要としている。同じことが建設や食などにも言えて、建設現場も人がたくさんいますし、食、食品加工、それから外食産業、これも非常に労働集約的です。これはなぜなのかというと、結局、人が眼で見ながら肉を2つに切ったり、お弁当に何か詰めることをやらなければいけないので自動化できなかったわけです。それが変わってくる。そう考えると、農業とか建設、食のような労働集約的な産業が、これからAIによってどんどん自動化していくことを、世界中で見ると非常に巨大な変化ですし、そこに日本がいち早く取り組んで自動化し、その技術を世界中に展開することができれば、私は非常に大きな産業競争力になっていくのではないかと思っています。

 3637ページ辺りを見ていただくと、結局、起こる変化というのは画像認識に注目すると、「認識」が人間から切り離されて社会の必要なところに再配置されるという変化が起こっていくと。それによっていろいろな産業、介護、医療、警備、顔認証とか、安全保障、こういったいろいろな領域で変化が起こると思います。例えば、家の中で片付けロボットは今はないのですが、片付けロボットがなぜないかというと、理由は簡単です。毎回散らかり方が違いますから、物を見て認識し、それを持って元の場所に戻すということができないと、片付けはできないわけです。だから、ディープラーニングがなかった頃はできなかったわけですが、今のディープラーニングの技術を使えば、認識し、持つというのが先ほどお見せしたようなデモでもできますから、そうすると、片付けロボットは頑張れば作れるような状況にきていると思います。

 考えてみれば、家事労働ですが、実は今ある家電というのは、全て認識能力を持っていなくて、冷蔵庫、洗濯機、炊飯器、エアコン、これは全部認識能力はないのです。温めたり、冷やしたり、ぐるぐる回したりするだけなのです。逆に言うと、今残っている家事労働というのは、ほぼ全て認識能力を必要として、それが調理だったり、片付けだったり、ゴミを出す、洗濯物をたたむ、買物に行くとか、これは全部認識能力を必要としているのです。ですから今後、認識能力を持った家電群というのがもう一回たくさん出てくると。これは非常に大きなマーケットになると思いますし、例えば、いろいろな方が社会で活躍するために家事の部分を自動化するというのは、実はすごく大きな技術になるのではないかと思っています。

 38ページ、そういう意味で、本当にインターネットとかトランジスタに匹敵するような数十年に一度の大きな変化だと思いますが、もちろん海外はそれにいち早く気付いていて、どんどんやっています。一番早いのは医療画像で、厚労省の中でもそういった議論をさせていただきましたけれども、Deep Mindとか、EnliticGE、アルタリス、いろいろな所が眼底検査、レントゲン、CT、それから病理診断、内視鏡といったものに取り組んでいます。米国のFDAは、2017年1月にアルタリスの製品を第1号として承認しました。今年4月には、idxという糖尿病性網膜症をディープラーニングで診断するということを、これは医者がその場にいなくてもいいというものを承認しました。そういう意味では、医療画像の世界もどんどん進んでいっているという状況です。顔認証も従来、日本企業は強かったのですが、今、中国が非常に技術力を伸ばしていまして、SensetimeとかAffectivaという所が、中国国内に1億7,000万台のCCDVカメラがあるのですが、これを順次ディープラーニングを入れていっていると。そうすると、誰がどこで何をしたかというのを瞬時に検索することができるということで、要するに、国民を監視するような仕組みというのがどんどん中国の中で取り入れられていっているということです。

 日本でも幾つか動きがありまして、39ページから何ページかありますが、こういうことをどんどんやっていくべきなのです。先ほどトマト収穫ロボットの話をしましたけれども、この画面はヨーロッパの会社ですが、イチゴの収穫ロボットを作っています。このようにイチゴを認識して、うまくもぎ取ることも徐々に実用化されてきています。

 少し時間がなくなってきましたので、最後に人材の話、あとはディスカッションの中でさせていただくとして、雇用の変化について、65ページの所ですが、今お話したような形で、いろいろな産業で私は自動化が進むと思います。特に、一見してAIITと関係ないと思われていたような労働集約的な産業ほど、その変化は大きいのではないかと思っています。日本もうまくすると、そういった社会課題をチャンスに変えていくことができると思います。よく人工知能によって雇用が奪われるのではないかと、職業がどう変わるのかという話をされますが、私はいつも、まずは作る国にならないとどうしようもないと思っていて、自動車は、馬車で移動していたのが自動車に変わったわけですが、日本は自動車立国になったので、それにまつわる産業がたくさんできて、雇用も生まれたわけです。人工知能の場合も自動化が進みますけれども、自動化の技術を作る国になれれば、それに付随する雇用はたくさん発生するし、産業競争力全体も非常に上がっていくと思っています。ですので、作る国になるのか、使うだけの国になるのかというのは、非常に大きな分岐点で、是非、作る国になるべきだと思っています。それから、もちろん人工知能とか、ロボットを使う仕事全般というのは重要になってくると思います。これも実はアルゴリズムのところは最小二乗法なので、分かってしまえばそれほど難しくなくて、あとはノウハウだったり、そういう新しい技術を修得するというところだったり、そういうことをやっていけばいいということで、日本の職人気質みたいなのと非常に合う世界観だと思います。

 もう1つ重要なのは、データを作るというところで、結局、xyの関係ですから、xのデータ、yのデータというのを作らないといけないわけです。医療画像の場合だと、医療画像を入手すること自体はいろいろな病院と提携すればできます。ただ、これにきちんと診断名を付けていくとか、この辺りがこのように気になるみたいなデータを作るのは、お医者さん、医療関係者ではないとできなくて、中国も実は画像を集めるというところと、この画像にタグ付けするというところの両方について、お医者さんの集団を作ってその人に頑張ってもらうということをやっています。これはトマト収穫ロボットだったら、トマトのタグ付けするのは熟練のトマト農家でないとできないわけなので、これは地方に住んでいる熟練の方の知恵を使って、こういうデータ作りをしてもらうということが、私はたくさんあるはずだと思っていまして、日本の熟練の技をデータに直していく仕事というのは非常に重要だし、それによって競争力全体が上がりますから、ここのところというのは、私はもうちょっと強調されてもいいのではないかなと思っています。

 それから、マクロに見ますと、対人間のコミュニケーションというのはどんどん高付加価値になっていくと思っていまして、自動化されればされるほど、逆に人がおもてなししてくれるということ自体が、希少性もって付加価値になりますから、安いところはどんどんロボットが接客してくれるのですが、高いところは人が接客するという変化が起こってくるのだろうと思っています。

 最後、68ページ、まとめです。日本全体でいろいろな社会問題がありますが、実は多くの部分というのがディープラーニング、深い関数を使った最小二乗法と、ハードウェアの組合せで解決し得るのではないかと思っています。これを進めていくということがすごく重要だと思いますし、これに向けてハードウェアの技術者と、日本のディープラーニングを使える若者がうまく連携していく、それによって社会課題を解決しながら産業競争力を上げていくということが、すごく重要なのではないかなと考えています。以上になります。どうもありがとうございます。

○樋口座長 非常に説得力のある御説明でありがとうございました。それでは、これからAIIoT等が雇用に与える影響ということについて主に議論していきたいと思いますが、まず何か御質問がありましたらお願いしたいと思いますが、いかがでしょうか。

○清家委員 松尾さん、いつも面白い話をありがとうございます。今日もとても分かりやすくて大変インスパイアされました。2つお聞きしたいのですが、1つは突拍子もない質問かもしれないのですが、以前ヨーロッパのGoogleCTOと話したときに、とても分かりやすい話をしてくれました。それはスイスでの会議だったのですが、ピカソの絵をAIにディープラーニングさせて、そしてそのスイスのホテルから見られる景色を与えると、その景色を完璧にピカソタッチの絵に描くことができますと。これがAIにできることですと。それで誰かが、「では、AIにできないことは何ですか」と聞いたら、それはたった1つ、ピカソになることはAIにはできませんと。つまりピカソはその前にピカソタッチの絵の情報を与えられていないからということでしょう。それは正しいのか、それともやはりディープラーニングをしていくと、ピカソがそのときピカソのタッチを考え付いたときのいろいろな環境要件がありますよね。それを変数にして入れれば、いつかピカソになれるのか、これは少し本質的な質問です。

 もう1つは、最後に言われた所ですが、産業革命のときもそうでしたし、例えばフォードのムービングアッセンブリーラインができたときもそうでしたけど、社会が豊かになったのは、例えばフォードの場合だったら、すごく生産性が上がったので、その分が労働者の賃金を高め、そして労働者が安くなったT型フォードを買えるようになって、また需要が増えといったような。結局、新しい技術による生産性の向上がきちんと人々に分配されれば、むしろそれが朗報になるということなのだろうと思うのです。今回のAIあるいはディープラーニングも、社会がそのような仕組みづくりをちゃんとすればそのようにいくのか、それとももうちょっとディスラプティブな感じになるのか、そこのところについて御意見を伺いたいと思います。

○東京大学松尾特任准教授 ありがとうございます。最初の点ですけれども、清家先生がおっしゃったのは非常に有名な研究、ニューラルスタイルトランスファーという研究で、ピカソの画像をたくさん学習させると、任意の写真などがピカソ風になる。これはどのようなアルゴリズムでやっているかというと、画像認識をするときに、ある写真があったら、それを先ほどのように深い関数を作って、どんどん抽象的な特徴量に直していくのです。最後にこれを猫だとか犬だとか認識するわけですけれども、実はピカソの絵というのは中間的な特徴量感に相関があるのです。

 この中間的な特徴量感の相関を再現するように、この写真があったときに、この写真の中間的な特徴量を修正するということをやると、実はこれはピカソタッチになるということができるのです。ですので、ピカソとかシャガールとかいろいろなものができるのですけれども、全部特徴量感の相関、グラム行列と言っているのですが、特徴量感の相関行列を作って、それを再現するようにやると、それっぽくなるという、それ自体が非常に面白い発見なのです。

 その上でピカソになることはできないというのは正にそのとおりで、なぜかと言うと、そのような特徴量感の相関を持った絵が心地良いのだとかいうことは、これは人間のやはり本能とか感情を持っていないと分からなくて、人間の本能とか感情は非常に複雑な関数をしていて、進化的に作り込まれたものなので、決して私はコンピューターにまねをすることができるようなものではないと思っています。ですから新しい芸術を作り出すということは、私はAIにはできない、ただ、作り出したもののまねをするということはできるということだと思っています。

 2つ目の御質問ですけれども、これもおっしゃるとおりで、私はAIによっていろいろな技術が進んで生産性が向上すると。それをうまく再分配する仕組みさえあれば、私は社会は豊かになると思っています。そのときに一番気を付けないといけないのが、今までの社会の仕組みというか生産に関わる人というのが、たくさんチームを作って組織立って動くということが、生産力、効率を上げるために重要だったわけですけれども、ところがその辺が全部機械、人工知能でできるようになってきますから、そうするとむしろ付加価値を出す所は、先ほど清家先生からあったように、新しい芸術を作り出すとか、新しい事業を作り出すとか、人の気持ちを考えたような商品企画をするだとか、そういうところになっていくと。

 そうすると、私は一部の能力がある人が大きな富を生み出すというような社会の形に変わってくると思うので、国の競争力としては、そういう一部の能力がある人をどうやって周りが支えるかということだと思いますし、社会全体としてはそういう人が生み出した富を逆に多くの人にどうやって分配するかということを、ちゃんと考えていかないといけないのではないかと。そういう意味では、こういう雇用の問題とか税の問題、再分配の問題も含めて、この社会の変化に合ったような形で考えていく必要があるのではないかと思います。以上です。

○樋口座長 そのほかにいかがでしょうか。

○鶴委員 どうも御説明ありがとうございました。お話は非常に分かりやすくて、納得するところばかりだったのですけれども、1つ経済学との関連で、最初の情報、猫関数と非常に分かりやすい説明で、一方、逆に経済学者のほうから見ると、その関数に入れる変数、それに1万個ぐらい入れると、でも通常、経済学で実証分析をやる場合は、それぞれの変数というのが、ある経済理論に基づいた変数というのが当然入ってこなければいけないし、その変数の独立性とかいろいろなことを考えるわけですよね。そうすると、とにかく大量のデータを用いて、そのたくさんの変数を作って、更にその階層を深めてやるということで、先ほど申し上げたようにxからyの写像ということを考えて、非常に当たる予測をやるというところについては、かなり精度が上がっていると。

 でも、一方それは、例えば経済学者の視点から言うと、その手法というのは、よく理論なき計測ということを経済学でも言って、非常にある種、量に基づかなくて、そういう環境を見付けたとしても、それは一体どれぐらい意味があるのか。一方、経済学者というのは常にそういういろいろな理屈を言うのだけれども、「全然予測は当たらないじゃないか」という批判も非常にあるわけです。ある意味、AIのやっていることは、経済学者のやっていることと、ある正反対の対極的なことをやって、ある意味ではこれまで経済学者ができなかったようなことについて、非常に成果を出す、正に今、出してきているというような状況だと思うのです。

 そうしたときに、やはり一番、今の対比で言うと、そういう結果が出ていることに対して、それはどういう理屈でそういう結果が出てきているのか、猫の画像を判断するというところは、そういう理論とかそういうものは必ずしも必要ではないのかもしれないのだけれども、それ以外のものになれば、なぜそこはどういう理論に基づいて、どういう心理に基づいている、どういう理屈に基づいているのか、それは私の理解だと必ずしもAIは教えてくれないというのが状況なのかなと。

 ただ、そういう問題についてもいろいろ限界はあるのだけれども、ではその理屈はどのように考えたらいいのかということについても、いろいろ今、トライが行われているというお話も専門家の方から聞くこともあるのです。その辺、例えばそういう幾つか違った理論について、どれがより正しいのかということを、やや予測するとか、そういう手法なのか、私は必ずしも理解は十分ではないのですが、そういう理屈とか理論とかというところを、ややそこに向けて、AIというのが実際にどれぐらいのことができるのか、できないのか、その辺について、もし今の時点でどういう状況なのかがお分かりであれば教えていただきたいと思います。

○東京大学松尾特任准教授 ありがとうございます。まず経済学で使われているようなモデルと、こういう機械学習、ディープラーニングで使われているようなモデルというのは、考え方としてはほとんど一緒だと思います。一番違うのは、やはりモデルのフィッティングを最大化するのではなくて、予測を最大化するところが違うと思っていまして、それ以外は実は余り変わらない。モデルのフィッティングというのは、要するにやはり議論として説明したいというのが背景にあると思うのですけれども、このディープラーニングのほうはとにかく当てればいいのだというのがありますので、精度を最大化すると。そのためにいろいろな仕組みがあります。例えばドロップアウトという方法があって、これは任意の変数をランダムに50%消してしまう、トレーニング時に消してしまうのです。また別の50%を消す、別の50%を消すというのを何度も繰り返しながら学習させると、非常にドバストなモデルが得られるとか、これはなぜか分からないけれども、やっていたらそういうやり方がうまくいって、後から考えると、それは実はN個の変数を使ったいろいろなバリエーションのモデルをアンサンブルさせていることになっているというような理論が後から見付かるというような、そういう感じの技術の進み方をしています。ですから、まず訳が分からずやってみたらうまくいきましたみたいな報告が出て、それをみんなやり始めて、そのうち理論家が、実はこれはこういうことが起こっているのですという説明を後付けでするというようなことが起こっている領域かなと思います。

 ディープラーニングはよくブラックボックスだと言われます。確かにブラックボックスなのですが、ブラックボックスという意味は、式は出るのです。式は出て計算をどのようにやっているのか分かるのだけれども、この式の意味が分からないということで、重回帰分析でいろいろな係数が出ますが、この係数の数字は分かるのだけれども、この係数がなぜその係数になっているのかというのは、よく分からない、経済学の場合はそこをいろいろな形で解釈して、説明するわけですが、それが多段になってくると、段々よく分からなくなってくるということです。

 ただ、そういう意味で言うと、人間の脳も結局分からないのです。なぜあるものを見て猫と判断したかというのは、これは実は誰も説明できないのです。やはり実績でしか評価できないというのは、私は仕方がないことだと思いますし、だからこそ例えば運転免許を取るというのは、まず最初の試験があって学科があって、教習所内での練習があって、それがまた仮免を取って外に出て、そのような実績によってちゃんと学習できているよねというのを確かめるというような社会的な仕組みだと思うので、それと同じような社会的な仕組みというのを、このディープラーニングが載ったような製品についても作っていくことが重要なのではないかと思います。

 今のディープラーニングで、できないことは何かというと、できないところはまだまだたくさんありまして、1つは画像認識はできるのですけれども、人間の場合、画像を眼で見て認識することによって、実は三次元的な空間理解をしているのです。画像を判定するだけだったら簡単なのだけれども、このように見て、これがまた移動してこう見えて、移動してこう見えてというのを繰り返すことによって、空間的な構造をどう捉えるのかということについては、実はまだディープラーニングではできていないのです。

 ですから、その辺ができると、実はこのロボットとか機械にとっても非常に重要になるはずだというのが1点です。

 それからもう1点が、言葉、記号の意義で、人間は言葉を使って説明したり、言葉を使って伝達したり、あるいは数式を使って世界を記述したりということをするわけですけれども、これは何らかの知能の仕組みの上に実現されていて、それは画像認識とか空間の理解みたいなものの上位にあるはずだと。ただ、そこの仕組みが、今どのようにできているのかというのは、研究が進んでいますけれども、まだできていないところで、ただ、私の予想では、それは多分これから5年ぐらいの間に解明されるのではないかなと思っていまして、そういう意味では人間の知能の根源というのが、他の動物と違って言語を使うというのがすごく強いわけですけれども、そこの理屈というのが明らかになってくるのではないかなという意味では、非常にエキサイティングな時代だなとは思っています。

○大竹委員 人材育成についてお聞きします。ディープラーニングは、これから産業競争力を高めるためには、そのための人材が必要になります。1つは松尾さんのようにディープラーニングの専門家を増やすということも大事だと思います。もう一つは、しかし、他の分野の人もがディープラーニングを学んでいくことも重要だと思います。例えば、大学では統計学や、数学や英語といったどこの学部でも教えているような科目がありますが、その中の1つにディープラーニングを必須の知識として、入れていくこともできます。先ほど紹介されたGitHubに載っているようなプログラムを動かせるような人材育成して増やしていくのがいいのでしょうか。あるいは、ディプラーニングの専門家とそれを応用できる人材の両方を育成しなければいけないのかということ、応用できる人材を育成するには、そのバックグランドがどのぐらいの人まで可能なのかなということをお聞かせください。

○東京大学松尾特任准教授 ありがとうございます。私はもちろんディープラーニングの技術者専門家というのを作るのは非常に重要だと思いますが、結局それ単独でやっても余り意味がなくて、例えば先ほどの医療画像の認識をしたいのだったら、やはり医療の分野の専門家の方がディープラーニングの技術も身に付けてもらうのが、やはり最強なのですよね。これは特に若い学生などでは、半年か1年もやれば、あっという間にできるようになるので、特にそういう専門分野のポスドクの方などは、私は是非やってほしいなと思いますし、それがいろいろな領域、例えば建設分野とディープラーニングとか、農業とディープラーニングとか、外食産業、ビューティとディープラーニングだとか、いろいろな分野でディープラーニングの活用可能性があって、そこの専門家にディープラーニングを身に付けてもらうというほうが、私はよほど競争力としては強いと思っていますので、それが広がってくるといいなと思っています。

 ちょっと関連した取組としては、日本ディープラーニング協会というのを昨年作りましたが、ここで検定試験、資格試験をやっているのです。時事検定、E資格というのがありまして、E資格のほうは正にエンジニアを育成するようなものでして、これは結構難しいと、ちゃんとプログラムを書けて、理論が分かるような人で、G検定のほうは、ディープラーニングを使って新しい取組をしたい経営者の方とか、新規事業の方、製作担当者、メディアの方、あるいは他の分野の方も含めて、ディープラーニングとは何か、AIの中でどう位置付けられるのか、データを集めるというのはどういうことか、どういう落とし穴があるのか、そういうことを理解していただくというようなもので、G検定は昨年やって1,500名、今年は2万名ではなくて2,000名なのですが、どんどん増えてきて年3回やっていますし、E資格も今度、第1回をやるということで、こういうことを足掛かりにして、いろいろな分野で、このディープラーニング技術掛ける専門性というところを持っていただくのが、人材の価値としては一番大きいのではないかなと思っています。

○宮本委員 大変触発的な御説明をどうもありがとうございました。医療介護の分野に引き付けた御質問で、ちょっとお答えしにくいところがあるかと思うのですけれども、何かヒントを頂ければということで、先ほどディープラーニングについて海外の企業の展開が特に医療分野で進んでいるというお話がありました。今日、御説明のあった最小二乗法のアルゴリズムに改修できる変数というのは、例えば医療と介護の2つの分野で考えてみた場合、医療のほうがひょっとして多くて、介護というのは、よくいう人間的うんぬんという話になってしまうのかもしれないですけれども、確かに介護ロボットの「パロ」とか、一定のエモーションな部分に対応していく技術というのはできてきて、それはもう海外などにも輸出されていると思うのです。

 例えば、がん患者の最終盤の緩和ケアみたいな場面になっていった場合、最小二乗法に改修できないいろいろな変数というのが多くなってくる、そういうことを考えると、ひょっとしたら今日の話を詰めていくと、医療と介護の力関係と言っていいのでしょうか、何か付加価値性というのは、ひょっとしたら逆転していくということもあり得るのかなと思って聞いていたのです。仮定の話にはお答えしにくいと思うのですけれども、もし何かヒントを頂けたらと思います。

○東京大学松尾特任准教授 ありがとうございます。直接ちゃんとしたお答えになっているかどうか分かりませんが、医療の場合、画像の診断は得意なのです。ただ、一般的な総合的な診断になると、例えば検査の値、画像、問診だとかこれまでの病気の経歴だとか、そういうのを全部含めて判断するというのは苦手なのです。それはなぜかというとxyの関係だけではなくて、それを精度よくやるには、後ろに膨大な人間の体に関する知識とか社会に関する知識、病気に関する知識というのが学習されている上でxyの関数を上手に学べるということなので、裏側の話がないと表面的に学んでも限界があるのです。そういう意味では画像はいいのですけれども、総合的な判断というのはそんなに期待しないほうがいいと。やはりお医者さんの仕事というのは、しばらくは絶対、すごく重要なものは残ると思います。

 一方で介護のほうは、例えば見守りというのは1つあると思うのです。これは画像認識なので、変なことが起こっていないのかを見守るというのはあると思いますが、それ以外の部分はやはり人を触りますので、なかなかそれはロボットにしても自動化するというのが安全性の問題とか法律の問題とか、少しやりにくい面はあると思っています。そういう意味では、どちらかと言うと余り人の体を直接触らないような農業とか建設とか食のほうが環境を整えやすいのでやりやすいのではないかと思っていますが、ただ、介護自体は非常に社会全体でも大きな問題なので、何とか技術によって進むといいなと思っているのです。

 私がずっと思っているのが、ちょっと何かこういう場で言うのがいいのかどうか分かりませんが、画像認識で精度が上がりましたと、見て分かるようになりましたという技術とアクチュエーターを組み合わせると、いろいろなことができるというのが、今ディープラーニング全体で起こっていることで、それを踏まえた上で、例えば介護現場における排泄の介助をやるような、ディープラーニングプラスハードウェアの装置を作れませんかというのは、私は今だったら何らかの形でできるかもしれないのではないかと思っています。

 これは眼で見て認識するという技術がないときには、多分絶対できない話なのですけれども、眼で見て認識するというのができた上で、どういうハードウェアを組み合わせれば、高齢者の方が自分の意思で、体が動けなくなっても排泄ができるのかというのが、そこができると産業としては、これはとても大きいはずなので、そのようなコンペディションとかをやって、賞金総額何億円とかとすると、例えば若い学生とかもみんなそういうのをやって、その中から何かすごい技術が出てくると、日本国内だけではなくて全世界にその技術が普及するみたいなことになるのではないかと思っていまして、やはり一番大変なところで、このディープラーニングの技術を使った突破口というのが実はあるのではないかと、個人的には思っています。

○佐藤委員 どうもありがとうございました。データをどう作るかというところで、xyでタグを付けるのが非常に大事だというお話、自動翻訳の所もxyを入れてやっていけば同じことだというお話だったのですけれども、そうすると先ほどの翻訳の精度がありますよね。今のを総合的に判断するのが難しいと考えると、例えば学術論文なんかの翻訳はできるけれども、小説なんかは難しいという単純な理解でいいですか。

○東京大学松尾特任准教授 御指摘の点はすごく重要というか、良い質問だと思います。xyの関係なので、翻訳については数字にするのが若干工夫が要るのですけれども、ある英語の文をある日本語の文にするというのは、xyの関係として置き換えれば、データから学習できますというのがあるのです。先ほど御説明したように、本当の翻訳は世界に関する知識、社会に関する知識、いろいろなものが必要なので、精度はそんなに上がらないはずなのです。私の予想では、今のアプローチでは精度は人間に至らないとずっと思っていたのですが、意外に上がってしまって、あれ結構上がるんだなと思って、でも人間レベルぐらいなのですが。

 それは何でかというのを改めて考えてみると、我々が使っている言語というのは、少なくとも大人が使っている言語は、かなりの部分で実態と乖離していて、世界的な知識、抽象的な言葉だけでしゃべっているのです。子供が使う言葉とかは、例えば赤いボールがありましたと言ったときに、赤いボールという意味をちゃんと実態と紐付けて理解しておかないと、この文の意味理解はできないははずなのですが、大人が使っている言葉というのは相当な程度、今私がしゃべっているこの言葉そのものもそうですけれども、相当な程度抽象度が上がっているので、実はパターンの学習だけでも相当それっぽいことが言えてしまうということの裏返しでもあるのだなと思って、非常に興味深いなとは思っています。

 これが本当にその実態との、シンボルグランディングというのですけれども、シンボルグランディングをできた上で、翻訳というのができると、私は人間と同じ程度どころではなく、人間よりももっと精度は上がるということが、そのうち起こるのではないかなと思っています。

○山本委員 ありがとうございます。ディープラーニングの利活用の分野について、今日のお話ですと、ものづくりですとかサービスですとか、どちらかというと体を使う、手足を使うという所で活用できそうだと。さらにそこは日本が得意とする、あるいは日本が必要としている分野なので、日本が進めるべきだと、非常に説得力があったと思うのです。

 一方で、オフィスで働いているような人たち、例えば人事とか営業とか企画とか、そういったような所で、どの程度ディープラーニングが今後普及していくのか。御説明の中で、フィンテックやRPAというのは、全然学習の要素が少ないということなのですが、それでも今かなり進んでいて、それによってかなり合理化ができている状況かと思うのです。その後ディープラーニングが入ってくると、もっとドラスティックに変わっていくのかと。日本は、そこでどのように競争力を高めていけるのかというところが知りたいなというのが1つあります。

 少し関連するのですが、例えば人事とか営業、人材に関わるような業務に、ディープラーニングを使ったシステムを入れようとすると、先ほどブラックボックス化の話があったと思うのですが、例えばエントリーシートをAIが判定して、この人を通すべきかどうかというようなことを、深層学習の度合いをどんどん高めていけば、精度は上がるのですけれども、ただそのシステムを人事の人が使ってくれない。やはりブラックボックス化してしまって、何でこの人が良いのかどうかが納得できないと、使ってもらえないんだということをよく聞くのです。

 そうすると、人の理解がなかなか深層学習に追い付いていかないと、あるいは深層学習を理解できるだけの准備ができていないと、なかなかオフィスの部分にAI、ディープラーニングとかが進みにくくなってしまっていて、特に人事に関してはやはり機械に評価されるのは良くないしとかといったような価値観のようなものがあって、逆にそれが障壁になってしまって、なかなかオフィス部門の生産性が上がらないということもあるのかなと思うのです。それについて何か御示唆があれば教えていただきたいなと思います。

○東京大学松尾特任准教授 ありがとうございます。フィンテックとかRPAとか進んでいますけれども、あれは裏を返せば、今までの日本の、例えば金融だとか医療だとか教育だとかの現場で、ITの活用がされなさすぎていたということだと思っていまして、AIと言葉を変えて、ITをちゃんと作っていきましょうというのを言っているだけなのです。

 RPAというのは、本当にすごいと思うのですけれども、ある種の擬人化で、ロボットというのは、何だかロボットが仕事をしてくれるような感じになって、このロボットに何の仕事をさせようかみたいに、急に頭が回り出すということなのです。ITと言われると、そのITって何するんだっけとなるのだけれども、ロボットと言われると、そういうふうにこの仕事をさせられるのではないかと、擬人化することによって理解しやすくなるというような効果だと思っていて、それはそれで私はすごく重要だと思っています。

 では、ディープラーニングみたいなものが、人事とか営業とかに役に立つのかというと、基本的には難しくて、それはなぜかと言うと、先ほどの話と一緒ですけれども、やはり総合的な理解、いろいろなものの背景知識を必要としているので、単純なxyのパターンの学習だけでは精度は上がらないということだと思います。

 ただ、人事などである労務管理みたいなのは私はもっとできるはずだと思っていて、例えば人の表情を読み取るというのは、もう技術としてあるのですよね。そうすると、ある人がどれだけ快活な表情をしているのか、どれだけ疲れた顔をしているのかというのを、常時モニターすることなどができるはずで、そうすると生き生きと働いて、生産性が高いような状態を維持するには、どういうふうな労働環境にしたらいいのか、組織作りをしたらいいのかというようなことにつながってきますし、PDCAもありますので、そういうものというのも一部あるのだろうなと私は思っています。

 2つ目の御質問で、中が分からないとやはり使えないのではないかというのは、そのとおりで、今のような表情を読み取るとか、労務管理などの限定的なものを除けば、全体としては背景知識を非常に必要とするので、そもそも精度が上がり切らないと思いますし、精度がある程度上がったところで、本当にそれを信じてやるのかというところは難しい。これが定量的に評価がしやすい、結果的に何年か1、2年たった後に、定量的に評価が定まりやすいようなものであれば、可能性があるのですけれども、人事というのはすごく難しくて、では企業の業績が上がりました、ある部門の業績が上がりましたか下がりましたかと、非常に大きないろいろな影響を受けるので、結局は思い込みの部分というのがなくならないし、人事においてそこはかなり本質的にあるのではないかなと思っていて、そこは恐らくずっと人間がやることなのではないかなと思っています。

○樋口座長 それでは私も1点。非常にディープラーニングの進化とその効果と言いますか、インパクトが大きいなというようなことを改めて認識したのですが、今までの技術革新は、人類の歴史でずっと繰り返し繰り返しやってきたわけです。その社会に与えるインパクトと、今回のこういったディープラーニングとかAIとかと言っているようなものの、量的な違い、インパクトの大きさの違いというのは分かるのですが、質的に違いがあるのだろうか。

 先ほどのお話でも、例えばその労働集約的な産業で、人に代替するようなことが起こってきますねというようなこととか、あるいは分配とか再分配が非常に重要ですと。これはずっと、多分ジェームス・ワットの蒸気機関以来、ずっとやってきた繰り返しだと思うのですね。それと今回、何か違いがあるのか。先ほどの事務、ホワイトカラーに与えるインパクト、従来で言うと知的労働に与えるインパクトというのも、かなり代替する可能性があるのではないかというようなところというのは分かりましたが、何かあるのでしょうかね。どこに気を付けなければいけないのでしょうか。

○東京大学松尾特任准教授 ありがとうございます。ほとんどないというか、従来と一緒だと思っているのですが、66ページを見ていただくと、私は知能と生命というのが違うと思っていて、「人間:知能=:飛ぶこと」と書いていますが、この飛ぶことを工学的に原理を追究して作ると飛行機とかができるわけですよね。ただ、飛行機は朝になると鳴いたりするのかというと、鳴かないですし、巣を作ったり子育てをしたりしないわけです。

 それと同じように人間の知能の部分を工学的に解明して、社会の中で使っていきましょうというのが人工知能なわけですが、これができるようになると、では知能を除いた人間の人間性というのは一体何なのかというのを、よりはっきりと見ないといけなくなってくると。

 私はある意味で、人間は自分の人間性を知能が高いことと、かなりイコールで考えている節があると思っています。でも、本当はそうではないと思っていて、例えば社会で協力して何かを達成するとか、かわいそうな人を見ると助けるみたいなのは、知能の仕組みというよりは、それ以外の人間性の部分だと思うのです。そこをはっきり意識したような社会の作り方というのを、やっていかないといけないという意味では、従来よりも、より人間に対する理解というのが必要になってくるようなタイプのイノベーションなのではないかなとは思います。

○樋口座長 ありがとうございました。ピカソになれないのと同じで、人間の感情とか快さとか、そういったものをクリエイトしていくようなものを求められるということなんですかね。

○東京大学松尾特任准教授 はい、そうだと思います。

○樋口座長 はい、分かりました。もう1つ、日本がこういったディープラーニングを体現化したような製品を作っていく上で、それを作る側に回らなくてはいけない、使う側では駄目なんですと。作る側に回る上で、何が社会にとって重要なのか。あるいは逆に、それを阻んでいるものは何なのかという点はいかがでしょうか。

○東京大学松尾特任准教授 ありがとうございます。60ページに行っていただいて、日本の問題点は、まず今のようなディープラーニングというのが非常にイノベーティブなんだと。それはなぜなら、「浅い」関数ではなくて「深い」関数になったからなのだというところの理解が追いついていない場合が多くて、どちらかというと保守的なので、従来から研究をやっていた研究者の方は、基本的にみんな「浅い」関数でやっているので、「深い」関数というのが良いということに対して抵抗感があるのが1つです。

 それからスピードです。特に中国の動きに比べると、非常に遅いような状況。それから、ちゃんと意思決定ができていないので、投資の判断ができていないというのがあります。

 3つ目が、人への投資になっていないというところで、これは優秀な若者が非常に大きな付加価値を作り出すというような技術なわけですが、そこがなかなか日本の中では年功序列が強くて、意思決定も任せてあげていない。ですから、私は社会全体で、昨日もメディアの方と話していたのですけれども、例えば若い人がニートしているとか、私からすると非常にもったいないと思っています。こういう領域ですごく活躍するかもしれない可能性を持った人が、やる気がなくて家でいるみたいな状況になっているというのは、日本全体の非常に大きな損失だと思っています。若者の才能を開花させてあげるように、社会全体で応援して、若者が本当に最先端に立って世界と戦っていくような像を、社会全体でどうやって作っていくのかというところが、すごく重要なのではないかなと思います。

○樋口座長 ありがとうございました。そのほかに。

○堀委員 本日は魅力的なお話をどうもありがとうございました。もし御示唆いただければと思うのですけれども。今、私は若者の研究をしているのですが、松尾先生の周りにいらっしゃるような非常に優秀な方々もたくさんいると思うのですけれども、社会全体としてどのような形で人材を育てていったらいいのかという観点からお尋ねしたいと思います。

 先ほどおっしゃったように、能力の高い人が富を生み出すので再分配が重要だと、本当にその通りだと思うのです。そうした社会観の中で、どのような形でこれから子供たちないしは若者を育てていったらいいのか。優秀な若者だけではなくて、社会全体としてどのような形で考えたらいいのかということについて、是非御示唆を頂けないかと思います。よろしくお願いします。

○東京大学松尾特任准教授 ありがとうございます。優秀な若者なんですが、優秀という意味を余り厳密に捉えなくてもいいと思っています。例えばインターネットが普及してきた1990年台後半に、インターネットの最先端にいた人がいるわけですが、その人達が何をしていたかというと、HTMLファイルを書くということと、ウェブサーバーを立ち上げることができると、ホームページが作れたわけで、ホームページを作れるとすごいとなっていたわけです。企業からいろいろな所から、ホームページを作ってくれとなって、1枚作ると100万円ですみたいなことをやっていたわけです。

 その中から、ページをクロールするような技術とか、ホームページの上で物を売るような技術とかを考えついて、それが、Googleになったりfacebookになったり、Amazonになったりしたわけです。

 当時、HTMLファイルを書いたりウェブサーバーを立てるということに、何か特殊技能が必要だったかというと、私はそんなことはないと思っているのです。単にそれに可能性、面白さを見いだしてやった人が、結局それができるようになって、その後のイノベーションの道を進んでいけたということだと思っています。

 今のディープラーニングもそれとすごく近いと思っていて、難しそうな技術なのですけれども、原理は最小二乗法が深いだけですということ。それからプログラムも実は書くのはすごく簡単で、どんどん簡単に書けるような仕組みが出てきていますので、数十行プログラムを書くと、それっぽいディープラーニングのプログラムが動くのです。これを学習するのに、どれぐらい時間が掛かるかというと、本当にやる気さえあれば、1週間とか2週間ぐらいですぐできるようになるというようなレベルです。

 ですので、余り大きく構えて、教育をどういうふうにやるかというよりも、今これに興味を持っている若者が、まずやってくださいということだと思っていますし、やってくる中でどんどん活躍する人が出て来て、この数をもっと増やすために、高校の段階でこれをやっておいたほうがいいかというようなことです。特に私は高等専門学校に注目しているのです。彼らは非常に優秀で、その意味は機械とか電気についてよく分かっていて、しかもディープラーニングを教えると、恐らく一瞬でできるようになるのです。そうすると機械、電気、ディープラーニングという3つの特技を持ったような人材ができますから、これは世界的に見ても相当競争力の強い人材になるのではないかと思っています。

 そういう辺りを、やる気がある若い人にどんどん機会を提供していくというところが、一番最初の入口で、それは必ずしも東大に行っている人でないとできないとか、そういう話ではなく、チャレンジするつもりがある人であったら、できるといったことなのではないかと。そういう雰囲気を作っていくということが、重要なのではないかと思います。

○樋口座長 よろしいですか、松尾先生はそろそろ時間ということですので、ここでAIIoTの雇用に与える影響についての議論は打ち切りたいと思います。どうもお忙しいところありがとうございました。参考にさせていただきたいと思います。

 それでは2つ目の議題に移ります。職種別の賃金・労働時間分布について、事務局から説明をお願いします。

○職業安定局雇用政策課長補佐 資料4を御覧ください。前回第3回において、我が国の構造問題・雇用慣行と題して、産業別の賃金などの状況について御説明しました。その際に産業別だけではなく、職種別でも見てはどうかと御指摘を頂きまして、今回は職種別に賃金や労働時間についてデータを簡単に整理しました。

 3ページを御覧ください。職種別の賃金や労働時間について把握している統計として、毎年1回実施されている賃金構造基本統計調査があります。今回御説明する資料は、この調査の2016年版を元にしています。

 この賃金構造基本統計調査における職種は下の大きな表にあるとおり、全部で129職種あります。このうち、これまで本研究会で取り上げてきた産業に従事していると考えられる職種を中心に抽出して、それらを介護関係など大きく8つの括りにしています。

 具体的な括り方ですが、介護関係など例を挙げながら解説したいと思います。例えば介護関係の職種ですが、一番左側の列の下のほうです。黄色に塗りつぶした3つのセルがあります。具体的には介護支援専門員、ホームヘルパー、福祉施設介護員となっています。これらの3職種を介護関係の職種としてひと括りとしています。また、製造関係で申し上げますと、左から3列目から4列目にかけて、薄い緑色に塗りつぶしているセルがあります。こちらは製鋼工からボイラー工まで47職種になりますが、こちらを製造関係職種として1つにまとめています。

 次の4ページと5ページを見開きで御覧ください。今、御説明したようにまとめた8つの職種について、それぞれ賃金分布をグラフにしています。まず44ページが情報通信関係、介護、保育、販売の4職種です。次に5ページが残りの職種、飲食、運輸、製造、建設となっています。グラフを見ていただきますと、2本の折れ線グラフが入っていると思いますが、2005年は現在の職種分類が使われるようになった時点と、2016年のものを並べています。赤い方が2016年のものになっています。

 御覧いただきますとおり、情報通信、保育いずれも4ページの左側ですが、この2職種を除いて、賃金分布はこの10年間で全体に右方向へシフトしているということが分かります。これらのグラフの賃金は、所定内給与に加えて、時間外手当やボーナスを含んだものになっています。また対象の労働者も、フルタイムの方に限っているということになります。

 次に、6ページと7ページを見開きで御覧ください。労働時間について確認したいと思います。1ページに4職種ずつ分割して載せています。対象となる労働者については、労働時間を職種間で比較するという観点から、やはりフルタイムの方に限っています。また、ここで労働時間とは、所定内労働時間に残業時間を加えたものとしています。

 8つの職種の労働時間を御覧いただきますと、先ほどの賃金の分布のほうは皆似通ったグラフの形になっていたと思いますが、こちらの労働時間のほうは職種によって様々な形状となっているということが分かると思います。情報通信、保育は6ページの左側です。それから飲食は7ページの左上になりますが、この3職種では月当たりの労働時間が180時間を超える方の割合が低下傾向にあることが分かります。以上簡単ですが、資料4の説明を終わります。

○樋口座長 ありがとうございました。皆さんから何かこれについてございましたら、お願いします。

○佐藤委員 これはフルタイムで有期、無期とかは関係なく、単にフルタイムでいいですか。それと職種を括っているのは、サンプル数が少ないからですか。

○職業安定局雇用政策課長補佐 すみません、フルタイムの期間は限定せず、フルタイムというところで切っています。

○佐藤委員 有期、無期、両方入っているのですね。

○職業安定局雇用政策課長補佐 入っています。

○佐藤委員 職種を括っているのはサンプル数が、例えば介護なんかもヘルパーとケアマネと正直かなり違うものを括っているので、分けてしまうとサンプル数が少ないという理解でよろしいですか。

○職業安定局雇用政策課長補佐 括らせていただいた趣旨は129という数が多いということであります。それから1つ1つ細かく見るのがなかなか難しいと思いましたので、まとめました。もちろん、やれることはやれますが、分かりやすさのために分野でひとまとめにするというふうにお見せしています。

○樋口座長 よろしいですか。やはり職種によって、給与もあるいは労働時間も違った動きをしていて、分布の動きが大分違っているという感じですね。山本先生、何かありますか。

○山本委員 恐らく私がリクエストしたので作っていただいたという側面もあると思います。まずは本当にありがとうございました。見て非常に興味深いと思ったのですが、例えば建設とか介護とか、人手不足が進んでいると言われている業種で、必ずしも労働時間は増えていなくて、一方でフルタイマーに限れば賃金は多少上がっていそうだということなので、ある意味フルタイマーに関して言えば、市場メカニズムが多少働いているというところも見えてくるのかなと思います。

 一方で、パートタイマーの部分がどうなってくるかというところも併せて見ると、フルタイマーでは市場メカニズムが働いて、ではパートタイマーはどうなんだというところも見ると、より構造が分かりやすくなるのかなと思います。ただ、フルタイマーのところで、賃金がじわじわと上がっていそうだというのは、大きなファインディングなのかなと思います。

○樋口座長 ありがとうございます。保育士不足とか介護士不足というので、いろいろな助成も増えていったわけですが、介護についてはその動きというのは、これで見る限りはあったのかなと。

 保育のほうは、200万から300万が年収で増えているというのがちょっと目立つ感じがします。よろしいでしょうか。よろしければ次の3番目の議題の労働力需給推計に移りたいと思います。冒頭でご案内いたしましたとおり、この議題については非公開とさせていただきたいと思いますので、一般の傍聴者の方は御退席をお願いしたいと思います。

(傍聴人退室)

○樋口座長 予定している時間になりましたので、本日の会議はこれで終了したいと思っています。では、事務局に本日の議論を踏まえ、引き続き検討していきたいという点が幾つか出ましたので、それを併せてお願いしたいと思います。次回の日程等について、事務局から説明をお願いします。

○職業安定局雇用政策課長補佐 次回、第5回雇用政策研究会は9月19日水曜日、10時からを予定してございます。委員の皆様には、後日改めて御案内を送らせていただきますが、よろしくお願いいたします。

 また、冒頭に座長から御説明いただきましたが、資料5の労働力需給推計については会後に回収いたします。委員の皆様におかれましては卓上のほうに置いてお帰りいただければと思います。省内関係者については事務局に資料を返却ください。以上です。

○樋口座長 本日は以上で終了します。ありがとうございました。

 

 

 

 

(了)

ホーム> 政策について> 審議会・研究会等> 職業安定局が実施する検討会等> 雇用政策研究会> 第4回雇用政策研究会(議事録)(2018年7月20日)

ページの先頭へ戻る