データサイエンスのチカラでビジネス課題を解決【中編】

【目次】

先端技術部の佐藤と申します。普段はデータサイエンス技術を活用した顧客支援や自社サービス開発、加えて当社のデータサイエンス人材の採用・育成に従事しています。(以降、データサイエンスもしくはデータサイエンティストをDSと表記)
前回はDS取組み事例を3つご紹介しましたが、今回は「DS人材育成のコツ」について触れてみたいと思います。

データサイエンスはとっつきにくい!?

DSの歴史は浅く、その誕生はほんの10年前のことです。Harvard Business Review の2012年10月号の有名な記事「Data Scientist: The Sexiest Job of the 21st Century(DSは21世紀で最もセクシーな職業だ)」を契機にDSの職業認知は急激に広がりましたが、しばらくは、DS 人材を確保し価値化できる企業は一部に限られる実態が続いていました。

その理由として当時は、「そもそもDSは、深い数学知識(線形代数・確率・ベイズ論等)、データ解析スキル(統計解析・機械学習等)、エンジニアスキル(DB/DWH・分散処理・クラウド等)を兼ね備えたスーパーマンしかなれず、人材の絶対数が少ないのだ。」という意見が大勢を占めていたように感じます。

上述の人材像は、クルマの世界で例えるとプロのレーシングドライバーです。確かに一部のITサービス企業やプラットフォーマーでは、事業構造上プロドライバー級DSが必要不可欠ではありますが、冷静に考えると、全ての企業が必要とする訳ではないはずです。むしろ、1人のプロドライバーを雇用するよりも5人の市民ドライバー(現場実務担当者)のDSスキルを底上げするほうが、より事業貢献に直結する企業のほうが大多数ではないでしょうか。

DS黎明期の当時を振り返ると、「全ての企業がプロドライバーを揃えないとDX時代に勝ち残れない」という人材供給サイドの歪んだ主張と、「高給でプロドライバーを多数雇ったが、事業貢献に直結しているわけでもなく、ほんとに役に立つのか疑問・・」という人材受入れサイドの困惑が重なった結果、「DSって凄い人材なのだろうけど、よくわからないし、とっつきにくいから触れずにおこう・・」という空気感が蔓延し始めたように感じます。

当時は私も、界隈に携わる端くれとして身につまされる思いがある一方で、「それは正しい認識なのか?」とモヤモヤした思いを抱いていました。

データサイエンスの民主化

一時期の過剰期待と冷却の期間を経て、DSに対する認識の潮目が変わったのは、2017年頃でしょうか。DS の高度専門技能の80%くらいを自動化した分析ツール(※1)の普及と、ビジネスマン向けのEラーニングサービス(※2)が充実してきたことが重なった時期です。これにより、自社に必要なDS人材は外部雇用ではなく内部育成するという業界機運が一気に盛り上がったように思います。

分析自動化ツールは、DSの地味作業の大部分を自動化(※3)してくれる恩恵をもたらしたことから、真っ先に使い始めたのは”専業DS”と言われるタイプの方々でしたが、「プログラミングが不要」「データサイエンスの知識が浅くても支障がない」という利便性が知られるにつれて”兼業DS(本業は別職種だけど、必要性に迫られてDSを学び実践しはじめた)”のような方々にも普及が進み、いつしか「DSの民主化時代」と呼ばれるようになりました。なお機械学習技術の自動化発想から産まれた民主化の流れは、現在、探索的データ分析・統計解析(多変量解析)・統計的因果推論に至るまで波及し、今ではノンプログラミングで実行可能な各種自動化ツールが選び放題という恵まれた環境となっています。(※4)

筆者私見ですが、ビジネスで多忙を極める方が今から限られた時間で”兼業DS”を目指す方へは、これら分析自動化ツール活用を入口として小さな現業成功事例をつくったあとに、Eラーニングなどで背後の理論知識の理解を深めるという順番が良いのではと考えます。遠くに移動したいなら、目の前にあるクルマ(AT車)に乗り込んで走りだせば良いだけです。パワートレインの仕組みやギアチェンジのコツを理解するのは後回しで問題ありません。
DS学習に悩んでいる方、まずはアクセルペダルを踏み出しましょう。

dscolumn-2_02.png

山登りを支援するシェルパはいますか?

「ツールもデータも揃えた。外部のEラーニングサービスも契約した。試行錯誤ながらも、部下は自走し始めているようだ。」
そこで一安心してはいませんか?最後に、兼業DSを育成する責務を負っているマネージャー層の方に向けてお話をします。

DSがカバーすべきスキル・知識は非常に広範に渡り(※5)、各スキルをどの順番に習得するか、その道程に正解はありません。「自分の目的を実現するためにどれを習得すべきかわからない・・」と迷われる方は多くいますし、そのような段階でEラーニングが頼りになるかと言いますと、そうではないでしょう。学習の道しるべを示すことが先決です。

いくら便利な分析自動化ツールが登場したとしても、DSは基本的に個人ワーク(学習と実践)の時間が多くを占めることは変わりません。特にリモートワークが新常態化しつつある現在は、集合研修や勉強会などリアルの場に集まって研鑽を重ねることが難しいこともあります。1人で勉強を続ける入門者にとっては、ときに孤独を感じ、学習中に心が折れることも多々あるでしょう。

マネージャーとしては”部下が孤独と戦っていること”にも配慮をし、相談・情報交換・壁打ちが気軽にできるシェルパ(登山案内人)を設けてあげることが望ましいです。適切なメンタリングができるシェルパの存在は、DS入門者の成長曲線を大きく左右します。理想的には、DSの知識が厚い身近の同僚・先輩がシェルパ役を務めるのが望ましいですが、適切な人材がいない場合は、外部企業の支援を借りることも一案です。当社も今春より、お客様社内の人材育成までコミットするハンズオン型分析サービスをスタートしています。ご興味あればぜひお気軽にお問い合わせください。

また、分析自動化ツールは確かに便利ですが、反面、DSの基礎知識習得がすっぽり抜けてしまうことは大きな懸念です。基礎がしっかり身につかないと、ツールで対応できないシーンで応用が利かなかったり、他者に教えることもままなりません。ツール習熟の後でも良いので、基礎知識を養うことを強くお勧めします。
当社でも基礎を学べるセミナーとしてi-collegeを定期開催しています。基礎体力向上の材料としてお気軽に利用頂けますと幸いです。


dscolumn-2_03.png

次回

次回は、DSの強みが発揮される「最適化問題」についてお話していきたいと思います。
最後までお読みいただきありがとうございました。


(※1)代表的にはAutoMLツールが挙げられます。有名なところでは、DataRobot(米国DataRobot 社)やAMATERAS RAY(aiforce solutions 社)ですが、それに限らず現在は国内に10を超えるサービスが存在します(筆者独自調べ)。また現在は「機械学習の自動化」にとどまらず、「探索的データ分析や統計解析(多変量解析)の自動化」も実現するツールも存在します。当社でも複数のツールを用途に分けて活用し、お客様に向けて適切なツール選定アドバイス等の支援も行っています。ご興味ある読者の方いればお気軽にご連絡ください。

(※2)Eラーニングサービスとして有名なところではUdemyやTechAcademyが挙げられます。他にも総務省統計局による「社会人のためのデータサイエンス入門」や、英語学習も兼ねられるdatacampもお勧めです。

(※3)この自動化ツールの登場以前は、何かしらの教師あり機械学習モデル(例えば、販売量予測モデル・消費者反応予測モデル・デジタル広告配信におけるオーディエンス拡張モデルなど)を作りたい際は、R言語なりPython言語なりでプログラミングをする必要がありました。学習データ準備→プログラミング→モデル精度を検証→もう一度学習データ準備&プログラミング→検証・・・の作業ループが常であり、そのループをいかに高能率にこなすかがDSの技量の1つでもあったかと思います。また、膨大な労力をかけて出来上がったモデルを既存システムに組み込んだりAPI連携したい場合は、そこからエンジニアの協力を仰ぐことが必要不可欠でした。要は、1つのモデルを現場投入するにも、長い工程を根気強く辿る必要があったのです。

(※4)DSのすべての業務がこれら自動化ツールで完結できるわけではないことは、念のため付記しておきます。

(※5)詳しくは一般社団法人データサイエンティスト協会のスキルチェックリスト(外部サイトにリンクしています)をご参照ください。

著者プロフィール

dscolumn-1_05.jpg
佐藤 健一(さとう けんいち)

・早稲田大学大学院理工学研究科修了後、アップルジャパン、ニールセンカンパニー、博報堂を経て現職
・現在は、データサイエンス関連技術を活用した顧客支援業務・研究開発業務に従事する傍ら、データサイエンティストの採用・育成も担う


転載・引用について

◆本レポートの著作権は、株式会社インテージが保有します。
 下記の禁止事項・注意点を確認の上、転載・引用の際は出典を明記ください 。
「出典:「インテージ 知る Gallery」●年●月●日公開記事」

◆禁止事項:
・内容の一部または全部の改変
・内容の一部または全部の販売・出版
・公序良俗に反する利用や違法行為につながる利用
・企業・商品・サービスの宣伝・販促を目的としたパネルデータ(*)の転載・引用
(*パネルデータ:「SRI」「SCI」「SLI」「キッチンダイアリー」「Car-kit」「MAT-kit」「Media Gauge」「i-SSP」など)

◆その他注意点:
・本レポートを利用することにより生じたいかなるトラブル、損失、損害等について、当社は一切の責任を負いません
・この利用ルールは、著作権法上認められている引用などの利用について、制限するものではありません

◆転載・引用についてのお問い合わせはこちら

関連記事