会員登録すると
このコラムを保存して、いつでも見返せます
データサイエンティスト。要注目な仕事だが他職種と比べ歴史が浅く、その定義は浸透しきっていない。「AさんとBさんは共にデータサイエンティストだけど、やっていることは全然違う」なんていうことも、時に起きる。
理由の一つが、就業先の多様さだ。事業会社、コンサルティングファーム、データ活用を支援するTech系の企業など、所属する組織の業態によってデータサイエンティストの仕事内容は大きく異なる。
またデータアナリスト、機械学習エンジニアなど「近しい」仕事が存在するのも、ややこしいところだ。特集「データサイエンティストとは何者か」の第3回では、上で述べた業態によって異なる実務の内容に触れつつ、データサイエンティストと他のデータ系職種の違いについても考える。【藤崎竜介】
1. コンサルとITメガベンチャーのデータサイエンティスト職は「あまりに違う……」
2. コンサルはオールラウンダー、事業会社は“尖った”人材を育みやすい。ただし例外も……
3. データサイエンティストはビジネス、データサイエンス、エンジニアリングの力を兼ね備える存在
4. データアナリスト→データサイエンティストの転職も―。データ分析人材のキャリア展開
コンサルとITメガベンチャーのデータサイエンティスト職は「あまりに違う……」
「肩書は同じデータサイエンティストだけど、やることはずいぶん違うんだな……」
2018年夏のある日、コンサルティングファームでデータサイエンティストとして働くAさんは、同じくデータサイエンティストの知人・Bさんと談笑しつつ、少なからぬ驚きを覚えていた。Bさんの所属先は、BtoC領域に強い国内屈指のITメガベンチャー。
「Bさんの業務は、あるサービスのMAU(月間アクティブユーザー数)を高めるべく、自社のデータベースからSQLで取り出した情報を可視化・検証しつつ、販促やイベントなどの影響を考慮しながらPDCAを回し続けること。私の仕事とあまりに違っていて、少し戸惑いました」
後にAさんは、こう明かす。
Aさんがコンサルティングファームで担うのは、顧客が抱える課題に向き合い、その顧客が持つデータから課題解決に資する情報を引き出して施策の提案につなげる仕事。
「“何をすべきか”といった企画立案や業務内容の定義を主に担うので、たいていPDCAを回す段階までは関わらず、次のプロジェクトに移ります。同じことを繰り返すのは苦手なので、Bさんの業務は正直、自分には合わないと感じました」とAさんは苦笑いする。
2021年12月現在、DX(デジタルトランスフォーメーション)やデータドリブン経営などの必要性が叫ばれる中、多くの企業がデータ分析に強い人材の増員を急ぐ。ただ、募集要項などの表面的な情報からは、上記のようなギャップを推し量れないことも多い。
コンサルはオールラウンダー、事業会社は“尖った”人材を育みやすい。ただし例外も……
「われわれは『受託型』、事業会社のデータサイエンティストの人たちは、例外もありますが主に『自社開発型』ですね」と付け加えるAさん。その言葉の中に、データサイエンティストという仕事の多様さを解き明かす上でのヒントがある。
Aさんがいう受託型とは、顧客や他部門の依頼が起点となり、データ分析・予測などの価値を“外側”へ、いわばサービスとして提供する形態のこと。コンサルティングファームが相次いで立ち上げているデータサイエンスのチームはその典型だが、加えてALBERT、ブレインパッドといったデータ活用を支援するTech系の企業も、立ち位置は近い。
この形態だと、若手は比較的短期のプロジェクトに次から次へと身を委ね、経験を積むことになる。多様な案件に携わる中、身に付く知識・スキルの幅は広がりやすい。他方、ビジネス色が強く、スケジュールやコストといった面での制約は生じがちだ。
特定領域の専門性が磨かれる場ではないかもしれない。その半面、守備範囲の広い「バランス型」に育つ環境といえるだろうか。
では、Aさんが事業会社のデータ系人材を指していう、自社開発型とは何か。
IT、金融、小売、通信、製造といった業態の有力企業が自社で雇う、データ分析のプロフェッショナルたち―。つまり「インハウス」のデータ系人材が、それに当たる。ユーザーらが生む膨大なデータを取り扱い、自社のサービスや製品の新規開発・改善につなげるのが役目だ。
自らを受託型とするAさんは「数カ月かけて機械学習の予測精度やKPI(重要業績評価指標)の値を1%上げる、なんていうことをわれわれがやることはほぼないですが、自社開発型ならあり得るのだと思います」と推し量る。
受託型に比べオールラウンダー的要素は薄いが、腰を据えてデータに向き合う環境は、専門性が高く“尖った”人材を育みやすいとされる。そのせいかは不明だが、世界的なデータ分析競技プラットフォーム「Kaggle」で日本人の上位入賞実績を見ると、事業会社在籍者の“強さ”が目を引く。
ただここで注意したいのは、事業会社のデータ系職種に就いても、受託型に近い仕事をするケースがあることだ。
ある電機メーカーではデータサイエンスの専門チームが存在し、複数ある事業部門からは完全に独立した形態を採る。このチームの役目は、社内の事業部門からデータ関連のさまざまな相談を受け、分析・予測などを通じ課題解決に貢献すること。つまり“社内コンサル”的な立ち位置にある。
ある部門とのプロジェクトに数週間力を注いだ後、今度は別の部門から相談を受け、新たなプロジェクトに身を投じる―。所属メンバーの仕事ぶりは、特定領域を掘り下げる自社開発型より、コンサルティングファームに代表される受託型に近い。
古くからデータ利活用に力を入れている事業会社で、かつ多くの事業を抱える大企業だと、こうした社内コンサル的な形態になっていることが多いという。
付け加えると事業会社の場合は、受託型と自社開発型のデータ分析チームが社内で併存するケースもある。貴重なデータ分析人材をどう配置するか、その方針は企業によって千差万別だ。
データサイエンティストはビジネス、データサイエンス、エンジニアリングの力を兼ね備える存在
所属先の業態などによって、内容に大きな違いが出るデータサイエンティストの実務。それだけでも理解されにくいが、さらに話をややこしくしているのが、業務や名の似た職種がいくつかあることだ。
特に募集案件が多く、人材需要のボリュームゾーンとされるのが、データサイエンティストにデータアナリスト、機械学習エンジニア、データエンジニアを加えた4職種。インターネット上では、「データサイエンティストとデータアナリストはどこが違うのか」といった質問も、しばしば見られる。
あらためて、データサイエンティスト協会(DS協会)が2014年に定めた定義を見直してみたい。
データサイエンティストとは、データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル
◆DS協会のプレスリリースより
DS協会によると、同職種はビジネス、データサイエンス、エンジニアリングの3方向の力をバランスよく併せ持ち、どれか一つが欠けても肩書として成り立たないもの。
3つの力をかみ砕くと、
①ビジネス=ビジネス上の課題を設定する力、課題解決の戦略を定める力、施策の提案などコミュニケーションを取る力
②データサイエンス=機械学習や統計学といった情報科学・数学系の知見を駆使し、高度なデータ分析・将来予測を可能にする力
③エンジニアリング=PythonやRといったプログラミング言語などを用いつつ、データ分析のモデルを構築・実装・運用する力
といったところか。DS協会の公式資料である下図を参照すると、理解が進むはずだ。
◆DS協会のプレスリリース(前出のものと同じ)より
データアナリスト→データサイエンティストの転職も―。データ分析人材のキャリア展開
特集「データサイエンティストとは何者か」では上のDS協会による定義を下敷きにしつつ、キャリアの観点からデータサイエンティストとそれに似た他職種の関係性を独自にまとめ、基本的な考え方とした。それを大まかに記した図が、こうだ。
ここではデータサイエンティストとデータアナリストを、機械学習など専門性が高いスキル・知識のレベル、および使用頻度によって切り分ける。つまり、上の②(データサイエンス)の力を持ち業務内で使うことが多い場合はデータサイエンティスト、そうでないならデータアナリストというわけだ。
実は、データ分析といっても②の力がさほど問われない、つまりここでいうデータアナリスト的な仕事は、思いのほか多い。機械学習などはあくまで手段であり、もっと簡易的なデータ分析で解決できるビジネス課題は、無数に存在するからだ。
Twitter上ではこんな声もある。
機械学習はベギラゴンみたいなもので、ベギラマ・ギラで倒せる敵はその方がMPを節約出来るし、杖で殴り倒せるならより良い。
◆みぞおち / データアナリスト (@mizoooochi) さんのツイートより(2021年12月17日時点)
有名RPGの呪文の解説はあえて省くが、いずれにせよデータ分析の実務に明るく、かつゲーム好きの人なら大いにうなずけるたとえではないだろうか。
「比較的シンプルなデータ分析に携わった後、転職や配置換えで、機械学習モデルの構築みたいな専門性の高い仕事を担うようになる事例もあるようです」
こう指摘するのは、冒頭で登場したコンサルティングファーム在籍のAさん。つまり、ここでいうデータアナリスト→データサイエンティスト的なキャリア展開も珍しくないのだという。
今回、「キャリアの観点から」これら2職種の関係性を上のように示したのも、こうしたキャリア展開の可能性があるからだ。
残る機械学習エンジニアとデータエンジニアの関係性も、同じ考え方に基づく。つまり両者の違いは、機械学習など専門性の高いスキル・知識の有無と使用頻度。上の①~③の力でいうと、②が強ければ機械学習エンジニア、そうでなければデータエンジニアとなる。
無論、両方ともエンジニアなので③につながる力は高く、逆に①のビジネス課題解決的な色合いは薄い。
この記事で主に取り上げたデータサイエンティストは、DS協会が「3つのスキルはどの一つが欠けてもいけません」(*)と説くように、広範なスキル・知見が求められる。
*DS協会のプレスリリース(同)より
他方、ここでいうデータアナリストやデータエンジニアは、比較的ではあるがハードルが低い。故に、これらをデータサイエンティストになるための“入り口”と位置付ける道も、時に選択肢の一つになる。
データ分析系の仕事を志すならば、そうした中長期のキャリアストーリーを見据えて就職先選びやスキル習得を図るのも、悪くなさそうである。
会員登録すると
このコラムを保存して
いつでも見返せます
マッキンゼー ゴールドマン 三菱商事
P&G アクセンチュア
内定攻略 会員限定公開
トップ企業内定者が利用する外資就活ドットコム
この記事を友達に教える