会員登録すると
このコラムを保存して、いつでも見返せます
先端的な技術を用いつつ、データ分析やデータを活用したシステムの提供を通じ、企業を支援するALBERT(アルベルト)。社員の実に約8割がデータサイエンティストという、データ利活用の専門会社だ。
所属するデータサイエンティストは、事業会社と比べ多様な業界の案件に携わり、また一般的なコンサルティングファームと比較すると、システムの実装まで手掛けるのが特徴だという。
自分たちの知見や技術を通じて、企業の変革に関われる醍醐味(だいごみ)とはどんなものか。特集「データサイエンティストとは何者か」第10回は、2020年4月に新卒でALBERTに入社した2人のデータサイエンティストに、その業務の面白さについて語ってもらった。【南部香織】
1. 自社の技術を用い、実用化検証からシステム化まで。さまざまな業界に携われるところが面白い
2. 営業部が獲得してきた案件にアサインされることが大半。データサイエンティストから提案も
3. 専門知識を含む教材作成の難しさ。内容にこだわり「バチバチやり合った」
4. 一定の技術力は持ちながらも、キャリアの方向性によって立ち位置が変わってくる
自社の技術を用い、実用化検証からシステム化まで。さまざまな業界に携われるところが面白い
――お二人は、2020年にALBERTに新卒入社したそうですね。入社までの経緯を教えてください。
西村:私は学部時代から薬学系の研究をしてきたので、そういった方面に就職することも考えました。でも、データを扱うのが好きでしたし、データサイエンスやAI(人工知能)の技術に興味があったので、その分野で高度な仕事ができる企業を探すことにしました。
その中で、ALBERTは画像認識やディープラーニングにも強く、当時は強化学習によるロボット制御などにも取り組んでいて、非常に面白そうだったので選びました。
森西:私は学部時代から経営学を学んでいて、大学院では統計モデルの研究をしていました。特に因果推論という領域で、既存の因果モデルの頑健性を調べるために、自分でデータセットを作ってシミュレーションをしていました。
就職活動では、AIに関わりたいと思って調べていくうちに、データサイエンティストという職業を知り、興味を持ちました。ALBERTにエントリーしたのは、さまざまな業界・企業と提携しており、データが生む価値を社会実装できるという点に魅力を感じたからです。
――コンサルティングファームや事業会社のデータサイエンティストは考えなかったのでしょうか。
西村:明確にやりたいことがあるならば、事業会社もいいと思いますが、私の場合は業界・企業にこだわらず技術的に面白い仕事をしたいと考えていました。また、事業会社では、配属次第でやりたいことができなかったり、データサイエンスへの投資状況が変わったりするリスクもあると感じました。
コンサルと比較するならば、私たちには技術があり、実現可能性を検証するPoC(Proof of Concept)から大規模なデータ解析、モデル構築、実装までできるという点が強みではないでしょうか。
森西:私はコンサルティングファームへの就職も少し考えましたが、ALBERTの方が、幅広い業界に対して、よりデータサイエンスに特化してアプローチできると考えました。
――入社後はすぐに、プロジェクトにアサインされるのですか。
西村:新卒の場合、最初に2カ月ほど研修があります。実際の案件を模したような課題を与えられ、Pythonを使って分析し、最後に発表します。
森西:私たちの会社にはデータサイエンス教育部という部署があり、社外のデータサイエンティストの育成支援も行っています。そのプログラムの一部を新人教育にも使っているということですね。この研修の終了後に、各部署に配属されました。
西村氏
営業部が獲得してきた案件にアサインされることが大半。データサイエンティストから提案も
――お二人が所属するデータコンサルティング部は、社内ではどのような位置付けですか。
西村:前提として、全社員約250名のうち8割がデータサイエンティストです。データサイエンティストは、多くがデータコンサルティング部に所属し、営業部が獲得してきた案件を請け負っています。それ以外はバックオフィス、営業、先ほど申し上げたデータサイエンス教育部といった部署からなる組織構造です。
森西:データコンサルティング部内は複数に分かれていて、私たちは第3セクションに所属しています。担当する産業や分析手法に特化したメンバーで各セクションが組織化されています。
――配属後はどのようなプロジェクトに参加しましたか。
西村:私が最初に取り組んだのは、通信会社の研究開発部門が強化学習の事例を集めているということで、そのデータ収集のお手伝いをする調査プロジェクトでした。
その後、アパレル系企業のプロジェクトに携わり、PoCからモデル構築、システム化までを一通り行いました。それから、製薬業界向けデータサイエンティスト育成プログラムを中外製薬様と共同で開発しました。これは森西と一緒に参加したプロジェクトです。
森西:私は最初はデータサイエンス教育部の資料を作ったり、社内の業務改善のためにAIシステムを実装したりした後に、食品メーカーの需要予測の案件に携わりました。その後、西村と中外製薬様とのプロジェクトに入り、今は人材会社の求人レコメンドシステムのプロジェクトにアサインされたところです。
――本当にさまざまなプロジェクトに関わるのですね。これまでの経験で印象的だったことを教えてください。
西村:私はアパレル系企業のプロジェクトで、かなり新しい論文に掲載されていたアルゴリズムを実装までもっていけたことと、そのプロジェクトの中心人物としてリードできたことが大変勉強になりました。
森西:私は食品メーカーのプロジェクトが印象的でした。コロナ禍の経済動向を反映させながら、需要予測モデルをつくるものでしたが、前例がないのでとても難しかったです。「Coronavirus Project」の要素が入った論文を探して、片っ端からアブストラクト(要旨)を読み、試しにモデルをつくるということを繰り返しました。最終的にPoCフェーズで終わったのですが、チャレンジングで面白かったですね。
――プロジェクトにはどういった流れでアサインされるのですか。
西村:基本的には営業部からセクションマネジャーに案件の相談が来るので、マネジャーが案件数や工数、能力を見て、アサインするメンバーを決めています。
森西:クライアントからのご要望が起点ではあるのですが、それを受けて逆にデータサイエンティストから技術的なアプローチを提案し、プロジェクトを獲得することも多いと思います。
西村:営業段階でデータサイエンティストが提案内容や工数判断に関わっている場合、案件が正式なものになれば、そのデータサイエンティストがそのままプロジェクトにアサインされるのが自然です。
森西:先進技術にキャッチアップすることも重要なので、就業時間中の勉強会参加が認められているなど、技術研鑽のための時間確保を会社が支援してくれます。
――どういった業務に時間を使うことが多いですか。
西村:プロジェクト内容とそのフェーズによって全く違います。初期段階であれば、プロジェクトのゴールの定義、受領データがプロジェクト内容に適しているか確認、クライアントとデータ情報について齟齬がないか擦り合わせることなどに時間を使います。その後は分析をしながら、クライアントと方針確認のために1~2週間に1回ほどミーティングをしていきます。
森西:最終段階だと、最初に据えたゴールへの達成度の確認、その段階でのデータのとりまとめ、データ分析のコードを整えて再現性の担保、そして最終報告書の作成といったところでしょうか。その他、社内で開催されているいろいろな勉強会に、各自週1回、1時間ほどは参加していると思います。
森西氏
専門知識を含む教材作成の難しさ。内容にこだわり「バチバチやり合った」
――お二人が一緒に参加した、中外製薬との共同プロジェクトの概要について教えてください。
森西:「製薬業界向けのデータサイエンティスト育成プログラムをつくりたい」という中外製薬様のご要望をお手伝いするというプロジェクトでした。特に私たちが担当したのは、製薬業界の専門知識を含んだ教材をつくるという部分です。
西村:製薬業界向けとなると、データサイエンスの中でも、統計的仮説検定や臨床統計、疫学といった医療分野に特化した部分が必要だったんです。5カ月ほどのプロジェクトで、私たちを含む計4人が、その部分を新たに作りました。
――具体的にそれぞれどんな業務を担当したのでしょうか。
西村:私はもともと薬学の研究をしていたので、この分野に必要な要素を整理した上で、全体の構成を考えました。8つのコンテンツに分けて、それぞれ自分の専門やできる分野の資料を作っていきました。
森西:8つのコンテンツは、①製薬業界で扱うデータの一覧、②可視化、③臨床統計と疫学、④多重検定、⑤因果推論、⑥生存時間解析、⑦メタアナリシス、システマティックレビュー、⑧医療経済評価で構成しました。
この中で私は、研究していた因果推論や可視化を担当し、製薬業界の専門的なコンテンツは西村が作成しました。
――苦労したのはどんなところでしょうか。
西村:「統計学にすでに触れていて基礎的な知識を持っている人」が対象ということを前提に、コンテンツを取捨選択するところが難しかったです。1コンテンツにつき4時間程度の講義にまとめられるような教材にする必要があり、そこは苦労しました。結構、森西さんとはバチバチやり合いましたよね。
森西:はい。オンラインミーティングやパワーポイント上で大量のコメントで、「分かりにくい」とか「この手順はいらないんじゃないか」「この説明が足りないんじゃないか」とか……。
西村:それをするためには自分でも、この技術は実際にどんなときに使われるのかを意識する必要があり、改めて臨床試験や疫学の論文を読んだことで各技術への理解が深まりました。
森西:加えて、私は製薬業界というこれまで経験したことのないドメインにキャッチアップしながら、クライアントの要望に応えた教材をつくるというのが大変でした。今回は、中外製薬様に教えていただいたおすすめの書籍を読みつつ、自分でもいろいろと調べました。
一定の技術力は持ちながらも、キャリアの方向性によって立ち位置は変わってくる
――データサイエンスの実務に携わるにはPython、R、線形代数、微積分、統計学や機械学習の知識などが必要だとされていますが、どれから学ぶのがおすすめですか。
西村:前提として、大学の授業で単位が取れる程度に線形代数、微積分は理解しておく必要はあると思います。その上で、まずはPythonを学んだ方がいいでしょう。どんな理論を学んでも、それをデータに適用できなければ意味がないからです。Pythonでコードを打ちながら、統計学や機械学習を勉強していくのがいいんじゃないかと思います。
森西:私は文系だったので、先に統計学から学びました。ですが、あるところで統計学を深く理解できなくなり、学部3年生の時に他学部の授業を取って、線形代数や微積分を学びました。その後、研究でRやPythonを学んだという順番です。ですからやはり、西村と同じで数学をある程度学んでから、Pythonと機械学習を並行して勉強していくのがおすすめです。
――この特集では、データサイエンティスト、データアナリスト、機械学習エンジニア、データエンジニアの中で、自身がどの辺りに位置付けられるかを答えてもらっています。お二人の場合はいかがでしょうか。それぞれ教えてください。
西村:ALBERTは、先進的な技術にキャッチアップしていくところが強みですし、私個人としても力を入れているので、機械学習の利用は「有」で、クライアントの課題に常に向き合っているという点で考えると、ビジネス寄りでしょうね。
森西:私の場合は、チームとして良いものをつくれればいいという考え方なので、西村よりもビジネス寄りで、技術については都度対応するイメージで、この辺りにしました。
――ALBERTの中でも、人によって位置付けは違うのでしょうか。
西村:そうですね。キャリアの方向性によって、ALBERTのデータサイエンティスト内でも考え方が分かれるところだと思います。
――お二人は、今後どのような方向に進みたいと考えていますか。
西村:私は、技術的に難しい案件をどんどんこなせるようになりたいと思っています。
森西:私は一定の技術力を持ちつつ、チームで良いものをつくりたいというイメージを持っているので、今のところプロジェクトマネジャーが目標ですね。
会員登録すると
このコラムを保存して
いつでも見返せます
マッキンゼー ゴールドマン 三菱商事
P&G アクセンチュア
内定攻略 会員限定公開
トップ企業内定者が利用する外資就活ドットコム
この記事を友達に教える