会員登録すると
このコラムを保存して、いつでも見返せます
「前例がないプロダクトのモデルを構築する。苦労しましたが、それこそが面白かった部分」。そう語るのは、コンサルティングファームのデータサイエンティストとしてキャリアをスタートし、現在はfreeeで金融領域などのデータ分析に携わる、福田幸太郎さん。彼が取り組んだのは、法人カード「freeeカード Unlimited」の開発プロジェクトだ。
このカードは、従来の事業用クレジットカードを発行できない、または少ない限度額しか設定できない小規模事業者の資金繰りをサポートする、他に類を見ないもの。福田さんは「freeeならではのユニークなデータ群」とする多数の中小企業の会計データを分析し、独自のモデルを作ることで、前例のないプロダクトを生み出した。
特集「データサイエンティストとは何者か」の第6弾では、「freeeカード Unlimited」のプロジェクトを中心に、freeeにおけるデータサイエンティストの仕事を詳らかにする。【南部香織】
1. コンサルでは他社のデータを扱うもどかしさを感じ、freeeの独自性に引かれて転職
2. 与信モデルを作り上げるまでに約3カ月。前例がない中、試行錯誤した
3. 業務時間の配分は、社内の相談事対応とデータサイエンティスト起点のプロジェクトが2:8
4. データ分析以外に専門領域はなし。目の前のプロジェクトで得た知識を別分野で活用したい
5. まずは実地から取り組むのがおすすめ。でも専門家を目指すなら理論は必要
コンサルでは他社のデータを扱うもどかしさを感じ、freeeの独自性に引かれて転職
――現職に就くまでの経緯を教えてください。
福田:学生時代は理論化学の研究をしていました。理論化学というのは理論や数式を基に物質の性質を予測し、それを実験系研究者に実証してもらい、また計算して予測するということを繰り返すような学問です。Pythonはそのときから使っていました。
新卒でアクセンチュアに入社し、そこでデータサイエンティストになりました。その後、freeeにお声掛けいただいて入社しています。
入社後は、一貫してfreee finance labの分析やR&Dを担当しています。freee finance labはfreeeの子会社ですが、社内では金融の一事業部のような位置付けです。私はfreee本社Analyticsチームのマネージャーとして、他事業部もいくつか兼任し、データ分析に関わる部分に責任を持っています。
――学生時代からデータサイエンティストを志望されていたのでしょうか。
福田:いえ、実はそうではないんです。当時のアクセンチュアはデジタル職としての採用で、データサイエンティスト以外の職種になる可能性もありました。私はコンサルティングファームで経験を積みたい気持ちの方が強く、データサイエンティストになったのは成り行きの部分が大きいです。
とはいえ、アクセンチュアではいろいろなプロジェクトに関わり、素晴らしい経験を積ませてもらいました。
――アクセンチュアからfreeeには、なぜ転職しようと思ったのですか。
福田:二つ理由があります。一つはありがちかもしれないですが、コンサルティングファームでは、携わっているプロジェクトが他社のものであるという点です。
例えば、データ分析をするにあたって、クライアントにデータをもらう必要があります。それには時間もかかりますし、セキュリティーの問題で社外にそのまま渡せないとされるデータもある。もらってからも、使える状態に加工したり、そもそも取得方法を変える必要があったりすることも多いです。
クライアントの会社の社員として作業ができれば、「もっと短期間でデータ分析を使ったビジネス価値を出すことができるのに」ともどかしく感じることも多かったため、事業会社への転職は魅力的に映りました。
もう一つは、freeeは特殊なデータを多く持っていることです。私たちは基本的に統合型クラウド会計ソフトを出している会社なので、中小企業の会計データの蓄積があり、それを活用することで、分析の価値が出せると思いました。そういったユニークなポジションにも引かれて入社しました。
与信モデルを作り上げるまでに約3カ月。前例がない中、試行錯誤した
――今回、法人カード「freeeカード Unlimited」の開発プロジェクトに携わったと聞いています。どういったプロジェクトなのでしょうか。
福田:従来の法人カードでは高い限度額を得ることができなかったスタートアップに向けて、それを可能にする「freeeカード Unlimited」というプロダクトを開発するプロジェクトです。現在はβ版をリリースし、実際に創業期のスタートアップの方々に使い始めていただいているところですね。
――福田さんはどういった業務を担当されたのでしょうか。
福田:プロダクト自体の構想はビジネスサイドからの提案があったので、私が担当したのはそれを具現化する部分です。今回のプロジェクトでいうと、そのために、私たちが持っている中小企業の会計データを基に、独自に限度額を決定する与信モデルを作りました。
具体的には、今当社にあるデータだとどんなふうにモデルを作れるかを考え、要件定義をします。その後、必要なデータを集めて基礎集計し、実際にできる部分とできない部分をつかんだ上で、モデルを構築していきました。
――その作業にどのくらい時間がかかりましたか。
福田:3カ月くらいですね。データ分析としては一般的なスピードですが、元々データを持っていることと、ベンチャー企業なので社内調整に時間がかからなかったというところで、クイックにできた部分はあると思います。
――何人ぐらいのプロジェクトなのでしょうか。
福田:プロジェクト発足時は、ビジネスサイドが数人と私だけでした。ですので、与信モデルを作る段階までは私一人で行っています。プロジェクトが進むのに伴って、データサイエンティストはもちろんのこと、いまではマーケターやエンジニア、プロジェクトマネージャーなどメンバーは増えています。
――与信モデルを作るにあたって苦労したのはどんなところですか。
福田:前例がないプロダクトなので、参考にできるものが国内にあまりなく、ほぼ自分で考えて作らなければならなかったところです。海外にならば似たようなカードビジネスが幾つかあったので、それを参考にしました。
とはいえ、詳細がオープンになっているわけではないので、その部分は推測しつつ、これを私たちでやるならどのような設計にし、どのようなモデリングにするのかを試行錯誤しながら進めていきました。
また当社は、他の金融機関のように何十年にもわたって蓄積された融資やカード与信の結果のデータは持っていません。その中でどう変数を選定していくのかが難しかったですね。でも、それが面白いところでもありました。
――前例がない中で、他にアイデアを出すために工夫したことはありますか。
福田:金融に詳しいメンバーの知見をなるべく取り入れ、再解釈したことです。私はデータ分析の専門家ですが、金融の専門家ではありません。当社の金融の事業部には、その分野に非常に詳しい人が何人かいるんです。その人たちから、例えば銀行の与信で大事にしていることを聞いて、それをこの会社でブラッシュアップして表現するなら……と考えて、モデルに生かしていきました。
業務時間の配分は、社内の相談事対応とデータサイエンティスト起点のプロジェクトが2:8
――freee内において、データサイエンティストの業務が発生する一般的な流れを教えてください。
福田:大きく2パターンあります。一つは社内からの相談事を受けるパターン。もう一つは、データサイエンティスト目線でこんな分析をした方がいいのではとか、もっとこんなふうにデータが得られるのではといった、こちらから提案するパターンです。
前者は社内のコミュニケーションツールに“ご相談部屋”のような場所があって、そこに寄せられた相談を解決していきます。数字を出せばすぐに終わるようなことから、そこから長めのプロジェクトになることもあります。
後者は、普段からさまざまな部署の社員とコミュニケーションを取っていく中で、気付いたことや課題をなんとなく感じ取り、私たちで解決できそうなことをプロジェクト化していくようなイメージですね。その2パターンの割合は、大体2:8ぐらいです。
――所属するチームの規模や構成はどのようなものでしょうか。
福田:私が所属しているAnalyticsチームは、インターンを含め10~15人で構成されています。そのうち、私を含めた3人はマネージャーです。
――普段はどのような業務に、どのくらい時間を使うのですか。
福田:プロジェクトのフェーズによって、時間の使い方は全く異なります。先ほどの「freeeカード Unlimited」の与信モデルを作る段階だと、3カ月ほとんどそれにかかりきりになります。
そういうときは、業務の7~8割くらいはデータ分析に時間を使い、残りの2~3割はマネジメント業務に使っています。マネージャーではないデータサイエンティストは、この場合10割、データ分析に時間を使うことになると思います。
プロジェクトが山場でないときは、マネジメント業務以外の7割を、先ほど伝えたような他事業部のKPI(重要業績評価指標)の数字をどう検証するかといった社内相談の対応などに費やしているイメージです。ただ、この辺りの配分は人の志向によって差があり、必ず決まっているわけではありません。
データ分析以外に専門領域はなし。目の前のプロジェクトで得た知識を別分野で活用したい
――今回の特集では、データサイエンティスト、データアナリスト、機械学習エンジニア、データエンジニアの中で自身がどの辺りに位置付けられるかを答えてもらっています。福田さんはどうお考えでしょうか。
福田:私は多分、データサイエンティストとデータアナリストが重なる部分くらいに位置していて、さらにかなりビジネス系に寄っていると思います。機械学習ももちろん使うのですが、コンサル出身ということもあって、ビジネススキルの方が強いイメージです。
――御社の他のデータサイエンティストの方も同じ所に位置しますか。
福田:社内全体でいうと、機械学習エンジニアやデータエンジニアのチームもありますが、私の所属しているチームでは事業部のビジネスサイドの社員と話す機会が多いので、ビジネス系寄りになりがちだと思います。
――ご自身の今後のキャリアはどのように考えていますか。
福田:私はデータ分析以外で、特にここという深いドメインは持っていないのですが、逆にどんなことでも早くキャッチアップすることを得意としています。目の前のプロジェクトには誰よりも深く向き合うので、詳しい部分が点在しているイメージです。その経験を別分野に転用し、全く新しいアイデアを出していけるようになりたいと思っています。
もう一つは、そこでしかできない面白いことをやりたいと思っているので、freeeしか持ってないデータで、freeeでしか出せない価値を出していきたいですね。
――まさに今回のプロジェクトはそれに当たりそうですね。
福田:そうですね。これで私がこの会社に来てやりたかったことは、一つかないました。ですので、既存のビジネスを伸ばす部分もやっていきたいと思っています。
まずは実地から取り組むのがおすすめ。でも専門家を目指すなら理論は必要
――データサイエンティストを目指す学生や若手のデータサイエンティストから、何から学べばいいか分からないという悩みをよく聞きます。福田さんはどうお考えですか。
福田:難しい質問ですね。私は大学の学部で必修でしたので、データ分析の基礎となる、線形代数や微分・積分はそこで学んでいます。また、Pythonは大学院の研究室で必要でしたので、そこから使い始めたという感じです。社会人になってから学んだのは、機械学習のアルゴリズムやそういったデータをPythonで扱うスキルです。
でも、もし最初からやり直せるなら、取りあえずKaggleに挑戦したり、分析を始めてみたり実地から始めると思います。というのも、プログラミングも言語の一つなので、英語などと同じように使わないと身に付かないんですよね。だから、まずは使う環境に身を置く。
そのうち、例えば機械学習のアルゴリズムを扱っていると、細かいパラメーターを選ぶ段階でなぜこれを選ぶのか、理屈を知らないと納得できないところに到達すると思います。そのときに初めて、線形代数などの数学を学べばいいのではないでしょうか。
データサイエンス‟ぽい”ことができる人が増えていく中で、専門家を名乗るなら、いずれそこは知らないといけないと思います。
会員登録すると
このコラムを保存して
いつでも見返せます
マッキンゼー ゴールドマン 三菱商事
P&G アクセンチュア
内定攻略 会員限定公開
トップ企業内定者が利用する外資就活ドットコム
この記事を友達に教える