会員登録すると
このコラムを保存して、いつでも見返せます
生活インフラとして欠かせない情報通信を扱うNTTコミュニケーションズでも、データサイエンティストが活躍する場面は多い。
大学院でコンピューターサイエンスを学び、同社に入社した河合康平さんは、データ分析を基にして、同社が抱える課題を解決するコンサル業務を担当する。例えば、データ解析によって、電話やポータルサイトなどの顧客が同社と接点を持つ手段の満足度を高めている。
特集「データサイエンティストとは何者か」の第9回目は、河合さんが経験した業務における挑戦について詳述する。【斎藤公也】
1. 生活に欠かせないインフラ、情報通信に興味
2. 膨大な問い合わせ情報やポータルの利用情報を収集、整備
3. 機械学習の技術を習得し、課題解決のための多様な選択肢を提示できるようになりたい
生活に欠かせないインフラ、情報通信に興味
――大学における専攻や、NTTコミュニケーションズに入社した経緯を教えてください。
河合:大学では、コンピューターサイエンスを専攻していました。人間の脳波を解析して統計処理をした後、データを分類して特徴などを解析する、というようなことを研究していました。細かいデータをミリ秒単位で全部計測していくため、データは多次元で複雑になっていきます。その中からある特定のパターンだけを見つけたり、複雑性を解読したりする工程は、統計処理や機械学習のモデルととても相性が良いです。
学んできたことを生かすような仕事に就きたいと思い、就職活動を始めました。そんな中、欠かせない生活インフラとなった情報通信の分野に興味を持ち、グローバル展開にも注力していたNTTコミュニケーションズに魅力を感じ入社しました。
――入社後は、どんな業務を経験してきましたか。
河合:入社後まずサービス保守運用部門に配属になり、保守運用業務を支えるデータ基盤の開発およびビックデータの分析を担当しました。当社が展開するクラウドサービスなどを円滑に進めていくためには、データを集約して活用できるようにしていく必要があります。私はデータベースを作成して、それをビジネスに生かせるようにする業務を担っていました。
エンジニアリングの知識を得た上で、業務における課題を知ることができたのは、とても良い経験をしたと思っています。
そこで得たデータエンジニアリングの知識を生かしてさらにデータ分析業務をしたい思いがあり、R&D組織に異動し、データ分析の技術開発に従事しました。
その後、各部のデータ分析チームの集約に伴って新設部門(データドリブンマネジメント推進部門、以下DDM推進部門)の立ち上げから参画しました。現在は、この部門で社内向けのデータ分析コンサル業務に従事しています。
――現在所属する部門について、具体的に教えていただけますか。
河合:DDM推進部門は、全社のデータ収集、蓄積、活用を推進するとともに、データ活用人材の育成も担う独立した組織として2020年4月に発足しました。
営業部門や開発部門などの各事業部にもデータ活用を推進するチームは存在します。しかし、DDM推進部門は全社でのデータ活用を促進することを目指して、社内のデータを集約し、全社共通の分析基盤を整備、提供することで、各事業部をサポートする位置付けになっています。
――河合さんはどんな役割を担っていますか。
河合:当部門には主な役割が三つあります。データを分析して社内の課題解決に生かすコンサル業務、データを集約して活用できる基盤の作成、人材育成、の三つです。
私は、主に分析、コンサルティングを担当しています。データ蓄積できる環境の整備や、事業部内でデータ分析ができる人材を育成するための方法などについて、レクチャーすることもあります。
――どのような業務に時間を使うことが最も多いですか。
河合:事業部の課題分析とデータによる仮説検証に最も時間を使っています。
分析プロジェクトリーダーとして案件をリードすることが多く、事業部担当者と議論しながらデータ活用の課題を把握し、チームメンバーと協力してデータを用いた仮説検証を実施。その上で事業部からフィードバックをもらう、というサイクルを繰り返すことで案件を進めています。
データの性質や案件に応じた分類モデルの構築、コンテナ技術(※1)を活用した大規模なデータパイプラインの設計まで幅広く行うこともあります。その際はさらに、機械学習スキルの高いメンバーや、分析基盤チームと協力して業務を進めています。
※1 コンテナ技術……他の工程からは隔離されたアプリケーションの実行環境をOS上に構築、仮想的な動作環境をより少ないコンピューターリソースで実現する技術
課題を整理してデータを分析していったときに、課題解決に機械学習がフィットするなら、そのスキルを持つメンバーと業務を進めます。また、データとデータを接続させることで、分析が可能になるデータがあれば、基盤チームと共同で、データを流通させて接続させたりします。
膨大な問い合わせ情報やポータルの利用情報を収集、整備
――入社後、さまざまなプロジェクトに携わってきたと思います。印象に残っているプロジェクトについて、教えていただけますか。
河合:並行して複数の分析案件は進めていますが、その中で一つ取り上げるとすると、保守運用部門と共同で実行した、インターネット接続サービスなどのネットワークサービスに関する顧客接点(※2)の分析プロジェクトです。
プロジェクトの目的は、お客さまが電話で問い合わせをしなくても、お客さま自ら解決できるようなプロセスの促進を通して、顧客満足度の向上を実現することでした。そのため、顧客接点全体の状況をデータから把握して、効果的な改善方法を検討しました。
顧客接点といっても、お客さまと接点を持つ手段としては、電話の他、メールやチャット、ポータルサイトなどもあります。お客さまの要望を的確に把握するために見るべきデータ、そういったデータの活用方法などについて、コンサル業務を進めていきました。
※2顧客接点…企業が顧客と接する機会。主にコンタクトセンターやポータル利用状況など、サービスに関する対応。
プロジェクトでは、1年をかけて保守運用部門やR&D部門のメンバーと連携し、現場の課題整理を進めつつ、膨大な問い合わせ情報やポータルの利用情報を収集、整備していきました。
お客さまが本当に困っていることは何か、といった漠然とした疑問から、具体的にどのデータを使えば課題が解決できるか、というレベルまで落とし込んでいく必要がありました。
さらに、テキストマイニング技術(※3)も組み合わせることで、より詳細に顧客接点を分析できないかも検討しました。お客さまからの問い合わせに対応したオペレーターが書いたメモを分析するために、テキストマイニング技術が必要でした。この取り組みにより、電話問い合わせやポータルの利用状況まで、お客さまの課題をデータから把握できるようになりました。
※3テキストマイニング技術…大量の文章データから必要な情報を取り出すこと
現在はネットワークサービスに限らず、音声やアプリケーション、クラウドサービスまでサービスを横断的に分析できるように対象領域を拡大しながら進めています。
――河合さんは、そのプロジェクトでどのような役割を果たしましたか。
河合:分析プロジェクトのリーダーとして、事業部と分析部門をつなぐ役割を担いつつ、部署横断での分析、要件・課題の整理からデータの収集、可視化までの一連のプロセスを担当しました。
より専門的技術が求められるテキストマイニング分野はR&Dチームに、事業部の実務知識が必要な箇所は保守運用業務の担当者にサポートしてもらうことで、分析プロジェクト全体を推進することができました。
――膨大な量のデータを扱わなければならない業務だと思います。苦労したこともあったのではないですか。
河合:データから顧客接点全体を分析するためには、お客さまが問い合わせをするポータルサイトのデータと、電話による問い合わせのデータを組み合わせる必要がありました。これらはデータの形式だけではなく、ネットワーク環境も全く異なっていたため、データの収集、整備に非常に苦労しました。
保守運用部門で培ったネットワークやサーバー、 データベースといったデータエンジニアリングの知識を基に、大規模なデータ流通や収集のノウハウを持っていたR&D部門チームの協力を得ながら、全く異なるデータソースからデータを集め分析できる環境を整備しました。
お客さまがポータルサイトを使うたびにログが記録されるデータベースがあります。データを分析したい人は、分析ができる環境にデータを移動させる必要があります。データを分析したい場所に自動的にデータを移動させたり、定期的にコピーしたり、使いやすい形に加工できれば、分析の準備コストが下がります。
――苦労があった分、学んだことも多かったですか。
河合:そうですね。データ活用の課題を解決するためには、ビジネス課題を整理するスキル、データエンジニアリングのスキル、そして分析スキルの全てが必要であることを強く感じました。
今回のプロジェクトを通じて、各分野の専門知識を持つメンバーからサポートは受けつつも、全ての分野に自ら参加しながら業務を進められたので、それぞれの重要性を学ぶことができたのが良かったと考えています。
課題感や目的がないと、データを集めたり、エンジニアリングをしても、要件を満たさないこともあります。目的の設計が重要だと、コンサル業務を通じて感じています。正しく情報を集めてくるためには、課題を正確に把握しなければならないと思います。
機械学習の技術を習得し、課題解決のための多様な選択肢を提示できるようになりたい
――今回の特集では、データサイエンス周辺の仕事をキャリアの観点から大まかに「データサイエンティスト」「機械学習エンジニア」「データアナリスト」「データエンジニア」の4つに分類しています。以下の図において、ご自身はどの辺りにマッピングされ得ると認識していますか。
河合:データアナリストとデータエンジニアの中間層に位置していると思います。データを収集、蓄積、整備し活用するためのエンジニアリングの知識、そのデータをビジネスに生かすための業務課題の整理、そしてデータを駆動させる業務の実現に関する知識が、現在の業務の主となる部分だと考えているからです。
――河合さんが思い描く、今後のキャリア、スキルアップの戦略を教えてください。
河合:よりデータ活用の幅を広げるためにも、機械学習分野のスキルを身に付けていきたいと考えています。
というのも、社内のデータ分析のコンサル業務を進めるにつれて、データを使ってどんなことができるのか、多様な選択肢をこちらから提案していくことが重要だと強く感じているからです。
機械学習分野ではさまざまな手法が日々開発されているので、これらをキャッチアップしながら、ビジネスにおける課題の解決の選択肢として提示できるようになりたいと考えています。
――データサイエンスの実務に携わるにはPython、R、線形代数、微積分、統計学や機械学習の知識などが必要とされていますが、ご自身はどれから身に付けましたか。
河合:大学時代に基礎的なRや線形代数、微積分、統計学は学んでいましたが、実務で使えるレベルではありませんでした。最初に実務レベルで身に付けたのは、新卒で配属された保守運用部門で扱った、データエンジニアリング(Linux、SQLなど)の知識でした。そこからR&D組織に配属され、実務で扱うR、Python、統計学といったスキルを身に付けていきました。
これからデータサイエンスの仕事に就くにあたって学ぶ重要性が高いと思うのは、データエンジニアリングの分野です。活用したいデータの対象は膨大で、それを扱うアーキテクチャーも複雑になってきています。
基礎的なLinuxやSQLの知識はもちろん、コンテナ技術やAmazon Web Service(AWS)、Microsoft Azure、Google Cloud Platform(GCP)などの各種SaaSサービスにも触れておく。そうすることで、データサイエンス分野の活用範囲を広げることができ、機械学習領域でもアナリストの領域でも全てに共通したスキルになると考えています。
会員登録すると
このコラムを保存して
いつでも見返せます
マッキンゼー ゴールドマン 三菱商事
P&G アクセンチュア
内定攻略 会員限定公開
トップ企業内定者が利用する外資就活ドットコム
この記事を友達に教える