こんちには、まさかめです!
皆さんはデータサイエンティストという職業を知っていますか?
データサイエンティストという職業は、
データサイエンティスト協会の定款によると下記のように定義されています。
データサイエンティスト(分析人材)とは、高度に情報化された社会において、日々複雑化及び増大化(ビッグデータ化)するデータを、利用者の利用目的に応じて情報を収集・分析する技術を有し、ビジネスにおいて実行可能な情報を作ることができる者をいう。
出典:データサイエンティスト協会 定款 第2条
https://www.datascientist.or.jp/about/statute/
ですが、この定義から具体的な仕事内容等が思い浮かぶ人は少ないのではないでしょうか?
そこで、「データサイエンティストに興味があるんだけど、具体的にどういったことをしてるの?」という人に向けて、現在某IT企業でデータサイエンティストとして働いている僕の仕事内容をお伝えしていきます!
データサイエンティストとは
先程データサイエンティストの定義をご紹介しましたが、
もっとわかりやすくデータサイエンティストを表すと⇩のようになると思います。
データを使って売上を作る or サポートする人
データを使って売上を作る例としては、
ビッグデータを用いて生産性を向上させるAIを作成し、
そのAIを商品として販売することなどが考えられます。
また、サポートの例としては、
「自社メディアへ訪れるユーザーのページ遷移率を調査し、CVへのボトルネックとなるページはどこか明らかにする」
「どういった属性のユーザーがCVしやすいかを調査し、広告配信対象を定める」
などが考えられます。
データサイエンティストの具体的な業務内容
先程は「データを使って売上を作る or サポートする人」がデータサイエンティストと紹介しました。
次に、「じゃあ、具体的にどういった業務内容なの?」といった部分について解説していきます!
要件定義
データサイエンティストが一番最初に必ず行うことが要件定義です。
- 今から行っていく作業は何のために行うのか
- いつまでに完了させることを目指すのか
- 誰がどういった作業を担当するのか
etc…
AIを作る・BIにまとめる・分析を行い打ち手を考える、、、
仕事を始める際は、最終的な着地地点や、その過程などを最初に固めます。
要件定義をおろそかにしてしまうと、
後々膨大なやり直し作業が発生することも考えられるので、
関係者の合意を得ることを忘れずに行っていきます。
データ抽出
プロジェクトの要件定義が定まったあとは、まずデータ抽出を行います。
データ抽出とは、データベースから各数値を抽出してくる工程を指し、
主にSQLを用いて行います。
データ加工
データ抽出が完了した後は、データ加工に移ります。
業務で扱うデータは欠損値や外れ値などが存在するため、
そういったデータをどう扱うか考慮しながら加工します。
データ分析
データを抽出・加工した後は、目的に応じて分析を行っていきます。
分析で終わる例
「自社メディアへ訪れるユーザーのページ遷移率を調査し、CVへのボトルネックとなるページはどこか明らかにする」といった目的の依頼であれば、
データを抽出▶加工▶分析
という手順で進み、分析結果をもとにメディアを改善できればOKです!
分析で終わらない例
例えば、これまで勘と経験で行っていた営業活動をデータドリブンで行っていきたいという依頼なのであれば、データを可視化し、わかりやすくBIにまとめていく作業が必要です。
また、どういったクライアントへアプローチすれば営業成功確率が高いかを予測したいという依頼なのであれば、AIを作成し営業活動に組み込んでいく必要があるかもしれません。
機械学習モデル作成・BI作成など
先程の項目で挙げたAI作成やBI作成が必要な場合は、
それらを作成していくこともデータサイエンティストの努めです。
評価・テスト
作成したAIは、
「どれくらいの精度なのか」
「実際の営業現場で使用できるようなものなのか」
を評価・テストしていきます。
運用
AIは作成することが目的ではなく、
AIを使って成果(大体は売上)を出していくことに意味があります。
そのため、作成したAIがどういったものなのか、
これを使うと何がどう改善されて、
どういったメリットに繋がるのかを関係者に共有していきます。
ここで非常に大切なのが「相手に自分の考えを伝える力」です。
まとめ
本記事では、データサイエンティストという職業とは何か?
具体的にどういった業務内容なのかを紹介しました。
もしデータサイエンティストに興味がある方で、なにか質問等があればぜひツイッターで聞いてください!