過去の記事で、準備作業の全体を紹介しましたが、
今回は、分析設計の方法について深掘りしたいと思います。
過去の記事:
データ分析前の準備作業 (概要)https://daaataaa.blogspot.jp/2015/10/blog-post.html
分析設計書の項目
分析設計書は書かなくても、分析できますが会社や研究などで作業を始めるときは作っておいた方が迷うことがなくなるのでスムーズです。
最低限書くべき項目は、
- 概要
- 目的
- 仮説
- データ
あったほうがいいものは、
- 作成する説明変数
- 分析ステップ
※これらの項目はこれが正解というものでもないので、適時カスタマイズしてください。
①概要
概要には、分析が必要となっている背景や状況を書きます。
あとで振り返るときなどに、なんでこの分析したんだっけ??
という状況を打破できます。打破打破。
②目的
目的には、何を明らかにするのかを書きます。
ビジネスオーナーと、アウトプットを明確にするための共通意識を形成するためのものです。
分析者とビジネスオーナーが一致する場合は不要ですが、あまりないと思います。
ビジネスオーナーとは分析をお願いする人です。会社では上司だったり、お客さんだったり、大学では教授とかになるんですかね?
※目的の設定は意外と難しい作業で慣れが必要です。
③仮説
目的とセットで作ります。何が要因となっているのか?どこを掘れば、目的を達成するためのインサイトを抽出できるのか?をビジネスオーナーと一緒に議論するたたき台にもなります。
あまり分析に関与するメンバーが少ない場面でも、これがあると「あそこも見なきゃ!あれもたさなきゃ!」みたいな雑念が消えるので目的を達成するための最短経路をつくれるなどの、メリットがたくさんできるのでおすすめです。
※雑念が出た場合はメモしておいて、次ステップに回したり、考察のしたりするときなどに使ったりできます。
④データ
分析に使うデータを定義します。
割りと企業なんかだと、例えば売上金額にしても、POSデータ、CRMの売上データなど同じデータでも複数のデータ・ソースがあるため、これもビジネスオーナーと認識をあわせるのに作っておいて、確認するという意味でも最初に明記しておくのがおすすめです。
補足:目的と仮説について
目的と仮説の書き方ですが、例えば目的を「CRMにおける離反モデル構築する」とした場合、仮説は、「離反は月次購入金額が影響するのか?、直近半年における日曜日の来店回数も影響するのか?」など書きます。箇条書きで整理すると分かりやすいと思います。
あったほうがいいもの①作成する説明変数
これも目的と仮説に対応させて作成します。
例えば、
月次購入金額 = 月数をキーにして売上金を合計する
など具体的な変数の作り方を書きます。
あったほうがいいもの①分析ステップ
分析する作業になれてくれば作らなくてもいいですが、先に作っておくと、
スムーズに分析作業をすすめることができます。
- 前処理
- ビジュアライズ
- モデリング
- レポーティング用のビジュアライズ、モデル詳細の出力
など予め必要となる作業ステップや、出力物をメモしておけるとスムーズです。
まとめ
分析設計は、
- 分析を達成するゴール設定を明確にする
- ゴールを達成するための手段を具体化する
- 目的と手段を分析に関わるメンバーに共有し、同じ認識を持つ
ために作りましょ!