2015年10月14日水曜日

データ分析前の準備作業

データ分析をしたことがないのに、
いきなりRを触るのはハードルが高いですよね。。
データを分析する前の作業はどういったものがあるのかをご紹介します。

分析設計

ビジネスの現場において分析作業を始める前には、分析設計を行います。

 ①目的の作成
  ⇒分析によって解決したい課題は具体的に何か?

 ②分析ステップの作成
  ⇒目的を達成するための作業はどういったものはあるか?

 ③分析ストーリーの作成
  ⇒分析によって、どういった数値をだして、その数値に何を語らせるか?


分析に関わるメンバーが少なければ、これらをまとめる設計書はメモ程度のもので大丈夫。客先に提出したり、責任者の合意を得て進める分析プロジェクトであれば、エクセルやパワーポイントで資料化します。

データの収集

分析設計が終わったら、分析につかうデータを集めます。
大きく、2つの集め方があるかと思います。

 ①既存のデータを使う(人からもらう)
  ⇒たとえばデータベースを管理している人

 ②自らデータを作る(自分で作る)
  ⇒たとえば、アンケートを実施して、集める


特に前者は、どれだけデータベースに負荷をかけるのか?ネットワークの権限設定をする必要があるのか?など、システムやセキュリティに影響を及ぼす範囲を確認する必要があります。

データの確認

データを収集したあとに、データ確認をします。
データがきちんとしたものでないとわかった時が、
遅ければ遅いほど、手戻りの量が増えてしまうので、
この作業は、極力早い段階で実施することが需要です。

 ・レコードの数(何行のデータか?)
 ・データ期間(いつからいつまでのデータか?)
 ・欠損値の数(データに抜けはないか?)

これらの作業が終了したら、いざ集計作業となります。

データ分析前にすべき準備方法について参考になる本はこちら。