なんか色々メモ
目標は月一回以上更新となるべくビジネスに役立つ分析技術を書くことです。
2013年7月8日月曜日
データのクレンジング方法
色々とデータをいじっているのですが、
テキストデータを扱う場合は
awk、seqなどを使うと早く処理できるなーと思いつつ。
もっといい方法はないかなーと思っていたら、
sqliteは、どんなファイル形式であろうと、
一度sqliteに突っ込んでしまえばSQLになって、
RとかPythonとかとも連携できてしまうそうですね。
ローデータをsqliteに突っ込んでから、
クレンジングデータを作った上で、
分析するのがいいんでしょうかね。
これも試行錯誤が必要ですな。
具体的は手法の話については
こちら
。
次の投稿
前の投稿
ホーム