2014年4月25日金曜日

お手軽すぎるビッグデータ解析ツール


H2Oというツールがあるらしいです。
「もらったCSVファイルが重くてエクセルで集計できない。」とか、
「機械学習的なことしたいけど、プログラミングなんかできないわよ。」とか、
「ガラポンでディープラーニングやってみたいわー。」とかとか、

というときに良さそうな感じのツールなので、記事にしてみました。
リンク先からダウンロードできます。
操作方法は丁寧に書いてあるし、
入出力の操作方法もシンプルなのでわかりやすいです。


以下は、試してみたことをメモしています。

■ダウンロードとインストール

https://s3.amazonaws.com/h2o-release/h2o/rel-kahan/10/index.html
 ここからダウンロード&インストールできます。

■いざ、操作〜データの取得〜

・ターミナルでシステムを起動しますが、ブラウザで操作するみたいです。
  初心者にも安心感たっぷりのUIでした。
 
 ・一番左のTry it!をクリックするとテスト用のデータが用意ある。

・CSVはuploadからインポートできるみたいです。

・いろいろと設定できるみたいですが、何をしなくてもよかったです。
 ダウンロードしたirisデータを選択して、そのままsubmit。

 ・データの入力が完了しインプットが完了したみたいです。
 iris.hexという名前で登録されたそう。

 ■いじってみる 〜簡易集計〜

  ・無駄なメニューが多くなくって本当にいいですね
    
  ・先ほど登録したデータを入力

   ・集計する変数を選択して、Submit
   ・集計結果が表示される

 

■さらにいじってみる 〜ディープラーニング〜

  
   ・ディープラーニングもデータ名と応答変数を指定するだけで
  分析できちゃう手軽さがいいですね。

   
・結果もすぐにポン!!




以上、手軽にできる分析ツールの紹介でした。
感想としてはとっても凄そうなツールですが、
正直まだよくわかんないですね。。
GLMとGLM2の違いとかとか。。

※インストール作業もろもろ、
 ご自己のお責任となりますので、
 実際にお試しする場合には
 くれぐれも十分おきをつけくださいませ。。