業務でも使用する機会は多々あるかと思います。
そこで重回帰モデルを構築する上で、統計の本には掲載されていない
大事なポイントについて記載したいと思います。
■一般的な重回帰式の作成ステップ
重回帰モデルを作るときは、主に4つのステップで行われることが
多いのではないかと考えています。
---
①良さげな説明変数をチョイス
②相関分析でマルチコの確認
③ステップワイズ法で重回帰式の作成
④自由度調整済み決定係数などで評価
---
■一般的な重回帰式作成上の問題点
ただし、この方法では確かに理論上で最適なモデルを得られるのですが、
アクションにつながるモデルを得られるかどうかは
運任せになってしまう傾向があります。
■アクションにつながるモデルって?
そもそもモデルの評価を行うときには主に下記の2点があるかと思います。
・実績値と理論値(決定係数)が当てはまりの良いものがいい
・説明変数の数(自由度)が少ない方がいい
これに加えて、実務ではモデルを評価する視点はもうひとつあります。
・コントロール出来る指標であるかどうか
(内部要因か、外部要因か)
例えば、需要予測をするときに、
GDPの伸び率などの経済指標が
説明変数としてよく当てはまりますが、
どんなに大きな企業であっても
コントロールできる指標ではありません。
広告出稿費など、自らコントロールできる
指標が入っていなければ、
予測値を向上させるための施策を検討する
ことが難しくなってきます。
■アクションにつながるモデルをつくるには?
ステップワイズ法などでモデルの目星をつけた後に
総当り法でモデルを抽出します。
説明変数が10個程度に絞ることができれば、
高々1024個程度のモデルの算出で終わりますし、
総当り法を実施できるツールをWEBに公開してくださる方々がいらっしゃるので
エクセルでも、Rでも総当り法をすることは簡単です。
総当り法でモデルをリスト化し、
「自由度調整済み決定係数」と「指標のコントロール可否」
で絞り込みを行えば採用できそうなモデルはすぐに2、3個のモデルにしぼり込めると思います。
コントロールできる指標を入って、しかも、当てはまりのいいモデルを作るというのは
実際に重回帰モデルの構築する業務においては難しいかと思いますが、
こうした視点をもって、アクションにつなげるモデルを構築する努力することが
大切だと思っています。