マーケティング用語集回帰分析とは
→【関連サービス】 データ解析サービス
身長のバラツキ
身長の高い父親の息子は、父親に似て身長が高いはずです。しかしまったく同じということはなく、息子たちの身長は父親の身長の上下にバラつくと仮定することができます。この仮定はしごくもっともらしく、だれにも納得してもらえそうです。
ところがこの仮定を認めると大変なことがおきます。身長の高い父親からは、さらに身長の高い息子が生まれる可能性があり、その息子が父親となってさらに身長の高い息子が生まれるかもしれません。その反対の身長が低いほうでも同様です。人類が誕生して数百万年における、ぼう大な世代交替によるバラツキの増大を想定すると、上の仮定はどうもまずいと言えます。
身長は回帰する
イギリスの遺伝学者F.ゴールトン(1822-1911)は、イギリスの1,000あまりの世帯について、同じ身長を持つ父親の息子たちの平均身長をグラフに描いてみて、「身長の高い父親の息子の平均身長は、その父親ほど高くない」または「身長の低い父親の息子たちの平均は、その父親ほど低くない」ということに気がつきました。そして、これを平均への「回帰(regression)」現象と呼びました。
この言葉は、サケが生まれた川に回帰する、あるいは頭上の太陽が地球の北回帰線、南回帰線まで来て戻るという意味で使われています。偏差とか相関とか無味乾燥な用語がほとんどを占める統計学に、このようなイメージ的な言葉がそのまま取り入れられているのは面白いことだと思います。
回帰分析
次のグラフは、10世帯についての家族数とある商品の購入量との関係を表したもので、その10個の点の間を通って直線が右上がりに引かれています。この線によって、家族数が多くなると購入量も多くなる傾向があることがわかります。この線のことを、回帰直線と呼びます。
回帰直線の数式化
この回帰直線は、ヨコ軸X、タテ軸Yのグラフ上で「y=a+bx」の1次方程式で表わすことができます。式における文字記号の意味は次の通りです。
- ○aの値
…回帰定数
回帰直線とタテ軸Yとの交点におけるyの大きさを表わします。
- ○bの値
…回帰係数
回帰直線の傾きを表わし、xの値が1だけ増えたときにyの値がbだけ増えることを表します。bの値はマイナスなら回帰直線は右下がりになります。
説明変数と目的変数
上の例でいえば、家族数xを「説明変数」、購入量yを「目的変数」と呼びます。説明変数は1個だけとかぎらず、例えば主婦年齢も説明変数に加えて、回帰式を
「y=a+b1x1+b2x2」
とすることもできます。このように説明変数が2個以上のときの回帰分析は「重回帰分析」と呼ばれて、マーケティングでは因果関係の分析そのほか多くの用途があります。