マーケティング用語集標準偏差とは
→【関連サービス】 データ解析サービス
分散の正の平方根を標準偏差といい、データのバラツキを表す指標として用いられます。
たくさんの数量データを圧縮する
ある商品Aの1カ月購入量を100世帯について調査し、その結果をまとめるときに、その方法として、次のような度数分布で表現することが考えられます。
このデータを用いてグラフを描けば、購入量の多少による世帯数の分布、いわゆる度数分布型が視覚的にとらえられます。このとき、度数分布がどんな型であるかは次の3つの数値でおおよそ判断することができます。
- 1.
分布の中心の位置
- 2.
分布の広がりの度合い
- 3.
分布の左右の非対称度
標準偏差は、このうち「2. 分布の広がりの度合い」の指標として用いられます。
標準偏差
標準偏差は、以下の計算式で求めることができます。
実際に計算すると「標準偏差」=1.68となります。ではこの数字はいったい分布の広がりの「何を」「どのように」あらわしているのでしょうか。
標準偏差の具体的な意味
いま平均値の前後に標準偏差の幅をとって下限および上限とし、前項の数値で計算すると、
下限=3.15-1.68=約1.5
上限=3.15+1.68=約4.8
となります。すると上表の分布の広がりのうち「購入量2個~4個」の65世帯がこの範囲に入ります。
ここであらためて、分布の形が異なる3つのケースの度数分布を架空データによって設定し、各ケースについて上のように平均値と標準偏差を計算し、さらに分布の下限上限を求めてその範囲に入るデータ数をカウントしました。すると、各ケースそれぞれ66%、67%、69%のデータが入りました。また、平均値から標準偏差の「2倍」をプラスマイナスした場合にも、同様にデータ数をカウントすると、以下のことがわかりました。
- 平均値から標準偏差の範囲内
- データの2/3が入る
- 平均値から標準偏差の2倍の範囲内
- データの95%が入る
このように、標準偏差を用いることで、分布の中心から一定の範囲に全データのどの程度がおさまるのかを知ることができます。