Search

キーワードを入力してください

マーケティング用語集標準偏差とは

分散の正の平方根を標準偏差といい、データのバラツキを表す指標として用いられます。

たくさんの数量データを圧縮する

ある商品Aの1カ月購入量を100世帯について調査し、その結果をまとめるときに、その方法として、次のような度数分布で表現することが考えられます。

購入量 なし 1個 2個 3個 4個 5個 6個 7個 購入世帯数 5 10 20 30 15 10 5 5

このデータを用いてグラフを描けば、購入量の多少による世帯数の分布、いわゆる度数分布型が視覚的にとらえられます。このとき、度数分布がどんな型であるかは次の3つの数値でおおよそ判断することができます。

標準偏差は、このうち「2. 分布の広がりの度合い」の指標として用いられます。

標準偏差

標準偏差は、以下の計算式で求めることができます。

s=√((1/n)Σ[i=1..n](x_i-xバー)^2) s:標準偏差 n:データの総数 x_i:各データの値 xバー:データの平均値

実際に計算すると「標準偏差」=1.68となります。ではこの数字はいったい分布の広がりの「何を」「どのように」あらわしているのでしょうか。

標準偏差の具体的な意味

いま平均値の前後に標準偏差の幅をとって下限および上限とし、前項の数値で計算すると、

下限=3.15-1.68=約1.5
上限=3.15+1.68=約4.8

となります。すると上表の分布の広がりのうち「購入量2個~4個」の65世帯がこの範囲に入ります。

ここであらためて、分布の形が異なる3つのケースの度数分布を架空データによって設定し、各ケースについて上のように平均値と標準偏差を計算し、さらに分布の下限上限を求めてその範囲に入るデータ数をカウントしました。すると、各ケースそれぞれ66%、67%、69%のデータが入りました。また、平均値から標準偏差の「2倍」をプラスマイナスした場合にも、同様にデータ数をカウントすると、以下のことがわかりました。

平均値から標準偏差の範囲内
データの2/3が入る
平均値から標準偏差の2倍の範囲内
データの95%が入る

このように、標準偏差を用いることで、分布の中心から一定の範囲に全データのどの程度がおさまるのかを知ることができます。

関連サービス