マーケティング用語集平均値とは
→【関連サービス】 データ解析サービス
データの総和をデータの個数で割ったものを平均値(mean)といいます。
平均値の求め方
いま、ある製品ブランドXについて、調査対象者10名の年間購入量がそれぞれ以下の通りだったとします。
Aさん | Bさん | Cさん | Dさん | Eさん | Fさん | Gさん | Hさん | Iさん | Jさん |
---|---|---|---|---|---|---|---|---|---|
3個 | 4個 | 6個 | 4個 | 5個 | 3個 | 2個 | 4個 | 5個 | 6個 |
このとき、製品ブランドXの年間購入量の平均値は以下の計算式で求めることができます。
平均値=(3+4+6+4+5+3+2+4+5+6)/10=4.2
エクセルで計算する場合には、AVERAGE関数を使用することで、「=AVERAGE(範囲)」で簡単に求めることができます。
平均値を使う際の注意点
平均値は、データを要約して捉えることができ便利ですが、データに極端に小さな値や大きな値(外れ値)が含まれているとき、その影響を受けてしまうため注意が必要です。
例えば先ほどの例で、10名のうち一人(ここではJさんとします)の年間購入量が極端に多く、40個だったとします。
Aさん | Bさん | Cさん | Dさん | Eさん | Fさん | Gさん | Hさん | Iさん | Jさん |
---|---|---|---|---|---|---|---|---|---|
3個 | 4個 | 6個 | 4個 | 5個 | 3個 | 2個 | 4個 | 5個 | 40個 |
その場合、製品ブランドXの年間購入量の平均値は、以下の計算式から、7.6個となります。
平均値=(3+4+6+4+5+3+2+4+5+40)/10=7.6
しかし、あらためてデータを見てみると、10名の中で年間購入量が7個以上なのはJさんのみで、それ以外の9名は2~6個に分布しており、この10名の年間購入量を要約した値として7.6個というには違和感があります。このような場合には、要約した値として平均値以外の代表値(中央値や最頻値)を使うことや、特にデータの異常・取得時のミスが疑われる場合にはトリム平均(データの上下数%を除外して算出する平均値)を使うことなどを検討する必要があります。
下図のように、データの分布が左右非対称であるときにも、平均値がひっぱられてしまうため注意が必要です。
また、下図のように、データの分布の山が二つある場合(二峰性の分布)も、平均値で要約することが難しく注意が必要です。
平均値以外の代表値
平均値以外の代表値には、以下のようなものがあります。
- 中央値(median)
- データを大きさの順に並べたときに、真ん中にくる値を中央値といいます。データの数が偶数のときは、真ん中にくる2つの値を足して2で割ったものが中央値となります。
- 最頻値(mode)
- データの中で、もっとも頻度が高い値を最頻値といいます。