Search

キーワードを入力してください

マーケティング用語集主成分分析とは

「主成分分析」とは、統計学上のデータ解析手法のひとつです。たくさんの量的な説明変数を、より少ない指標や合成変数(複数の変数が合体したもの)に要約する手法です。この要約は「次元の縮約」という表現で呼ばれることもあります。要約した合成変数のことを「主成分」と呼びます。

わかりやすく言えば、たくさんの次元(指標)のデータから、全体をわかりやすく見通しの良い1~3程度の次元に要約していくことです。たとえば、身長と体重という2次元から、BMI(ボディマス指数)という肥満度を表す1次元の指標に要約するのが主成分分析、と言えばイメージしやすいでしょうか。

ビッグデータは多変量、多次元であるためそのままでは理解しにくいですが、主成分分析を行うことにより、データの持つ情報をできる限り損なわず、かつデータ全体の雰囲気を可視化し、誰もが理解しやすい形にすることが可能です。

たとえば、10科目のテストを実施している学校があるとしましょう。テスト結果を分析する際、ある教科の点数と別の教科の点数は単純に比較できません。平均点も違えば、点数分布も違うからです。
このとき主成分分析を行えば、第1主成分に総合成績、第2主成分に文系科目/理系科目という指標で、各学生の能力を可視化できます。ある学生の総合的な学力がどのくらいなのか、文系と理系のどちらの能力が高いのかが一目瞭然になるのです。

こちらの例を参考にしたモデル図が、下記になります。

principal01.PNG

主成分分析の手順

主成分分析は、多数の変数を分析するための統計手法である「多変量解析」の中でも、明確な結果変数(目的変数)が存在しない分析手法です。しかし、ビジネス上の目的は明確化しておく必要があります。具体例を挙げて、分析手順を見ていきましょう。

Step1/分析の目的を明確化する
スーパーの生鮮担当からグロサリー担当へ異動になったAさん。ペットボトル飲料の棚変更に合わせて、POSデータによる売れ筋分析だけでなく、顧客の嗜好に合わせた棚づくりをしたいと考え、顧客アンケートを元に売場をリニューアルすることに決めました。

Step2/顧客アンケート収集
Aさんは売場での試飲会や、サンプル商品の配布などでアンケートを行い、各商品を好き嫌い、美味しさ、飲みやすさといった10軸の指標で5段階評価してもらいました。合わせて、売上数や値段などのデータも集めました。単位が違い、条件も異なるデータですが、分析前にデータの標準化を行うことにより、比較が可能になります。

Step3/統計ソフトで主成分分析
分析は統計ソフトで行います。エクセルでもある程度まではできますし、エクセルに加える統計用のアドインソフトもあります。そしてフリーウェアの「R」や、企業や学術・研究機関では「JMP」「SPSS」「SAS」「MATLAB」といった有料ソフトもよく利用されています。

ソフトは実行してしまえば計算過程は見えませんが、アルゴリズム(手順)はこのようになっています。

●主成分分析のアルゴリズム
1)全データの重心(平均値)を算出
2)重心からデータの分散(ばらつき)が最大となる方向(第1主成分)を算出
3)第1主成分と直角に交わる(直交)方向で分散が最大となる箇所(第2主成分)を算出
4)直近の主成分と直交する方向で分散が最大となる箇所(第3主成分)を算出
5)4)をデータの次元分だけ繰り返す

Step4/主成分分析結果が判明
そのアルゴリズムを通して、統計ソフトからは主成分分析の結果が下記のような形で表示されます。

principal02.PNG

主成分分析を理解するために必要な用語集

【データの標準化】
データの標準化とは、「売上個数」「広告費」「価格」など、様々な単位のデータを扱う際、尺度を揃えて各データの相対的な位置関係を表すために用いる方法で、統計学では通常、平均が0、分散が1となるようにデータを変換することを指します。日常でいうと、偏差値やIQは、標準化されたデータの一つです。

【固有値】
固有値とは各主成分が含んでいる情報の大きさを示す指標です。一般的に「固有値が1以上」ある主成分が、元のデータとの関連が深いとされます。

【寄与率】
寄与率とは、この主成分だけで元のデータの何割を説明することができているかを表した数字です。今回の場合、第1主成分で元データの62%までを説明できていることになります。要約すると必ず漏れてしまう情報があり、そのために第2主成分以降が必要となります。

【累積寄与率】
第2、第3と続く主成分の各寄与率を足した数値です。一般的に累積寄与率が80%以上となるまでの主成分を分析に使います。今回の場合、第2主成分までで80%を超えたので、ここまでで分析します。

【主成分負荷量】
元データの各変数(数値)に対して与えられる係数です。この数値が大きいほど、各変数が主成分に与える影響力が大きいことを表します。

【主成分得点】
元データの各変数を合成した変数となる各主成分を軸とした場合の各変数の得点を表します。主成分は分析に用いて変数の数だけ出来上がりますが、通常、2つの主成分を組み合わせた散布図を作成して分析を進めます。各変数の位置関係を見ることで、それぞれの特徴が可視化されます。

▼主成分得点による散布図

principal03.PNG

Step5/顧客の評価する飲料とは?
統計ソフトでさらに各商品の第1主成分(横軸)と第2主成分(縦軸)の主成分得点を商品毎に算出し、散布図を作成しました。統計ソフトでは数値は出てきますが、それぞれの主成分が何を表しているのかは出てきません。第1主成分は一般的に総合評価ですが、第2以降の主成分は分析者が解釈する必要があります。Aさんは各商品の位置関係から、第2主成分は「爽快感」、しかも味の強くない喉ごしの爽快感だと解釈しました。

principal04.PNG

Step6/主成分分析を活かして売場改革
アンケートを行った時期は秋も深く、本来なら珈琲のような温飲料で味のしっかりした飲料を中心に揃えるのですが、主成分分析の結果をヒントに、Aさんは水やお茶を増やしてみることにしました。水Aは価格が高いこともあり、棚の上に数本あるだけでしたが、目立つ位置に置いてみることも決めました。新商品の仕入れや売場のポップ作成でも、「味の濃くない爽快なもの」に注目していくことも売場で確認しました。

以上が、具体例を使った主成分分析の手順と、分析結果の活用例になります。

主成分分析を用いるケース

主成分分析はマーケティングや研究開発など、さまざまな分野で使われてきました。たとえば下記のような活用方法です。

●アンケート調査の結果分析で活用
主成分分析で最も多い活用法は、顧客満足度調査やブランドイメージ調査、利用者調査などのアンケート結果の分析でしょう。数多くの質問に対する顧客の回答データを主成分分析し、総合評価を出したり、顧客が重視している点を推測したりするといった使い方です。さらに、主成分得点を基に顧客セグメントがどういう嗜好なのかというポートフォリオを作成したり、第2主成分以降の内容から顧客が評価している軸を探って商品開発に活かしたりといった活用も進んでいます。

●メディアの企業や商品評価で活用
新聞やテレビなどのメディアで掲載される企業ランキングは、一般的には主成分分析での総合指標によって評価されています。たとえば日本経済新聞の環境経営度調査や品質経営度調査でも、主成分分析の主成分によるランキングが採用されています。

●研究開発で活用
研究開発は数多くの材料を使って実験を行い、膨大なデータが蓄積されていきます。それを分析する際にも主成分分析が使われます。たとえばお酒造りの際、さまざまな酵母をさまざまな条件で試した実験結果を主成分分析すると、総合点の他に、酵母のどういう特性が存在するか、また他の多変量分析と合わせてどの特性がお酒の味に好影響を及ぼすのかを推測できるようになります。

●画像処理で活用
画像補正技術にも応用されています。解像度の低い画像をきれいな画像に修正する際や拡大する際に、粗い部分の周辺にある色情報から、どの色を間に加えれば自然な画像になるかを決定します。

※解説に使用しているデータ、図版はダミーのものです