相関
相関とは、「二次元以上の値がどれほど近いか?」という尺度である。
概要[編集]
相関係数は -1 と 0 と 1 の間にあるとする。
- ピアソンの積率相関係数
- スピアマンの順序相関係数
があり、前者は単なるベクトルの内積である。
理論[編集]
「中華料理といえば何か?」を十段階評価でアンケートを取ったとする。選択枝(選択肢)として「ラーメン」「チャーハン」「餃子」「シウマイ」「その他」などがあったとする。
同じく「カレーの具といえば何か?」を十段階評価でアンケートを取ったとして、「牛肉」「豚肉薄切り」「豚肉のカレー用」「鶏腿肉」「鶏ひな皮」「ジャガイモ」「ニンジン」「タマネギ」「ピーマン」「茄子」「トマト」「オクラ」「その他」という選択枝があったとする。
また、「おでんの具といえば何か?」で「がんもどき」「豆腐」「大根」「牛すじ肉」「すじ」「つみれ」「さつま揚げ(てんぷら)」「牛蒡巻き」「餃子巻」「ボール」「ちくわぶ」「魚河岸揚げ」「こんにゃく」「その他」という選択枝があったとする。
そうした場合、
- 中華料理
- カレーの具
- おでんの具
の間にどれほどの相関があるだろうか。これに出身地や年齢データが加わると、さらに解析のしがいがある。
生まれも育ちも関東の男性であるとするならば、「カレールーはハウス・ジャワカレーの中辛でカレー用の豚肉を使ってタマネギは入れるがジャガイモやニンジンの評価は低く、おでんの具は「がんも・とうふ・だいこん・ちくわぶ・すじ」といった人物像が浮かび上がってくるだろう。
こうした統計解析のとっかかりが相関であり、それが推計学につながってゆく。
人間生活との関わり・利用[編集]
意思決定には重要である。与党としては自由民主党と公明党があるわけだが、ベクトルが違うのは理解できるが「「因子」としてはどこが違うか」っという話にはなる。少なくとも日本共産党と自由民主党はベクトルが異なってはいる。
ただし、有権者を中心とした断面上で切ったときに、どのようなベクトルで表せれているかは不明確である。
「自民党に対する批判票として、日本共産党に投票した」という例もある。二番じゃなかったが好例。
その他[編集]
統計 ⇒ 相関 ⇒ 統計解析 ⇒ 推計学 という流れはあると思う。