平均値

出典: 謎の百科事典もどき『エンペディア(Enpedia)』
ナビゲーションに移動 検索に移動

平均値(へいきんち)とは、統計学において、全てのデータの値を足し合わせた後、データの個数(件数)で割った値のことである。

たとえば、3人の生徒のテストの点数が「30点・50点・70点」であれば、平均値は (30+50+70)÷3 で「50点」となる。

「平均値」はどの程度、役に立つか?[編集]

「数字は嘘をつかないが、嘘吐きは数字を使う」by マーク・トゥエイン[1]

分布が正規分布であれば、平均値は最頻値でありかつ全体のちょうど真ん中、即ち一番普通の値となる。そのため、平均値は便利な値と言えるが、現実の分布傾向ではかえって実態を見えづらくすることもある。以下は、平均値の「過信」を戒めるため、よく引き合いに出される「笑い話」である。

  • 人間は、1人あたり平均1個の金玉を持っている。(世界の男女比はほぼ半々であるため。しかし、実際にはそのような人はほぼいない。[2]
  • 日本全国の校長は、1人あたり平均1.2人を買春している。(公立中学校の元校長・高島雄平は、12,600人以上をフィリピンで売春しているため。日本全国にいる校長の数はおよそ一万人のため、1人あたり平均1.2人となる。)

上記の様な笑い話でなくとも、同様の数値分布になるケースはあり得る。そのため、実態を正しく掴むためには、平均値の他にも中央値(メジアン・モードなどいろいろある)など様々な指標を、時と場合に応じてうまく使い分ける必要がある。
個々の標本値(サンプル)を多次元のデータと見なすと、平均値はサンプル集合の重心にあたる。ただし、百点満点のテストでマイナス五十点とか百二十点とかを取る奴はいないわけで、まず「偏っていないか?」を疑う必要がある。次に「どの程度のバラツキがあるか?」の指標として標準偏差(σ(シグマ)という)を求め、「平均値からどれだけズレているか?」を調べる。この値がσの三倍を超えると異常値とされることが多いため、「3σ限界」と呼ばれることがある。
次に見るべきは「相関」であり、「数学ができる奴は物理もできる」ことが確からしいとなれば普通だが、数学が国語や社会と相関があったとすると「なぜだろう?」といった話にもなる。そこからいろいろと情報を引き出すのが統計学というものである。

一方、統計家の西内啓は著書『統計学が最強の学問である』のなかで、「ビジネスで成果を上げること」を目的にするならば「平均値」は積極的に利用すべきであると力説している。例えば、ある商品の売上の平均値が上がったとき、多くの人に少しずつ買われたのか、一部の人が爆買いしたのかは実は重要ではない。原因が何であれ、全体としての売上が上がったことがビジネスにおいては重要である。

現実のビジネスで、全てのデータを採取・計算することは余りにもコストが高く、費用対効果が望めない。従って、一部のデータをサンプリングして戦略を立てることを考えなければならない。「全データの実態」と「一部をサンプリングしたデータ」のズレを小さく収めるためには「平均値」が役に立つ概念である、[3]と西内は語る。

脚注[編集]

  1. マーク・トゥエインの台詞ではないという説もある。この「名言」自体が疑ってかかるべき存在であるという、ややこしいトラップである。
  2. 勝海舟や爆笑問題・田中のような例はなくはないが....
  3. さらに丁寧に、ズレを小さく収めるなら「標準誤差」や「カイ二乗検定」などの手法を駆使する必要がある。平均値は手っ取り早く「便利」というだけで、もちろん最強のツールではない。詳細を知りたいそこの君は『統計学が最強の学問である [実践編]』を読もう。

関連項目[編集]