平均値・中央値・最頻値とは?|代表値の違いと使い分けをやさしく解説

  • URLをコピーしました!
目次

はじめに

統計において「データの中心を表す数字」はとても重要です。
その代表格が 平均値(へいきんち)・中央値(ちゅうおうち)・最頻値(さいひんち) の3つ。

この3つは「代表値」と呼ばれ、それぞれ計算方法や特徴、適した用途が異なります。

今回は、くま先生とくま生徒の会話を交えながら、3つの代表値の違いと、どんな場面でどれを使えばいいのかをわかりやすく解説します。

代表値ってなに?

データの“真ん中”って、やっぱり平均値のことですよね?

うん、平均値もよく使われるけど、それだけじゃないんだ。データの特徴によって、使い分ける必要があるんだよ。

平均値とは?

平均値は、すべてのデータを合計して、その個数で割った値です。
最もよく使われる代表値で、日常生活でもよく登場します。

例:テストの点数が【80, 90, 100, 70, 60】の場合
→ 平均値 =(80+90+100+70+60)÷ 5 = 80

特徴:

  • 全体のバランスを見るのに便利
  • データが正規分布に近いときに信頼性が高い
  • 外れ値(極端に大きい・小さい値)に弱い

注意:100, 80, 70, 60, 10 だと平均は64に。これでは「普通の人の感覚」とずれることも…

中央値とは?

中央値は、データを小さい順に並べたときの「真ん中」の値です。
データの「位置的中心」を表す代表値です。

例:データ【60, 70, 80, 90, 100】 → 中央値 = 80

特徴:

  • 外れ値の影響を受けない
  • 年収や通院回数など「偏りのあるデータ」に強い
  • データの“中心的な値”を知りたいときに便利

平均だと極端な人の影響を受けちゃうけど、中央値なら安心ですね。

そうだね。とくに年収や手術日数なんかは中央値で見ることが多いよ。

最頻値とは?

最頻値(モード)は、「もっともよく出てくる値」です。
データの中で「多数派」がどれかを知ることができます。

例:【80, 80, 90, 100, 80】 → 最頻値 = 80

特徴:

  • 人気や傾向を知りたいときに有効
  • カテゴリーデータでも使える(例:好きな果物、選んだサイズなど)
  • 複数存在する場合もあれば、まったく存在しない場合もある

最頻値って、人気投票の1位みたいですね!

そのとおり。どれが“よく選ばれてるか”を知るのにぴったりだよ。

比較表でまとめてみよう

代表値定義強み弱点よく使う場面
平均値合計 ÷ 個数全体の傾向を把握外れ値に弱いテストの点数、気温など
中央値並べた真ん中の値外れ値に強いデータ数が偶数だと平均をとる必要あり年収、通院回数など
最頻値最も多く出た値流行や選好を反映存在しない/複数ある場合もよく選ばれたサイズや答え

どれを使えばいいの?

シーン適した代表値理由
テストの平均点を知りたい平均値数値のバランスが大事だから
年収の実態を知りたい中央値極端に高い人の影響を除ける
一番売れているサイズを知りたい最頻値実際に一番選ばれているものが重要だから

まとめ

平均値・中央値・最頻値って、見た目は似てても、使い分けが大事なんですね!

うん。“どんなデータなのか”を理解して、それに合わせて代表値を選ぶことが統計の第一歩だよ。

代表値は、「ただ平均をとればいい」というものではありません。
データの性質や目的に応じて、最適な代表値を選ぶことが、統計を“使いこなす”第一歩です。

次に読むおすすめ記事

  • 分散と標準偏差の求め方

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

こんにちは、「あま」です!コロナをきっかけにサイクリングを始め、今では風を切って走るのが大好きです。このブログでは、日々の気になることや発見を雑記として発信しています。あなたの生活に役立つ情報や、ちょっとしたヒントをお届けできれば嬉しいです。ぜひ一緒に楽しんでいきましょう!

目次