【偏差値とは何か】具体的な計算方法を知りたい人！偏差値70以上は優秀。

こんにちは(@t_kun_kamakiri)。

皆さん、偏差値って聞いたことありますよね？

おそらくこの記事を読んでいる方は、偏差値の具体的な計算方法や偏差値の意味について知りたい人だと思います。
そこで・・・・

本記事の内容こんな人におすすめ

偏差の計算方法を知りたい人
偏差値の具体的な計算を知りたい人
偏差値の統計学の理論の話を知りたい人

是非、楽しみながら読んでください(^^♪

そこで、本記事の主題

本記事のポイント

偏差値の計算方法
テストの点数をそのまま語るのが、なぜ公平ではないのか？
公平でない要因として、何があるのか？
偏差値はどのように計算されているのか？

これらの疑問にお答えしましょう(^^)/

以下の順番で解説を進めていきます。

前半は絵を使いながら非常に丁寧に、後半は数学を使いながらより具体的な計算をしたいと思います。

前半部分で、「へ～」って思っていただければ、よし！！って感じです。

偏差値のイメージ
偏差値とは
偏差値の計算方法
偏差値の具体的な計算をしてみよう
偏差値を見ると何がわかる？
偏差値を導入する理由
公平でなくしている要因は？
公平にするための決まり事を決めよう
テストの分布を正規分布だと思って分布を正規化しよう
2人の生徒はどちらが偏差値が高いか？
正規分布でない場合は偏差値の利用価値は小さい？
偏差値100とったらすごい？
まとめ
おすすめの参考書

偏差値のイメージ

カマキリ

偏差値ってどんなイメージかな？

偏差値のイメージ

偏差値が高い＝テストの成績が良い

こんなイメージでしょうか。

Aさん

私、英語のテスト38点だったよ(T T)

Bくん

俺、数学のテスト50点だった(^^)

って言いますけど、ところで・・・

どうしてわざわざテストの点数で言わずに、偏差値で皆さん語るのでしょうかね？

理由は、皆さんも何となくわかっているでしょう(^^)

定量的に公平に判断できるようにもの、

それが偏差値だからですね。

異なる科目や、同じ科目でも異なる集団で受けたテスト（模試が違う）など・・・点数そのものを比較するのはナンセンスです。

偏差値とは

偏差値とはある集団の中での自分の位置を示すものです。

たとえ科目が変わっても（平均点、受験数が異なっても）公平に「あなたは全体でこのくらいの位置にいます」と示しているが偏差値です。

「平均点が低い科目」と「平均点が高い科目」の点数自体をを比較しても、どちらが良い結果なのか判断がでません。

ですので、”統計的にあなたはここくらいの位置にいます”と示してくれるように便利にしたものが偏差値です。

偏差値の計算方法

では、偏差値の計算方法について見てみましょう。

偏差値の計算方法

偏差値の計算方法

偏差値＝10*(個人の成績 – 平均点)÷（その科目の標準偏差）+50

こちらが偏差値の計算方法です。

テストを受けたとき、個人の成績はわかっていますよね。
偏差値をするために、

個人の成績
平均点
標準偏差

この3つを知り、上の公式に代入すれば偏差値が計算できます！

カマキリ

簡単ですね

偏差値の具体的な計算をしてみよう

ここでは、偏差値の具体的な計算を行いたいと思います。

偏差値の計算には以下の2つの統計的な数を使います。

偏差値の計算に使う数字

平均点
標準偏差

標準偏差とは、その科目の「バラツキ具合」を示します。

具体的に計算して理解しましょう！
数学の点数(5人）

Aさん	50点
Bさん	65点
Cさん	82点
Dさん	45点
Eさん	72点

平均点

\begin{align*}\mu_{x}&=\frac{1}{N}\sum_{i=1}^{N}x_{i}\\
&=\frac{50+65+82+45+72}{5}\\
&=62.8
\end{align*}

上の例だと、平均点：62.8点

標準偏差

\begin{align*}\sigma&=\sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_{i}-\mu_{x})^{2}}\\
&=\frac{(50-62.8)^2+(65-62.8)^2+(82-62.8)^2+(45-62.8)^2+(72-62.8)^2}{5}\\
&=13.7
\end{align*}

上の例だと、標準偏差：13.7

簡単に言うと、「平均点62.8で、13.7点の広がりのある分布」

※誤解があるといけないので、重要なことを述べておきます。
上の例では、サンプル数（人数）が少なすぎるので、本当に分布が上のようなものになるかはかなり怪しいです。

十分な人数がいて、それが正規分布に従っているのであれば、上記のようなグラフ分布であることが望めます。

ですので、偏差値の利用価値が高いのは、サンプルの数値の分布が正規分布に近い状態の時であります。

正規分布ってなんだ？って言う人はこちらをどうぞ。
正規分布

そこで、偏差値の理解しやすくするためにテストの点数の分布が正規分布に従っているとして話を進めます。

※「正規分布でないとどうなるのか？」については最後に少し触れることとします。

偏差値を見ると何がわかる？

ここでは「偏差値の数値を見たら何がわかるのか？」を解説します。

下記のグラフを見てみましょう。

仮に、「偏差値が70以上である」と言っている人がいるとします。

上のグラフは、偏差値70以下の人で97.7％を占めています。

言い換えると、偏差値が70以上の人はその集団の中のわずか2.3%以内に入っている！！

1000人いたら20位くらいってことです。

おー、すごいのかすごくないのか(笑)

優秀な部類ではありますね。

偏差値を導入する理由

続いて偏差値を導入する理由を解説します。

逆に、偏差値という指標がない場合に何が起こるのかを見ればわかるかと思います。

2人の人がこんな会話をしてたとします。

Aさん

私、英語のテスト38点だったよ(T T)

Bくん

俺、数学のテスト50点だった(^^)

これだけでは、Bさんの方が点数が良いということだけはわかりますが、優秀であるかどうかはよくわかりません。

しかし、実は点数とその点数をとった人数の関係をグラフにしたときこんな感じだったとしたらどうでしょう。

Aさんの受けた試験での分布（●がAさん）

Bくんの受けた試験での分布（●がBくん）

こういう分布を見せられると、Aさんの方が全体の中で優れているように見えます。
では、具体的に数値で表す（偏差値）にはどのようにすればよいかを以降で解説します。

公平でなくしている要因は？

人数
幅
平均値

これらが違う二つのテストの点数自体を比較するのはナンセンス！！

平均点も違うし受けている人数も違うのでは、比較のしようがありません。
平均点が違うと比較しても意味がないのはわかりやすいですが、

仮に平均点が同じであっても、受けている人数が違うだけで、分布は変わります。

たとえば人数が多いと分布は平均点のまわりでシャープになります。

※標準偏差はあくまで例です。

人数が多いだけで標準偏差が小さくなるという意味です。
「平均点のまわりで人数が多いので、そこが際立つ」と考えても良いですし、

標準偏差が$\sigma=\sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_{i}-\mu_{x})^{2}}$なので、サンプル数Nが多くなると標準偏差は小さくなるというようにも理解できます。

これらを公平に判断できるように条件でそろえて数値として判断できるようにしたのが偏差値です。

ここでいう「条件をそろえる」とは、決まり事を決めるということです。

公平にするための決まり事を決めよう

では、偏差値とはどのように計算するのでしょうか？
偏差値の計算方法は以下の3点を抑えておく必要があります。

偏差値の計算のポイント

人数をそろえる　➡　合計が1
バラツキ具合（幅）をそろえる　➡　標準偏差を10
平均値をそろえる　➡　平均値50

これが偏差値の計算のポイントです。

以上で、偏差値の具体的な計算方法のお話は終わりです(^^)/
偏差値について計算方法も含めて理解が深まったかと思います。

次から、テストの分布が正規分布に従うとして、上記の3条件になるように統計学の理論を使ってガシガシ式変形していきます。

さてここらで、前半戦の終了です(^^)/

このあとは、数式だらけです!
それでは、後半戦にいきます↓

テストの分布を正規分布だと思って分布を正規化しよう

偏差値の計算方法ですが、もう一度おさらいしておきます。

偏差値の計算方法

偏差値＝10*(個人の成績 – 平均点)÷（その科目の標準偏差）+50

こちらの計算方法はどうやって出てきたのかは気になりますよね。

ここで、統計学の知識を使って「偏差値の計算方法」がどうやって導出されたのかを示したいと思います。

さて、上記のような分布があり、これが正規分布に従っているならば、

正規分布

\begin{align*}
f(x)=N\frac{1}{\sqrt{2\pi b^2}}e^{-\frac{(x-a)^{2}}{2b^{2}}}
\end{align*}

と書けます。

ちゃんと、$N=\int_{-\infty}^{\infty}f(x)dx$となっていることを各自ご確認下さい。
（人数を積算すると、合計人数である）

そこで、上記3条件「合計が1」「標準偏差が10」「平均値が50」となっている関数を$g(X)$とすると、

\begin{align*}
1=\int_{-\infty}^{\infty}g(X)dX\tag{1}
\end{align*}

となっているはずです。各自確かめてみましょう。
※$x$ではなく$X$（大文字）ですので注意。

つまり、

$$g(X)=\frac{1}{\sqrt{2\pi \sigma^2}}e^{-\frac{(X-\mu)^{2}}{2\sigma^{2}}}$$
※後で$\mu=50$,$\sigma=10$とします。

となっているように、$f(x)$を$g(X)$に変換したい。

分布$f(x)$の幅も高さも変えて、$g(X)$にするのですから、

$$g(X)=Cf(x)$$

とおいて(1)を満たすような、$X$や$C$を決めるのもよいです。

ここでは簡単に以下のようにして$X$や$C$を決めます。
$f(x)$の条件として、

\begin{align*}N=\int_{-\infty}^{\infty}f(x)dx\tag{2}\end{align*}

がありました。

(2)の両辺をNで割って、$1=\int_{-\infty}^{\infty}\frac{1}{N}f(x)\frac{dx}{dX}dX$とします。
※$dX=\frac{dx}{dX}dX$としました。

(1)式の$1=\int_{-\infty}^{\infty}g(X)dX$と比較すると、

\begin{align*}g(X)=\frac{1}{N}f(x)\frac{dx}{dX}\tag{3}\end{align*}

であることがわかります。
この(3)式を満たすような、$x$と$X$の関係は何かを考えます。

\begin{align*}f(x)=N\frac{1}{\sqrt{2\pi b^2}}e^{-\frac{(x-a)^{2}}{2b^{2}}}\end{align*}

\begin{align*}g(X)=\frac{1}{\sqrt{2\pi \sigma^2}}e^{-\frac{(X-\mu)^{2}}{2\sigma^{2}}}\end{align*}

であることから、指数部分の$\frac{X-\mu}{\sigma}=\frac{x-a}{b}$とすれば(3)式を満たしそうですよね。

一応、(3)式の右辺に代入して左辺と等しくなるかを確認してみます。

\begin{align*}（右辺）=\frac{1}{N}\frac{N}{\sqrt{2\pi b^2}}e^{-\frac{(X-\mu)^{2}}{2\sigma^{2}}}\frac{b}{\sigma}=\frac{1}{\sqrt{2\pi \sigma^2}}e^{-\frac{(X-\mu)^{2}}{2\sigma^{2}}}=g(x)\end{align*}

ちゃんと(3)の等式が成り立っています。

ゆえに、

偏差値の概要

あるテストの点数の分布$f(x)$を