偏差値ノート

▼メニュー

偏差値ノート

2007.4　三浦@int

1.相対評価としての
偏差値

2.偏差値とはどういう
ものか

3.回帰直線と回帰係数

4.相関係数

5.今回得点の平均と
標準偏差を推定する

1.相対評価としての偏差値

　端的には他人と比べる評価方法。学習者の属する集団（地域・学校内・学年など）の成績水準（平均点・平均到達度・平均正答率など）に基づき、集団の中で個人の成績を位置づける評価方法である。
　全国、県といった大規模な集団に準拠して各生徒の相対的な学力を計測する場合と、クラスや学校など、比較的小さい集団を準拠集団とする場合がある。相対評価は大きな集団の中で客観的であることを特徴としており、小さな集団である学校内や教室内では十分客観的とはいえない。小さな集団の中での位置付けは、弊害も出てくる。
　集団の成績分布の位置関係により評価が決まることから相対評価という。「集団に準拠した評価」という言い方もある。客観的で信頼性があるが、子供を学力の内容や到達の程度からではなく、集団での位置関係からしか評価しないという特性がある。
　全ての子どもの学力保障といった教育理念とは無関係な評価方法であるという指摘もある。このような批判があることを理解した上で、相対評価を生徒の客観的な学力を測る目的に限定して利用すれば、有効な評価方法となることも事実である。

　相対評価は、統計学の正規分布に基礎をおく評価法が多く採用される。正規分布曲線に基づく５段階や１０段階評価などとして利用される。正規分布は身長や体重などの自然的な現象の測定度数分布などに見られる釣鐘型の分布形状で、学力得点をそれに適用したものである。

　段階評価と正規分布との関係を図にすると次のようになる。

　正規分布のかたちは、標準偏差により完全に管理されるという特性をもつ。集団が均一なら、誰が標準偏差を算出し、標準偏差を単位として評価しても、基本的に同じ結果が得られる。ここから客観性と信頼性が保証される。
　各資料の平均からの偏差を二乗して総和を求めて平均を出し、さらにその平方根を求めると標準偏差になる。標準偏差はσ（シグマ）であらわされる。いわゆる「５段階評価」は１σ単位で区切り、「１０段階評価」は0.5σ単位で区切る。分布全体を+-2.5σの範囲で表示したものである。
　正規分布は、 +-1σの間におちる確率は68.25%、+-2σの間におちる確率は95.45%となり、+-3σの間におちる確率は99.73%となる。
　「偏差値」は一般に、51段階評価で0.1σを単位としており、扱い易くするため「×10＋50」の加工を加えたものをいう。平均の位置が偏差値50で、上は75、下は25くらいになる。得点と平均との差に「×10」するのは、扱いやすいように整数化するためであり、「+50」するのは平均の位置を「50」とするためである。

　偏差値はZ値とも言われるが、次の式で計算する。
　　　（xは個々の得点、mは平均、σは標準偏差）
　学校内や団体内の各教科の学力偏差値は、Excel等の表計算ソフトを使えば、容易に算出できる。母数となる得点について平均点と標準偏差を計算しておき、個々の得点を上の式に当てはめれば、偏差値は算出できる。
　このように偏差値は、学力を測る方法として、一定の数式により容易に求めることができる客観的な評価法として広く普及している。

　相対評価は、学力評価法として次のような欠点があるといわれる。これらの特性を踏まえた上で使用する必要がある。

（１）「全ての子どもの学力保障」という理念に反する可能性がある。子供たちにどんな学力がついたのかがわからない。学習目標に対する達成の程度がわからない。

（２）競争から「テストに合わせて教える・学ぶ」可能性がでてくる。
良し悪しは別として、テストの出題範囲を集中して勉強する、そのために勉強する。良い成績をとることが学習の動機付けとなっている面がある。

（３）目標の達成度を判断する基準が、必ずしも用意されているわけではない。相対評価は、評価そのものとしては、指導目標である学習内容に対する到達程度は評価しない。

（４）個人内の変化を把握するのには不向きである。特に、小さな学校内という集団の中では成績の伸びを評価しきれないという問題がある。

（５）競争心は必要だが、必要以上にあおる可能性があるといわれる。
それにも関わらず、生徒の適度な競争と向上心に訴えることで、学習に向かわせ動機付けとなる効果がある。

　これらの特性を踏まえた上で活用するなら、適切に利用すれば偏差値は有効な評価資料となる。学習目標規準に対する到達度や観点別の評価は、偏差値などの相対評価とは別に用意すべきものであることはゆうまでもないだろう。

2.偏差値とはどういうものか

　相対評価の典型的な評価法として｢平均点との比較｣や「得点分布グラフ」や「順位」などがある。偏差値もその代表である。偏差値は、正規分布の理論をテスト得点や成績の分布に適用して、平均からどの程度離れているかを、一定の統計量で表したものである。偏差値は、z(Z)得点ともいう。「標準得点」と言ういい方もある。

　変量がどのように散らばっているかを調べる方法として、各変量の平均からの隔たりが大きいか小さいかを調べる方法がある。各変量と平均の差を「偏差」という。それぞれの偏差を２乗して加えて平均を求めることで、データの散らばりの程度が分かる。これを「分散」という。
　分散の正の平方根を「標準偏差」(Standard Deviation =SD) という。平均の周りへのデータの散らばりが大きければ標準偏差はおおきくなり、散らばりが小さいほど0に近づく。

標準偏差の計算式

　標準的なテストの成績の場合は平均点の近くの人数が一番多く、０点や100点に近づくほど人数が少なくなり、左右対称の釣鐘型になることが多い。このような分布グラフの形を「正規分布」という。

正規分布のグラフ

　標準偏差が小さいと、平均の周りにデータは集中し、次のような形になる。逆に標準偏差（σ）が大きいと、データは平均から離れて分散することになる。標準偏差は、平均の周りへの資料の分布の状態を表し、それをコントロールしているともいえる。
標準偏差が小さい場合、平均の周りに資料が集中する。
　
　標準偏差が大きい場合、資料の分布が低い台形の山になり平均から離れる分布になる。分布の山が2つに分かれたりいびつになったりすることもある。

　100点満点のテストでは、標準偏差が20前後が標準的な値で、 15くらいになると小さい。多くの得点が平均の周りにかなり集中していることを表している。逆に、標準偏差が25や30になる場合がある。データの分散が大きいことを表し、成績が良い生徒と悪い生徒に分かれている場合や、分布が上下に台形状になっている場合である。

　正規分布は、次のような性質がある。

　つまり、平均+-2.5～3.0標準偏差の間に、殆どの成績が分布することになる。

　この性質を段階評価に応用すると次のようになる。
　客観評価の５段階評価や10段階評価は、この正規分布の理論による。

　正規分布と段階評価

　標準偏差を単位とした評価値をＺスコアということもある。平均値からの離れる程度を標準偏差で割ったもので、次の式で表される。

　z=(取った得点-平均点)/標準偏差

　5段階評定はこのｚ得点を基準としている。それは、平均を中心にして分布全体を５標準偏差で分割し、各標準偏差段階に該当する面積を分布全体の100%に対する比率としてあらわしたものである。
ｚ得点と５段階評価の関係は次のとおり。

標準偏差の範囲	段階　　分布％
-1.5σ以下	1　(全体の7%)
-1.5～-0.5σ	2　(全体の24%)
-0.5～0.5σ	3　(全体の38%)
0.5～1.5σ	4　(全体の24%)
1.5σ以上	5　(全体の7%)

　Ｚ値は、-2.0～＋2.0くらいまで少数付きで表示される。これでは一般に使う評価値としては扱いづらいので、次のように加工して使うことが多い。　
　Z得点をさらに細分化して使いやすくした評価値が偏差値で、５段階の評価をさらに1/10に分割したもので、50段階評価ともいえる。50を中心として25～75程度のの50段階評価としてあらわされることが多い。１００段階に分割した評価もあるようだ。

偏差値(Standard Score=SS)の計算式

　Z(=SS) = 50 + 10×(取った得点－平均点)／標準偏差
　　（xは得点、mは平均点、σは標準偏差）

　偏差値は、ある集団のテスト結果としての得点について、平均点と標準偏差が求められれば計算で求めることができる。（Excelなら、得点の平均点と標準偏差をそれぞれ AVERAGE関数、STDEV標準偏差関数を使用して求める。）

　この式により、平均点と同じ得点なら偏差値は50になる。得点が平均点を上回る程度に応じて51・52・53・・・と続き、上は75から80くらい、得点が平均点を下回る程度に応じて、49・48・47・・・となり、下は25くらいまで。
　例えば、100点満点のテストで、平均点が50、標準偏差が20とすると、50点は偏差値50、100点は偏差値75、0点は偏差値25となる。

　上の式で、分子の得点と平均点との差を10倍するということは、分母の標準偏差の1/10を単位とするということで、1偏差値はの得点幅は標準偏差の1/10となる。標準偏差が20ということは、1偏差値に該当する得点は2点ということになる。
　偏差値などの相対評価は、生徒の学力が平均点のまわりに釣鐘状に分布し、100点満点のテストでは平均点=50点、標準偏差=20のときに、0点が偏差値25、100点が偏差値75となり、きれいに評価することができる。

　だが、実際のテスト問題がそのように作られることは稀で、多くは平均点が高かったり低かったり、得点分布の形も偏りがあったり２つに分布が割れたりする。
　実施するテストの種類にもよる。中間・期末テストなどの統括的テストの場合に、偏差値尺度は適合するが、小単元ごとのテストは到達度テストの場合が多く、平均点は70～80点になることが多い。このようなテストに偏差値尺度を適用することには無理がある。偏差値を尺度とするテストは、平均点は中央値50点になることを想定しており、そのためにはある程度の標準化の作業が必要になる。

　この場合の標準化とは、次のような要件をいう。
① 設問の正答率が高いものと低いもの(出題の難易度)をバランスよく配置する、基礎的出題と応用的・発展的出題のバランスといってもよい。
②出題範囲となる学習領域からまんべんなく出題する。
③出題形式として、選択式や穴埋め式だけでなく記述式の割合も考慮する。採点の条件が許すなら自由記述なども採用する。

　得点分布は正規分布していないのに、それを偏差値の尺度を使って測った場合、その尺度は正確といえるかどうか。得点分布に適用される偏差値は、もともとそれほど厳密な尺度ではない。集団が一定であれば、テストの回が違っても、多少の難易度の変動があっても、集団のなかでの位置づけの尺度としてテストごとの偏差値を比較してみることができる、という程度である。得点分布が正規分布している場合に限り、たとえば偏差値65なら上位から7%の位置ということができるが、実際にはそうでない場合が多いのだから、偏差値による集団内の位置情報は大まかな推定値ということになろうか。得点分布が正規分布しているかどうかはさておくとして、正規分布していると仮定して標準偏差を単位とした尺度が、社会の中で現実的な有効性をもっているかどうかが問題なのであり、偏差値は一定程度その役割を果たしているといえるのではないか。

　学校内や塾内等の団体内であれば、表計算や簡易データベースがあれば、集団の中の平均点や標準偏差を計算し、上記の偏差値計算の式に当てはめれば、誰でも用意に偏差値を算出することができる。では、地域全体や全県、さらに全国レベルでの偏差値の算出はどうやって計算するのか。

　全数を集計できれば何も問題ないし、少数のサンプルでも完全ランダムサンプリングや、多段階抽出などができればよいが、実際には限られたサンプルから推定せざるを得ないことがある。また、前回のテストでの偏差値と今回のテストでの偏差値があまり上下したもでは信頼性がなくなる。成績の尺度としての信頼性と安定性が必要になる。
　広域テストにおいては、所属する団体が全員そのテストに参加するということはまれである。限定された参加数の平均点や標準偏差から、どうやれば全体の(母集団の)平均点と標準偏差を算出することができるのか。次に、過去の成績と相関のあるサンプルから母集団の平均や標準偏差を推定する方法を検討してみる。

3.回帰直線と回帰係数

　Xの値が決まれば、それに対応してYの値も決まるという関係を「YはXの関数である」という。
　Y=aX+b　の式が成り立つとき、「YはXの一次関数である」という。XとYは直線的な関係にあり、Xが決まればYも必然的に決まってしまう。

　2つの変量X、Yがあり、Xの値が決まればYの値も必然的に決まるというわけではないが、何らかの関係性が認められる場合、「XとYの間には相関関係がある」という。
　相関関係にもいろいろな形がある。正の相関もあれば負の相関もある。曲線的な関係性もある。また無関係という関係性もあるだろう。
　ここでは下の図のような、正の相関で直線的な関係性が認められる相関関係を考える。

　例えば、Ｘ軸に数学の得点、Y軸に理科の得点をとり、数学で何点とった人は理科で何点とったというようにプロットしていく。すると上の図のような図が出来上がる。数学と理科の相関分布に直線を当てはめ、その一次関数式から数学の得点から理科の得点を推定するという方法がある。
　最も当てはまりのよい直線を求める方法として「最小自乗法」がある。この方法により、一次関数式Y=aX+bにおけるaとbの値を求めることができる。
　この式はとあらわすことができる。

　aは「YのXへの回帰係数」、この直線を「YのXへの回帰直線」という。
　この直線は、原点（、）を通り、X軸に対する傾きがaとなる。
　これはXからYを推定するときの式だが、YからXを推定したい場合もある。その場合、同じ式を使うことは出来ない。次の式で計算する。
この式はとあらわすことができる。

　aは「XのYへの回帰係数」、この直線を「XのYへの回帰直線」という。

4.相関係数

　YのXへの回帰直線とXのYへの回帰直線を、散布図の上に引いてみると次のようになる。
　この２つの直線はともに原点（、）を通る。

　この２本の直線が重なるのは、相関が完全な場合だけ。
　２本の直線の回帰係数aとa'の幾何平均が、相関係数rになる。
　このrをピアソンの偏差積率相関係数という。
　
　相関係数の意味はここでは触れない。

　rを使って回帰係数を表すと次のようになる。
　YのXへの回帰係数は、

　XのYへの回帰係数は、

　相関係数rとXの標準偏差・Yの標準偏差が計算されているなら、回帰係数aを求めるには別途に計算するよりこの式を使う方が便利。

5.今回得点の平均と標準偏差を推定する

　上の回帰式の考え方を基に、相関する「前回の偏差値」と「今回の得点」から、今回得点の「平均点」と「標準偏差」を推定することができる。次に、「平均点」と「標準偏差」を推定する手法について概要を説明する。

　前回の偏差値との相関から今回のテスト得点の平均点と標準偏差を推定すると、前回の偏差値と同様の意味づけをもつ平均点と標準偏差を推定することができる。また、今回のテストのサンプルが少なくても、そのサンプルデータの過去の正しい偏差値資料が得られるなら、今回テストの平均点と標準偏差を得ることができる。少ないサンプルデータでも正しい相関データがあるならば、かなり正確に今回テストの母集団における平均点と標準偏差を得ることができるきわめて現実的で有効な方法である。

　前回の偏差値をx軸、今回の得点をy軸にとり、その散布図をイメージする。　
　前回の偏差値50の位置から、回帰直線を利用して今回得点の平均点を推定することができる。
　Y=aX+b　の式にX=50としてYを求めると、それが推定平均点となる。
　また、1標準偏差の大きさつまり偏差値50から偏差値60までの間の幅に対応するYの幅を求めると、それが今回得点の1標準偏差の大きさとなる。

　今回得点の生の平均点や標準偏差は容易に計算することはできるが、前回ないし過去の正しくつけられた偏差値を計算するための資料はえることができない。そのような場合に、この回帰直線を用いることで少ないサンプルの今回得点から、母集団の平均点と標準偏差を推定することができる。

　このような方法で求めた、今回テストの平均点と標準偏差を使って、今回テストの得点の偏差値付けを行ないその妥当性を評価することができる。手作業で集計することは無理なので、プログラムを組んで集計することになる。前回の偏差値の10段階分布を作成しそれをグラフ表示する。さらに、今回の推定平均点と推定標準偏差を使用して10段階分布を作成してグラフ表示する。すると前回偏差値の分布状況に対して、今回偏差値の分布状況を対置して比較する。こうすることで、今回の平均点と標準偏差の妥当性が保証されることになる。

　今回の偏差値が前回の偏差値と比較して、10段階分布のバランスが悪い場合、今回推定した平均点や標準偏差を修正することで、偏差値分布のバランスを補正することができる。推定平均点や標準偏差を変更して、再処理実行できるようにプログラムを組むとよいだろう。
　標準偏差の修正のヒントとして、標準偏差を大きくすると、偏差値分布を平均近くに引き寄せる効果がある。逆に標準偏差を小さくすると、偏差値分布を平均から引き離す効果がある。

　ひとつの資料の分布はひとつの標準偏差をもつが、操作的に標準偏差の大きさを複数セットして計算することも可能である。例えば、平均点より上の標準偏差の大きさと、平均点より下の標準偏差の大きさを変えるという操作が現実的である。
　平均点が80点程度と高く、また平均点よりずっと下で20点などにも分布がある場合、平均点より上の偏差値計算に使用する標準偏差を小さくし、平均点より下の偏差値計算に使用する標準偏差を大きくすることで、偏差値分布のバランスをある程度補正することができる。
　平均点が20点程度と低く、また平均点よりずっと上で80点などにも分布がある場合、平均点より上の偏差値計算に使用する標準偏差を大きくし、平均点より下の偏差値計算に使用する標準偏差を小さくすることで、ある程度補正することができる。

　偏差値はいろいろな欠点をもちながらも、学力の客観的な測定資料として現実の有効性をもっている。偏差値の客観性を保証するものとして、ある一定の資料についてその平均点と標準偏差を求め、それを使って個々の得点資料を偏差値に換算することができ、誰でもがほぼ同じような結果を出すことができる、ということがあげられる。

統計に関する参考資料は、主に次の資料による。
「心理教育　統計学」肥田野直・瀬谷正敏・大川信明共著培風館

とりあえず、ここまで。