−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
4.評価の方法 基準による区別
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
評価は、評価の規準や基準をどこに求めるかにより、相対評価・絶対評価・個人内評価の3つの方法があるとされる。
(1)相対評価
他人と比べる評価方法。学習者の属する集団(学年・性別・年齢など)の成績水準(平均点・平均到達度・正答率など)に基づき、個人の成績を解釈する(=位置づける、順位づける)評価方法。
国、県といった比較的大規模な集団に準拠して各生徒の相対的な学力を計測するものと、クラスや学校など、比較的小さい集団を準拠集団とするものがある。相対評価のは客観的であることを特徴としており、学校内や教室内では十分客観的とはいえない。
全ての子どもの学力保障といった教育理念とは無関係な評価方法であるという指摘がある。このような批判があることを理解した上で、相対評価を生徒の客観的な学力を測る目的に限定して利用すれば、有効な評価方法となる。
相対評価と絶対評価は、評価方法では異なるが、相対評価に用いられるテストの出題を目標に準拠した形で作成することも可能であるといわれる。相対評価の問題が適切に作成され、標準化されているならば、それを絶対評価でに適応してもそれほど問題ではない。ただし、絶対評価用に作成された出題は、その評価法に特化して作成されている場合が多く、相対評価に利用することは不向きかもしれない。基礎的・基本的な習得目標のチェックリストのような到達度の確認テストもありうる。その場合の平均点は70〜80点以上になってしまう。
絶対評価用に作成された出題は、評価の性格上平均的な達成度が70〜80%に設定されることが多く、得点や正答率の分布が正規分布のような形にはならないことが多い。
相対的な評価は、統計学の正規分布に基礎をおく評価法で、正規分布曲線による5段階や10段階評価などとして利用される。正規分布は身長や体重などの自然的な現象の測定度数分布などに見られる釣鐘型の分布形状で、学力得点をそれに適用したもの。
集団の成績分布の位置により評価がきまることから相対評価という。「集団に準拠した評価」という言い方もある。客観的で信頼性があるが、子供を学力の内容・達成の程度からではなく、集団での位置関係からしか評価しないという特性がある。

正規分布は標準偏差により完全に管理される。平均からの偏差を二乗して総和し、その平方根をもとめると標準偏差になる。σ(シグマ)は標準偏差のことで、5段階評価は1σ単位で区切り、10段階評価は0.5σ単位で区切る。偏差値は51段階評価で0.1σを単位として、×10+50 の加工をしたもの。平均の位置が偏差値50で、上は75、下は25くらいになる。偏差値は、学力を測る方法として、一定の数式により求めることができ、客観的な評価法として広く普及している。
<相対評価の欠点>
(1)「全ての子どもの学力保障」という理念に反する可能性が高い。子供たちにどんな学力がついたのかがわからない。学習目標に対する達成の程度がわからない。
(2)「テストに合わせて教える・学ぶ」可能性が高くなる。良いか悪いか、テストの出題範囲を集中して勉強する、そのために勉強する。それが学習の動機付けとなっている。
(3)目標の達成度を判断する基準が、必ずしも用意されているわけではない。相対評価は、評価そのものとしては、指導目標である学習内容そのものについては評価しない。
(4)個人内の変化を把握するのには不向きである。
(5)競争心は必要だが必要以上にあおる可能性がある。
(2)到達度評価(絶対評価)
教育目標への到達程度による評価法。
到達度評価のための基準は、教育目標を具体的に分析し設定したもので、学習者の行動を評価するための目標行動基準である。学力の内容・学習の内容を考慮しない相対評価に対して、評価基準を学力の内容=到達目標に置く到達度評価は、教育評価としての適合度は高く、近年の評価は到達度評価一色にそめられているといっても過言ではない。だが、学習指導要領などの最低限の到達目標は設定しやすいが、実際の運用面では、思考、判断、表現などの高次の目標設定や行動分析では困難が多い。さらに、到達基準の設定評価の作業や、評価活動の負担や分析に評価者の力量の差が出てきてしまったり、現場教師の主観性の強い評価になるなどの問題も指摘されている。
到達度評価は、 クライテリオン(基準?規準?)準拠評価(Criterion Referenced Assessment)といわれるが、ドメイン準拠評価とスタンダード準拠評価の2つの解釈がある。
クライテリオン準拠評価は、アメリカのR.グレイザ−が1963年に提唱したとされ、1980年代にオーストラリアのR.サドラーがスタンダード準拠評価を提唱した。
クライテリオン準拠評価は日本語訳では「目標に準拠した評価」ということになる。目標準拠評価は、量的変量を扱う「ドメイン準拠評価」と、質的変量を扱う「スタンダード準拠評価」に分かれる。
クライテリオンのドメイン準拠評価(Domein Referenced Assessment)は、「領域準拠評価」と訳され、原則的に量的変量を扱うとされ、「基準」という表現を使用するのがふさわしいとされる。
評価する範囲を明確に規定したうえで、評価基準として明確な行動基準を設定すべきであるとする。評価基準を細分化してたくさん作り、チャックリストのようにチェックしていくことで、客観的に評価しようとした。正解・誤答、Yes・Noのような明確なかたちで採点できる問題を、一定の割合以上できたかどうかで判断する(何%以上の得点率ならA、何%以上ならBとか)。このようなクライテリオン解釈を、ドメイン準拠評価という。
日本で従来用いられてきた到達度評価という用語は,ほぼこのドメイン準拠評価に相当する。しかし、評価する範囲や内容を行動基準として明確に表現できる「知識・理解」さらに「技能・表現」についてはこのような方法が有効であるが、「思考・判断」、「関心意欲態度」などの観点の評価にはこのような方法は必ずしも適切でないとされている。
スタンダード準拠評価(Standard Refernced Assessment)は、質的変量として評価を処理し、「規準」という表現を使用するのがふさわしいとされる。
明確な範囲や行動基準を示したり、正解・誤答のような2分法的な採点や評価のできない能力や技能については、スタンダード準拠評価が適切な評価方法であるとされる。その特徴は、あまり再分化されない一定の達成レベルの評価基準を示すのに、各レベルの特徴を「言語表現」で示すとともに、このレベルに該当する児童・生徒の学習事例をいくつか集めた「評価事例集」で言語表現を補完することにある。つまり「言語表現」と「実例集」で評価基準を示す方法のことといえる。「思考力・判断力」のような、正解・誤答のような2分法的な評価ができず、児童・生徒の学習の質を判断することを必要とする能力の評価にこの方法は適している。
イギリスはドメイン準拠評価を採用していたが、結果的には失敗し1994年からスタンダード準拠評価を導入している。
一般に評価「規準」は質的なものの評価に、「基準」は量的なものの評価に使うとされる。A・B・Cの段階評価の判断の基準、といった使い方をされる。文部科学省の文章では、規準と規準を特別には明確にせず、それらを含むものとしてすべて「評価規準」という表現に統一しているようだ。
「判断基準」は「評価規準」として示され、学習目標の習得状況の程度を明示するための指標を、数値(1・2・3)や記号(A・B・C)や文章表記で示したもの、とされている。質的な評価の「規準」や量的な評価の「基準」といっても言葉の問題であって、実際的には評価の方法論とは確立されておらず、瑣末な問題のようにも思う。
「判断基準表」(=到達目標=目標行動一覧)は、縦軸にある単元に含まれる活動内容を列挙し、横軸にそれぞれの活動で想定される評価観点と評価規準、そしてそれらをより具体化した判断基準を整理して並べた一覧表のこと。到達度評価を実施する場合は、まず判断基準表を作成する必要がある。詳しい判断基準表では、さらにそれぞれの基準(A・B・C)に点数(3点・2点・1点)を与えて、観点ごとの合計点や単元の学習成果の総括的な点数を算出できるように工夫したものもある。
「判断基準表」は、ペーパーテストで客観的に評価しにくい観点を扱えば扱うほど、その判断基準の文章表記やレベル分けの仕方について、継続的な改善と修正を行うことが必要になる。
さらに、各単元で設定した判断基準表を用いて算出した、一人ひとりの児童・生徒の観点別評価得点を、年度末の指導要録における評定に換算するためには、一定の「換算公式」を各学校において設定しておかなければならない。より妥当性と信頼性の高い換算公式にするためには、同じ学年や同じ教科の教師集団が、児童・生徒の学習状況を、ペーパーテストの得点だけではなく、作品分析や行動観察によって多面的にとらえて共有化して、それらを基にして常に判断基準表の改善と修正を行うことが大切とされる。また、必要に応じて、他校の判断基準表と比較検討することによって、少なくとも同じ市町村内の学校間で判断基準表や得点換算公式に大きな違いがないように、「判断基準検討会議」などを開いて情報交換を行うことも求められる。(大阪教育大学助教授 田中
博之)
絶対評価は学習目標に対する達成程度による評価だか、学習指導の成果の評価として妥当な評価法である。だが、いざ実施するとなると「評価基準表」はだれが作るのか、評価材として何を使いどう評価に結び付けていくのか、検討課題は多く、試行が続くことになる。
到達度評価は、学習目標に対する到達度であって、それは集団の中での序列や位置情報は何も表現しない。それがために集団準拠基準の相対評価の価値が減ずるものではない。生徒の学習成果の確認として、相対評価は客観的で分かりやすく、適度な競争心により学習動機や学習目標にもなる。
それぞれの評価法の良さを取り込もうとする考えもある。相対評価と絶対評価の成績を合計して記載するのではなく、それぞれを併記する二重システムのような書式を採用することも有効な手段ではないか、とする意見もある。
到達度評価(絶対評価)の具体的な適用の実際は次のとおり。
「目標に準拠した評価(いわゆる絶対評価)」。ここでいう「絶対評価」は予め設定された目標に照らし合わせて、それに到達しているかどうかによって評価する方法。
教育課程審議会「児童生徒の学習と教育課程の実施状況の評価のあり方について」(答申)平成12年12月4日 次の4項目の基本的な方向が指示された。
(1)目標に準拠した評価(集団準拠の相対評価から目標準拠の絶対評価へ)
(2)個人内評価を重視する
(3)指導と評価の一体化
(4)評価を児童生徒の学習の改善に生かす
「基礎・基本の確実な定着には、きめ細かな評価に基づく指導が効果的であり、そのためには、各時間ごとに、きめ細かな評価規準を工夫する必要がある。」
「これからの評価の基本的な考え方
答申においては,これからの評価の基本的な考え方が次のように示された。
@新学習指導要領においては,自ら学び自ら考える力などの「生きる力」をはぐくむことを目指し,学習指導要領に示された基礎的・基本的な内容の確実な習得を図ることを重視していることから,学習指導要領に示す目標に照らしてその実現状況を見る評価(いわゆる絶対評価)を一層重視し,観点別学習状況の評価を基本として,児童生徒の学習の到達度を適切に評価していくことが重要となること。
A自ら学ぶ意欲や問題解決の能力,個性の伸長などに資するよう,個人内評価(児童生徒ごとのよい点や可能性,進歩の状況などの評価)を工夫することも大切であること。
Bこれからは,目標に準拠した評価及び個人内評価が柱となる中で,集団に準拠した評価については,児童生徒の発達段階などに配慮した上で,目的に応じて指導に生かすことが必要であること。
」
「中学校指導要録に記載する事項等」(文科省)
観点別学習状況
「中学校指導要領に示す各教科の目標に照らして、その実現状況を観点ごとに評価し、A、B、Cの記号により記入する。この場合、「十分満足できると判断されるもの」をA、「おおむね満足できると判断されるもの」をB、「努力を要すると判断される」ものをCとする。」
(1)関心・意欲・態度 (2)思考・判断(3)表現・技能 (4)知識・理解
評定
「各教科別に中学校指導要領に示す目標に照らして、・・・その実現状況を総括的に評価し、記入する。」
具体的な方法は、文科省・国政研は具体的な基準は提示していない。
<東京都の場合>
観点別学習状況の評価 評定
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
十分満足できる A 特に程度が高い 5
(到達値80%以上) 十分満足できる 4
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
おおむね満足できる B おおむね満足できる 3
(到達値50%以上) 努力を要する 2
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
努力を要する C 一層努力を要する 1
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
評価規準の設定方法<東京都の場合>
「教科の目標及び内容、評価の観点を踏まえ、各学年・各単元(題材)ごとに評価規準を設定する。」「学習の前後、過程において観点ごとに評価を行う。その際、ペーパーテストだけでなく、観察、作品、ノート、レポート等を活用する。」
4つの観点の評価の総括としての5段階評価。
B個人内評価
その個人自身と比べる評価。
個人の成績を解釈する際、個人の他の面の能力や過去の成績などを基準にして解釈する評価。生徒個人の成績の推移や前回の成績との比較など。
個人内評価は、指導者である教師だけでなく生徒個人にも提示され、目標への到達程度や学習進度を理解し、今後の学習方略の参考になることが期待される。
数学の「思考・判断」 の評価の「B」が続いているような個人内評価では、生徒のこれからの学習にどれだけの意味があるのか。いくつ学期を経ても「C」評価が続いているような評価では、生徒も教師もやりきれない。個人の成績の推移といっても実際には過去の成績の羅列に留まってしまう。
通知表の学期ごとの評価は、一種の個人内評価といえるが、その評価は何を意味しているのか。生徒の学習成果か教師の指導成果か。
生徒に自信を持たせて学習意欲を引き出し、明確な学習動機を持たせ、次の学習課題へ意欲的に取り組ませる。そういう個人内評価は可能だろうか。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
5.評価の方法 実施段階による区別
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
評価は学習指導のどの段階で行うかにより、診断的評価・形成的評価・総括的評価の3つがある、とされる。
@診断的評価
学習者のレディネス(学習準備状態)の情報を得るために、学期や単元の前に実施。
診断的評価とは、前もって学習者の実態を把握し、それに合わせた指導計画を立てるための評価。
A形成的評価
学期や単元の途中で出される評価。
形成的評価とは、教授活動を通して学習者がどの程度理解したかを確認するための評価。これまでに教育活動で扱った内容について、どの程度理解しているか確認することによって、学習者は自分自身の理解の度合いを確認することができる。そして、教授者はその結果から指導方針の軌道修正が可能となります。
学習活動の自己調整を図り、学習活動を強化し、学習過程の問題点の診断する。形成的評価は、学習の目的や目標などの理念がかたまっていないと、曖昧なものになる。
B総括的評価
学期や単元の最後におこなう評価。
総括的評価とは、従来から行われてきた中間・期末試験による評価を指す。その意義として、学習者は自分自身の努力の結果を知ることができる。また、教授者も次の教育活動に対する改善点などの情報を得ることができる。
ブルームは、特に形成的評価の役割を重視した。この理論を活用することによって95%の学生が目標水準を達成できると主張する。その数値はともかくとしても、教育活動における学習者の理解の程度を確認することの重要性について大きな指摘をしている。
|