Total Pageviews

12/21/2019

リスニングテストで音源を1回流すか、2回流すか、に関する考察

リスニングテストの音源再生回数の影響とは

昨日の1220文科省前抗議の中で、松井孝志先生が、英語テストに的を絞って鋭い論陣を張られました。お疲れ様でした。まず最初に申し上げておきますが、松井先生のスピーチ全体の主旨には大賛成です。その上でなのですが、一部私と見方が違った部分がありましたので、このポストを書いております。どこかというと、リスニングテストの音源を1回流すのか2回流すのかというくだりです(ビデオの39:00あたり)。ご意見の要点は私の理解では以下のようなものだったと思います。


大学入試センターの試行テストのリスニングの中では、音源を1回だけ流す問題と2回流す問題がある。普通に考えるならば、より平易な問題は一回だけ流し、より難しい問題は2回流すはずである。ところが実際にはこの逆で、最初のほうのより短く易しい問題は2回流し、後ろのほうのより長く難しい問題は1回だけ流すという構成になっている。これはあべこべである。そういう設定の理由としては後半の長いトークを2回流してしまうと試験時間が長くなってしまうからという物理的制約からきているらしい。これはよろしくない。

この件については私個人は少し違う考えを持っていますので、ご紹介したいと思います。

(1)task authenticity(真正性)の問題

テストでのタスクが、実生活でのタスクにどの程度近いか、という点です。実生活では圧倒的に刺激(音源)を1回だけ聞く場合が多いでしょう。よって1回のみ再生のほうが真正性に関しては軍配があがります。(※実生活では場合によっては聞き返すことで繰り返してもらえるが、テストではできない、という点を2回再生で補うのだ、という点はありますが。)そういう意味では、すべて1回のみでやるという立場もありえます。

(2)practicality(実用性)の問題

長いトークを2回流すと規定の時間を超過してしまうから。。。というのは測定にとって最も本質的な問題であるとは言えませんが、非本質的な問題であるとも言いきれません。なぜならばテスト時間が長くなると、生身の人間である受験生には疲労や集中力の欠如が生じ、その結果解答行動のゆれからくる妥当性および信頼性の低下が生じるからです。

これはリスニングにおいて特に顕著です。なぜならばリーディングと違ってリスニングでは自分のペースで聴くことができないからです。その時に聞き逃してしまったら音声は二度と戻ってきません。この点が、場合によっては自由に読む順番や読むスピードを受験者自身がコントロールできるリーディングと決定的に異なる点です。40分、50分とずっと集中力を維持しなければならず、大変に疲れます。

ですから長くなりすぎない時間のなかに収めることを前提としてテスト設計することは、とくにリスニングにおいてはかなり大切なことと言えるでしょう。この点からすると、1回再生と2回再生を混在させるという前提であれば、長いトークは1回、短いトークは2回、というのはリーズナブルな設定であることになります。

(3)fairness(公平性、公正性)の問題

いずれの回数であっても、テスト受験者全員が同一回数聞く機会をもつならば、公平性の点で問題は生じません。

(4)item difficulty(項目難度)の問題

他の条件が同じであれば、おおくの場合1回再生よりも2回再生のほうが難度が下がるでしょう。つまり1回再生ならば平均点が比較的低く、2回再生なら平均点は比較的高いでしょう。しかし(3)と関わりますが、全員にとって等しく易しい/難しいのですから、それ自体は問題ではありません。問題は、実際の難易度の程度です。易しすぎれば上位者が皆正解してしまう天井効果が、難しすぎれば下位者が皆誤答してしまう床効果が生じしてしまいます。その間を狙うことが必要です。ですから1回再生の場合は比較的タスクをやさしく、2回再生の場合は比較的難しくするのが適当でしょう。

もうひとつの視点は、テスト問題は易から難にゆるやかに配列されるのが望ましいということです。とくにリスニングはリーディングとちがって自分で解く順番を決められず、全員が1番から順番に解答することを強制されます。最初のうちはウォームアップ的に比較的易しい問題があり、徐々に難度が上がっていくのが理想です。そういう意味では最初のほうの短い問題が2回読みで難度が低く、後半が1回読みで難度が上がる、のは望ましいことです。逆になってしまっては受験生によっては慌ててしまい、結果的に解答の信頼性が低下するかもしれません。

(5)item discrimination(項目弁別度、識別度)の問題

選抜試験では、上位者から下位者まで得点を「バラけさせる」ことが最も大切となります。比較的難しかろうが、易しかろうが、結果的に個々の受験者の英語力(いまはリスニング力)の差をあぶり出せるのが、良い問題であると言えます。

たとえば2回再生の条件下ではA君もB君も正解する問題を、1回再生の条件に変えたらA君は正解したがB君は正解できなかったとすると、再生回数を2回から1回に変えたことで、2回再生条件下では判明しなかったふたりの実力差があぶり出された、ということになります。再生回数を変えたことで項目弁別力が上がったのです。

もちろん逆に、1回再生だったら(難しすぎて)A君もB君も正解できなかったのが、2回再生にしてみたらA君は正解できたが、B君はやはり正解できなかった、というケースもありえます。この場合は2回再生のほうが弁別力があったわけです。

1回にせよ2回にせよ、大切なのは回数自体ではなく結果としての項目弁別力だ、ということになります。

まとめ

リスニング問題というのは、刺激トークの英語のレベル、刺激トークの話す速度、話し方のナチュラルさ(音声変化の程度など)、再生の回数、問われる設問の認知的難度、正答選択肢の難度、錯乱肢の難度、等々の複数の要因それぞれを調整することによって、適切な項目難度、そしてその結果としての高い項目弁別度を目指すことが求められます。したがって再生の回数のみを取り出して論じるのは難しいように思われます。

最後にもう一度、松井先生のスピーチ全体の主旨、他のスピーカーの方々のそれぞれのご主張、抗議行動全体の主旨に、私は賛同していることを強調しておきます。みなさま、寒い中、長時間にわたり本当にご苦労さまでした。すこしでも「山」に声が届いたこと、これから届くことを願ってやみません。