どうも, みなさんこんにちは。
高橋佳佑です。
学習指導要領改訂に伴い,2022 年の高校1年生から学習する内容が少し変わります。
今回は新課程の数学 I「データの分析」と数学 B の「統計的な推測」についてお話します。
目次
新課程の現行過程との違い――「四分位数」「箱ひげ図」は中学2年で
2021 年現在, 数学Iで学習している四分位数や箱ひげ図に関しては中学2年で学習することになっています。
数学Iに登場する「外れ値」
新課程では数学 I に外れ値という言葉が出てきます。
これはデータの中の極端に大きい値や, 極端に小さい値のことで, これらがあることで平均値が大きく左右されます。
そのため代表値として中央値を考える, というのは有名な話でしょうか。
データの中で何を外れ値とするかの基準も必要になりますね。
それは後述します。
新課程の統計分野は中学校や前の学年の内容からのつながりが濃くなる
他にも新課程で仮説検定の考え方を数学Iで学習します。
例えば, コイン を$10$回投げて表が$8$回出た, ということが起こったとき, このコインの表と裏の出る確率はともに$\frac{1}{2}$としてよいのでしょうか。
いや, そんなことは ないのではないか, と否定的な意見が出るでしょう。
この否定的な意見を検討するのが仮説検定の考え方です。
仮説検定は数学Bで本格的に学習します。
新課程の統計分野は中学校や前の学年の内容からのつながりが濃くなります。
そのことを意識して勉強しましょう。
新課程数学 I「データの分析」
中学校で「データを度数分布表にまとめ, それをヒストグラムにする」ことを学習しました。
ヒストグラムは度数分布に比べ,分布が見た目で判断しやすくなります。
ただ,ヒストグラムは中央値などの具体的な値が分かりにくいものです。
そこで, データをだいたい四分割する四分位数を考え, それらを目で見て判断出来るように箱ひげ図を考えました。
偏差, 分散, 標準偏差
数 I の話はここからスタートです。
例えば, 下の 2つのデータを考えてみましょう。
$①:3, 4, 5, 6, 7, 8, 9$
$②:5, 6, 6, 6, 6, 6, 7$
①, ②のデータの平均値と中央値はともに$6$となります。
ヒストグラムを 見てみると,
2つのデータは特徴が異なるものの, 代表値は一致するため, これらを区別するものが必要になります。
その際, これらのデータは「平均値からのばらつき」の特徴が異なるので, このばらつきを数値化したものを考えます。
それが偏差, 分散, 標準偏差です。
四分位範囲や標準偏差を根拠に外れ値を考える
ここで, 先ほど出てきた外れ値について再び考えてみましょう。
外れ値とは,データの中で極端に大きいもの, 極端に小さいものでした。
何を根拠に大きい, 小さいの判断をするのでしょうか。
それは四分位範囲や標準偏差です。
考える事象にもよりますが, 四分位範囲の場合, 第$1$四分位数$−1.5×$四分位範囲以下, 第$3$四分位数$+1.5×$四分位範囲以上を外れ値とします。
標準偏差の場合は平均値より$±$標準偏差$×2$(あるいは$3$)以上離れたものとします。
ばらつきを表す量である分散などの学習のあとの流れは現行過程と同じで, 2つのデータの関係性を表す共分散, 相関係数を考えます。
▼共分散に関してはこちらを参照してください.
仮説検定
いよいよ仮説検定のお話が登場です。
先ほど登場したコイン投げのお話です。
「コインを$10$回投げる」という試行を何回も繰り返し, 表が出る回数の度数分布表を作ります。
実際にコインを$10$回投げるという試行を$20$回繰り返し,その結果をまとめてみると次のようになったとします。
回数(回) | 度数(回) | 相対度数 |
0 | 0 | 0 |
1 | 1 | 0.05 |
2 | 0 | 0 |
3 | 1 | 0.05 |
4 | 4 | 0.20 |
5 | 8 | 0.40 |
6 | 4 | 0.20 |
7 | 1 | 0.05 |
8 | 1 | 0.05 |
9 | 0 | 0 |
10 | 0 | 0 |
このとき, $8$回以上表がでる回数の相対度数は$0.05$で非常に小さいです。
これは稀なことが起こったと判断出来るのでしょうか。
このデータから実際に平均値を計算すると$4.95$で, 標準偏差は$1.43$となります。
上で説明した外れ値の考え方を使ってみましょう。
$4.95 + 1.43 × 2 = 7.81$となりますか ら, これ以上の値は外れ値と考えることが出来ます。
したがって, $8$回というのは外れ値といえます。
つまり極端に大きいデータが得られたことになるので, 「コインの裏表の出る確率はそれぞれ$\frac{1}{2}$とはいえない」と結論付けることができます。
さらに数学Bに入って詳しく検討する方法を学習することになります。
数学Bの「仮説検定」
現行の過程では,以前公開した「数学 B『確率分布と統計的な推測』講義ノート」を参照してください。
▼「数学 B『確率分布と統計的な推測』講義ノート」はこちら
2022年からは新たに「仮説検定」が入ってきます。
考え方は数学Iで学習しています。
数学Bではある確率変数が二項分布や正規分布に従うことを利用して実際に確率を計算して検討します。
新課程になっても仮説検定以外は変わらないでしょう。
入試で出題されるのは典型的なものが大半
数学 I の「データの分析」は共通テストをはじめとして, いろいろな大学で出題されています。
一方で, 数学Bの「確率分布と統計的な推測」を出題範囲にしている大学は限られています。
2021年現在では共通テスト II·B, 横浜市立大, 滋賀大, 長崎大, 鹿児島大が選択問題として出題しています。
実際の問題は典型的なものが大半です。
対策は比較的取りやすいでしょう。
おわりに
今回は新課程の統計分野についてお話しました。
中学生から確率統計の学習が始まり, 通常は高校2年で学習する数学Bまで内容が直結していきます。
今後につながるということを意識して学習しましょう!
それでは, 今回はこの辺で!
理学部数学科を卒業した後、首都圏の塾や予備校で受験数学を指導。
定義を大切にし、定理や公式の原理から問題解決の突破口を見つけ、実際に問題を解くときの考え方を示しながら答案を作成していく授業には定評がある。