統計学知識ゼロの男が統計検定2級に挑戦した話です。
統計検定を受けようと思った理由
統計検定を受けようと思った理由は、自分には統計学の知識が全く足りていないと思ったからです。統計学の知識を身に付けようと思ったのは「データ分析で問題解決が出来るプラント技術者となりたい」と思ったからです。
今はAIや機械学習が世の中のブームですが、プログラミング能力だけを身に付けるのは少々危険だと思います。データの分析結果を正しく読み解くには統計学の知識も必要不可欠であると考えます。
Drew Conwayがデータサイエンスについて定義付けしたベン図を紹介します。
The Data Science Venn Diagram — Drew Conway
データサイエンティストに求められるスキルは以下の3つで、3つが重なった部分がデータサイエンスだと定義されています。
- 実質的な専門能力(自分の専門領域)
- ハッキングスキル(プログラミング能力、分析ツールを使うスキル)
- 数学、統計学の知識
自分の場合、専門知識とプログラミング能力(簡単なレベル)はあるけど統計学の知識はゼロでした。統計的アプローチで問題解決を出来るようになりたいと思ったのが統計学を勉強しようと思ったキッカケです。基礎知識を習得するには資格勉強が一番簡単なモチベーションになるので今回、統計検定2級に挑戦してみました。
受験前の自分の統計レベル
- 三流私立大学の工学部出身。統計学の授業は受けていない。
- 高校数学も微妙なレベル。順列や組み合わせの問題は苦手。
- Excelで単回帰分析や重回帰分析は出来るけど、t値やP値の意味はわかっていない=出力される数字の意味を理解していない。
3つ目は、まさに上のベン図で示すところの「危険な領域」ですね。
受験前にやったこと
統計検定2級の前にまずは統計の基礎の基礎を身につけるために通称ハンバーガー本を読みました。
ハンバーガー本を一通り読むことで分散や区間推定の考え方がなんとなく理解できました。ハンバーガー店の具体例で話が進んでいくのでスッと頭に入ってきやすいです。ただし、自分で手を動かして問題を解いたわけではないため、内容すぐに忘れてしまうという…
ハンバーガー本ともう1冊購入したのは「完全独習 統計学入門」です。
この本でもt検定やカイ二乗検定について解説がされています。ハンバーガー本に比べると実践から理論に寄った内容です。ただし、これもだいぶ易しめの内容なので、あくまで統計学の導入と言った感じの本です。
上の2冊を読んだあとは、とけたろうさんのYouTubeの統計検定2級講座を見つつ、公式問題集に取り掛かりました。
公式問題集をやってみてわからないところがあれば統計WEBやネットで調べるという感じです。問題集を2、3週やってからCBT試験を受けました。7~8割程度の理解力でしたが完璧にする必要もないなと思ってとりあえず受験してみました。
受験1回目(2024年3月)→不合格
1回目の結果は58点で不合格。100点満点中60点以上で合格なので、あと1問取れていれば合格でした。体感6割は取れていると思ってましたがあと1問届かず。ちゃんと見直ししておけばなと後悔しました。でも、このときは「CBT方式の試験に慣れてなかったからなあ。次やれば受かるやろ」と思ってて正直舐めていました。この油断が次の失敗に繋がります。傾向と対策をきちんとやらずに、とりあえず公式問題集をやり直して2ヶ月後に再挑戦しました。
受験2回目(2024年5月)→不合格
2回目の結果は55点でした。さすがに2連続で不合格は少し心が折れました。「統計検定2級は基礎」とか「過去問やってたら受かる」と言われるように決して2級は難関資格ではないですからね。
不合格の敗因は2つあって1つは「統計学の基礎をちゃんと理解していないこと」、もう1つは「前回の試験でわからなかったところを対策していなかったこと」だと思います。CBT試験を受けて印象的だったのは、公式問題集に出ていないような問題も結構出題されていたことです。というわけでさすがに今回は受験直後、問題を覚えてるうちにググって復習をやりました。
また、今の自分のレベルは、問題の解き方を覚えてるだけ=本質的に理解していない気がして「入門 統計学(第2版): 検定から多変量解析・実験計画法・ベイズ統計学まで」を読んで勉強しました。
この参考書では以下のポイントが特に勉強になりました。
- F検定
- 一元配置分散分析
- スチューデントのt検定とウェルチのt検定の違い、使い分け
3つ目は統計検定2級の出題内容とはあまり関係ないですが「等分散性の検定をやってからスチューデントのt検定をやるより初めからウェルチのt検定をすべき」って話は読んでて「なるほど!」となりました。そのほか統計学の歴史にも触れられており、この本で統計学の興味や理解が深まりました。公式問題集を解くだけではちゃんと理解が出来なかったので、この本は買って正解でした。
受験3回目(2024年7月)→合格!
3回目は79点で無事に合格しました。今回も落ちたらやばいなと思ってたけどさすがに合格でした。
まとめ
ネットでは「統計検定2級は公式問題集やってたら受かる」「◯週間で合格した」みたいなことを書いてる記事が多いので完全に舐めてましたね。。。こういう内容を書いているのは大抵、それなりの大学を出ている人たち(統計知識はなくても学習能力は高い人たち)なので真に受けて簡単なんだと勘違いするのは間違いですね。
元々の統計知識がゼロの人は短期間で詰め込んでも絶対に記憶に残らないのでコツコツやっていくのが良いと思います。私の場合は日々の勉強時間は1日30分~1時間程度でした。試験前は1日1~2時間くらいやりましたが普段は30分~1時間くらいで、やったりやらなかったりという感じです。トータルの勉強時間は多分、数十時間(100時間は行ってない?)くらいだと思います。
もし1回目で合格してたら中途半端な理解度で統計の勉強が終わってたので不合格だったのは逆に良い経験だったと思ってます。以上、統計学知識ゼロの男が統計検定2級に挑戦した話でした。