どうも。こんにちは。
ケミカルエンジニアのこーしです。
本日は、「【初心者向け】統計学のおすすめ本5選」について解説します。
多くの統計学の教科書は、初心者には難しく、教科書の選定を間違えると挫折してしまう可能性すらあります。
そこで本記事では、初めて統計学を学ぶ方向けに、統計学の基礎を固めるためのオススメ本を紹介します!
私自身、会社に入って初めて統計学に触れましたので、初心者の気持ちは忘れてないです。
教科書毎の特徴をふまえてオススメ本を紹介しますので、気軽に読んでいってください!
この記事を書いた人
こーし(@mimikousi)
目次
【初心者向け】統計学のおすすめ本5選
結論、下記の5冊です!!
おすすめ本
① 統計学がわかる 難易度☆
② 統計学がわかる【回帰分析・因子分析編】 難易度☆
③ 基本統計学(第3版) 難易度☆☆
④ 統計学入門(基礎統計学Ⅰ) 難易度☆☆☆
⑤ 心理統計学の基礎 難易度☆☆☆
ちなみに、①〜③の内容で、統計検定2級に十分対応できます。
④〜⑤が、統計検定準1級向けです。(ただし、この2冊だけでは不十分です)
統計検定2級向けのおすすめ参考書についてはコチラで詳しく解説しています。
-
【失敗しない】統計検定2級のオススメ参考書(無料あり)
続きを見る
挫折しないための学習ステップ
初心者が統計学の基礎を学ぶには、「急がば回れ」方式で下記3ステップを踏むべきだと考えています。
挫折しないための学習ステップ
STEP1 マンガなどで統計学の全体像や活用方法を学ぶ(①、②)
STEP2 初学者向けの統計学の教科書を読む(③)
STEP3 伝統的な統計学の教科書を読む(④、⑤)
最初から専門家がオススメするような、伝統的な統計学の教科書を読んでしまうと挫折する可能性が高くなります。
そこで、マンガなどで全体像をつかみながら、徐々に厳密な理論を身につけていけばよいと思います。
教科書の特徴【まとめ】
統計検定2級の出題範囲をベースに、それぞれの教科書のカバー範囲をまとめてみました。
②統計学がわかる【回帰分析・因子分析編】 | ③基本統計学(第3版) | ④統計学入門(基礎統計学Ⅰ) | ⑤心理統計学の基礎 | ||
難易度 | ☆ | ☆ | ☆☆ | ☆☆☆ | ☆☆☆ |
度数分布 (ヒストグラム) |
○ | ○ | |||
1変数データ (代表値など) |
○ | ○ | ○ | ○ | |
2変数データ (相関、共分散など) |
○ | ○ | ○ | ○ | |
確率 確率変数 確率分布 |
○ | ◎ | △ ほぼ無し |
||
標本分布 推定 仮説検定 |
○ | ○ | ○ | ○ | |
回帰分析 | ○ | ○ | ○ | ◎ | |
分散分析 | ○ | ○ | |||
因子分析 | ○ | ○ | |||
時系列分析 | ○ |
また、上記5冊の特徴を下記のようにまとめてみました。
STEP1 マンガなどで統計学の全体像や活用方法を学ぶ
① 統計学がわかる 難易度☆
ハンバーガーショップを例に「推定」や「仮説検定」、「分散分析」を学ぶことができます。
分散分析は、統計検定2級レベルならこの本でカバーできてしまいます。
推定や仮説検定の考え方を学ぶことができますが、一部しか扱っていないため、他の教科書で補う必要があります。
本気出したら、1日で読めてしまうくらいのボリュームです。
② 統計学がわかる【回帰分析・因子分析編】難易度☆
「相関係数」や「無相関検定」、「回帰分析」、「因子分析」を学ぶことが出来ます。
心理統計学の基礎を読む前に、この本で全体像をつかんでおきましょう。
もし、心理統計学の基礎を読んでみて、理解できそうであれば、この本は飛ばしても構いません。
STEP2 初学者向けの統計学の教科書を読む
③ 基本統計学(第3版)難易度☆☆
「確率の基礎」から「推定」や「仮説検定」、「回帰分析」など非常にバランスの良い教科書です。
後述の統計学入門(基礎統計学Ⅰ)や心理統計学の基礎が難しいと感じたら、こちらから読み進めることをオススメします。
わたし自身も最初は、統計学入門(基礎統計学Ⅰ)や心理統計学の基礎を読んでいたのですが、難しくて全然前に進めなかったため、この本を購入しました。
統計検定2級向けのテキストとしても有名ですね。
STEP3 伝統的な統計学の教科書を読む
④ 統計学入門(基礎統計学Ⅰ)難易度☆☆☆
通称「赤本」と呼ばれている定番の教科書です。
「推定」「仮説検定」「回帰分析」に重きをおいている教科書が多いなか、この本は「確率・確率変数・確率分布」が半分以上を占めています。
「確率分布」については、統計検定2級レベルであれば表面的な知識で良いですが、より難しい内容を学ぶ際には、重要になってきますので、手元に置いておくことをおすすめします。
書評記事はコチラ↓↓
-
【書評】「統計学入門」(東京大学出版会)
続きを見る
⑤ 心理統計学の基礎難易度☆☆☆
タイトルでは、「心理統計学」と言っていますが、9割は統計学の内容なので、特に気にしなくて大丈夫です。
また、統計学入門(基礎統計学Ⅰ)とはカバーしている範囲が全然違います。
確率に関する記載がほとんどないですが、「サンプルサイズの決め方」や「回帰分析のベクトル表現」がとても参考になりました。
「分散分析」や「因子分析」についても詳しく解説されているので、統計学入門(基礎統計学Ⅰ)で確率の基礎を学んだ後に取り組むのがおすすめです。
初心者にはやや難しいですが、説明がとにかく丁寧なので、ぜひ読んでみて下さい。
詳しい解説のついたワークブック(問題集)も出版されているので、その点でもおすすめですね。
書評記事はコチラ↓↓
-
【書評】心理統計学の基礎 難易度と読み方を解説!
続きを見る
その他の参考書(ステップ別)
いろいろな方がオススメしている参考書をステップ別にまとめてみました。
STEP1 マンガなどで統計学の全体像や活用方法を学ぶ
STEP2 初学者向けの統計学の教科書を読む
STEP3 伝統的な統計学の教科書を読む
次のステップへ
本記事で紹介した教科書は、あくまで基礎を固めるためのものであり、まだまだ実務で活かせるところは限られてくると思います。
ここからは、「自分が解決したい課題」に合う専門分野を学ぶ必要があります。
専門分野
- 多変量解析
- 時系列分析
- ベイズ統計
- 機械学習
- 深層学習
など
私が勤務する化学メーカーでは、深層学習を使う機会はまだまだ少なく(画像解析くらい)、世間で言われているほど重要視されていない気がします。
特に、製造現場ではブラックボックス化を極端に嫌う(原理原則がわかっていないと顧客に説明できない)ため、深層学習は軽視されています。
深層学習は、最終手段のイメージが強いですね。
ただし、「説明可能なAI」というのも開発されつつあるので、今後の動向に注目です。
数学の基礎
さらに、上記の専門分野を学ぶ際は、数学の知識がより重要となるため、下記についても勉強する必要があります。
- 微分・積分
- 線形代数
- 確率統計
私は、多変量解析を勉強し始めたくらいで、線形代数を復習しました。
その後、数理統計学、ベイズ統計学を勉強していく上で、数学の必要性を痛感しました。
統計学に必要な数学については、下記記事にまとめました。
-
【無料あり】統計学のための数学おすすめ参考書
続きを見る
解析ツール
「仮説検定」は、Excelでも関数がそろっていますので、十分実務に活かせるかもしれませんが、「多変量解析」など大量のデータを試行錯誤しながら解析するにはExcelでは限界を感じることがあります。
そこで、RやPython、SASなどが選択肢に上がってくると思います。
機械学習や深層学習では、Pythonを使用することが多いですね。
ビジネス現場ではPython、アカデミックではRを使うイメージです。
pythonの学習方法については下記の記事にまとめました。
-
【初心者向け】データサイエンスのためのPython学習方法
続きを見る
データ整備
データ解析の前に、データを解析できる形で収集・整理する必要がありますので、ネットワークやサーバー、データベース、SQLなど諸々の周辺知識が必要になります。
以上、「次のステップへ」については、簡単に説明しましたが、今後はそれぞれ別記事でまとめていきたいと思います。