データ科学入門
Table of Contents
このサイトは教員研修のために作成したものです。
moodle に同じデータを置いてありますので、「基礎情報教育」の受講生は moodle 利用してください。
授業に関する情報
授業スライド
学部の授業「人口と食糧問題」で人口問題に関するデータ分析について解説し ています。以下が授業のスライドです:
参考文献
講義内容についての参考文献
The Data Science Design Manual
洋書だが、この講義で一番参考にした書籍。最近、日本語訳 が出たようです。
Fundamentals of Data Visualization
こちらも洋書。グラフによる可視化が分かりやすく解説されている。
-
AI の問題点が分かりやすく解説されている。数学の知識が無くても読めると 思います。
-
授業では触れられなかった、ランダム化実験と自然実験についての一般向け の解説。数学の知識が無くても読めます。
Python についての参考文献
授業のスライドで使用した図はほとんどが Python を用いて作成しています。興 味がある方は次の書籍をお薦めします:
-
Python の基礎が丁寧に書かれている。
Python データサイエンスハンドブック (Jake VanderPlas)
データ分析への応用について詳しく書かれている。Python の基礎についての 知識があることが前提になっているので、1. の後に読むと良い。
各種データ
鳥のデータセット
アヤメの分類問題
教育用標準データセット
こちら のページで用意されているデータセットです:
世界の国々の幸福度データセット
上のファイルは Kaggle からダウンロードしたデータセットを元に編集しています:
平均寿命のデータセット [センター試験2020]
平均寿命のデータの元データセット ← e-stat からダウンロードしたもの
平均寿命のデータセット ← 「平均寿命のデータの元データ」から作成したもの。作成 方法については、 こちら のサイトを参考にさせていただきました。
NBA選手のデータセット
オリンピック出場選手のデータセット
徳島市の 6月の降水量
日本の人口のデータセット
タイタニック号沈没事故の乗客データセット
Kaggle からダウンロードしたデータセットの変量名を日本語にしたものです: