データ科学入門

Table of Contents

授業で使用するデータやサイトへのリンク集

logo_footer.png

このサイトは教員研修のために作成したものです。

moodle に同じデータを置いてありますので、「基礎情報教育」の受講生は moodle 利用してください。


授業に関する情報

参考サイト

授業スライド

データ科学入門: 講義スライド

参考文献

講義内容についての参考文献

  1. The Data Science Design Manual

    洋書だが、この講義で一番参考にした書籍。最近、日本語訳 が出たようです。

  2. Fundamentals of Data Visualization

    こちらも洋書。グラフによる可視化が分かりやすく解説されている。

  3. おそろしいビッグデータ 超類型化AI社会のリスク

    AI の問題点が分かりやすく解説されている。数学の知識が無くても読めると 思います。

  4. データ分析の力 因果関係に迫る思考法

    授業では触れられなかった、ランダム化実験と自然実験についての一般向け の解説。数学の知識が無くても読めます。

Python についての参考文献

授業のスライドで使用した図はほとんどが Python を用いて作成しています。興 味がある方は次の書籍をお薦めします:

  1. 新・明解Python入門 (柴田 望洋)

    Python の基礎が丁寧に書かれている。

  2. Python データサイエンスハンドブック (Jake VanderPlas)

    データ分析への応用について詳しく書かれている。Python の基礎についての 知識があることが前提になっているので、1. の後に読むと良い。

各種データ

鳥のデータセット

アヤメの分類問題

アヤメのデータセット                         _

平均寿命のデータセット [センター試験2020]

平均寿命のデータの元データセットe-stat からダウンロードしたもの

平均寿命のデータセット ← 「平均寿命のデータの元データ」から作成したもの。作成 方法については、 こちら のサイトを参考にさせていただきました。

NBA選手のデータセット

オリンピック出場選手のデータセット

こちら のページで用意されているデータセットです:

オリンピック出場選手についてのデータ

国名の略語データ [国内オリンピック委員会 (NOC)で使用される]

徳島市の 6月の降水量

日本の人口のデータセット

タイタニック号沈没事故の乗客データセット

Kaggle からダウンロードしたデータセットの変量名を日本語にしたものです:

タイタニック号沈没事故の乗客のデータセット

Author: Tomoshige MIYAGUCHI

Created: 2023-07-23 日 20:02

Emacs 26.3 (Org mode 9.4.6)

Validate