社会科学におけるデータサイエンス(特別講義)
竹内 秀一 
単位: 2 開講期: 1期・2期 開講年度: 2024
閉じる
【授業表題】
教養としてのデータサイエンス入門
【授業の形態・方法・内容】
 この科目の授業形態は講義科目である。本学の「データサイエンス・スタンダード(DSS)」における「データサイエンス入門」科目として、教養教育の視点から社会科学におけるデータサイエンスについて概要を解説する。「特記事項[1]」に記載している「数理・データサイエンス・AI教育」についての必要性に鑑み、社会科学系大学である本学として基本的な対応をした特別授業の内容である。
 教科書の内容(以下の「授業計画」第2回~第12回)を解説することに加えて、参考文献[1]~[5]に基づいた関連する統計的データ分析手法について、補足説明をしながら講義をする。また、毎回の授業内においてクイズ(演習問題)に解答してもらう。
 第10回以降の授業の中で、学内外からゲスト講師を招き、実データの分析事例(経済データ・マーケティングデータ・医学薬学データ・スポーツデータなど)を紹介する予定である。この分析事例については概略をレポートにまとめてもらう。
 なお、演習問題およびレポート(期末レポートを含む)の全体講評については、次回授業時あるいはmanabaを利用して行う。
【到達目標】
 この科目は、全学DP2で掲げる「教養」に関する「基本的な知識と能力」を身につけるための科目である。特に、社会科学におけるデータサイエンス(統計科学)の基本を身につけることを目的としている。
【この授業科目とディプロマポリシーに明示された学修成果との関連】
(全学 DP2)幅広い教養と外国語に関する基本的な知識・能力
【事前・事後学習】
 事前学習として、教科書の指定された項目を熟読し、不明な点を確認しておくこと。また、事後学習として、関連する項目や授業中に出題されたクイズ(演習問題)を復習しながら再度読み返すこと。項目内容によっては、Excel等を利用して計算内容についても確認しておくこと。
 なお、「学則」上、この科目は「講義」科目にあたるので、授業時間外に行う事前事後学習に要する時間は4時間程度となる。
【授業計画】
第1回 ガイダンス、社会科学におけるデータサイエンスとは

「1-1.社会で起きている変化」
第2回 第Ⅰ章 ビッグデータの時代
 1.データサイエンスの登場  2.台頭するデータサイエンティスト

「1-1.社会で起きている変化」「1-3.データ・AIの活用領域」
第3回  3.統計学の流れ

「1-2.社会で活用されているデータ」「2-1.データを読む」「2-2.データを説明する」「2-3.データを扱う」「4-1. 統計および数理基礎」「4-5.テキスト解析」「4-6.画像解析」
第4回  4.コンピュータとインターネットの発展

「1-2.社会で活用されているデータ」「1-4.データ・AI利活用のための技術」「1-5.データ・AI利活用の現場」「1-6.データ・AI利活用の最新動向」「4-3.データ構造とプログラミング基礎」
第5回 第Ⅱ章 データとは何か
 1.定義と種類  2.コストと価値

「1-1.社会で起きている変化」「1-2.社会で活用されているデータ」「1-3.データ・AIの活用領域」「1-5.データ・AI利活用の現場」「1-6.データ・AI利活用の最新動向」「2-1.データを読む」「2-2.データを説明する」「2-3.データを扱う」「4-1. 統計および数理基礎」「4-4.時系列データ解析」「4-5.テキスト解析」「4-6.画像解析」
第6回  3.ばらつきと分布

「1-2.社会で活用されているデータ」「1-4.データ・AI利活用のための技術」「2-1.データを読む」「2-2.データを説明する」「2-3.データを扱う」「4-1. 統計および数理基礎」「4-7.データハンドリング」
第7回  4.相関と因果、回帰

「1-2.社会で活用されているデータ」「1-3.データ・AIの活用領域」「1-4.データ・AI利活用のための技術」「1-5.データ・AI利活用の現場」「2-1.データを読む」「2-2.データを説明する」「2-3.データを扱う」「4-1. 統計および数理基礎」
第8回  5.データに基づく意思決定と不確実性

「1-1.社会で起きている変化」「1-2.社会で活用されているデータ」「1-3.データ・AIの活用領域」「1-5.データ・AI利活用の現場」「2-3.データを扱う」
第9回  6.取り扱い上の倫理

「1-2.社会で活用されているデータ」「2-3.データを扱う」「3-1.データ・AIを扱う上での留意事項」「3-2.データを守るうえでの留意事項」「4-1. 統計および数理基礎」
第10回 第Ⅲ章 データに語らせる - 発見の科学へ向けたスキル
 1.データサイエンスのスキルの学び方  2.データ処理と可視化

「1-1.社会で起きている変化」「1-2.社会で活用されているデータ」「1-3.データ・AIの活用領域」「2-1.データを読む」「2-2.データを説明する」「2-3.データを扱う」「4-7.データハンドリング」
第11回  3.データの分析とモデリング   4.ビッグデータの処理と分析

「2-1.データを読む」「2-2.データを説明する」「2-3.データを扱う」「3-1.データ・AIを扱う上での留意事項」「3-2.データを守るうえでの留意事項」「4-1. 統計および数理基礎」
第12回  5.人工知能とデータサイエンス

「1-1.社会で起きている変化」「1-2.社会で活用されているデータ」「1-3.データ・AIの活用領域」「1-4.データ・AI利活用のための技術」「1-5.データ・AI利活用の現場」「1-6.データ・AI利活用の最新動向」「2-1.データを読む」「2-3.データを扱う」「4-7.データハンドリング」
第13回 データ分析の実際
(1)機械学習とAI(人工知能)

「1-1.社会で起きている変化」「1-2.社会で活用されているデータ」「1-3.データ・AIの活用領域」「1-4.データ・AI利活用のための技術」「1-5.データ・AI利活用の現場」「1-6.データ・AI利活用の最新動向」「2-1.データを読む」「2-2.データを説明する」「2-3.データを扱う」「4-1. 統計および数理基礎」「4-3. データ構造とプログラミング基礎」「4-7.データハンドリング」「4-8.データ活用実践(教師あり学習)」「4-9.データ活用実践(教師なし学習)」
第14回 (2)Excel

「1-1.社会で起きている変化」「1-2.社会で活用されているデータ」「1-3.データ・AIの活用領域」「1-4.データ・AI利活用のための技術」「1-5.データ・AI利活用の現場」「1-6.データ・AI利活用の最新動向」「2-1.データを読む」「2-2.データを説明する」「2-3.データを扱う」「4-1. 統計および数理基礎」「4-3. データ構造とプログラミング基礎」「4-7.データハンドリング」
第15回 (3)R、Python
まとめ、期末レポートについて

「1-1.社会で起きている変化」「1-2.社会で活用されているデータ」「1-3.データ・AIの活用領域」「1-4.データ・AI利活用のための技術」「1-5.データ・AI利活用の現場」「1-6.データ・AI利活用の最新動向」「2-1.データを読む」「2-2.データを説明する」「2-3.データを扱う」「4-1. 統計および数理基礎」「4-3. データ構造とプログラミング基礎」「4-7.データハンドリング」
第16回
第17回
第18回
第19回
第20回
第21回
第22回
第23回
第24回
第25回
第26回
第27回
第28回
第29回
第30回
【評価方法】
 授業参加点(クイズとしての「小テスト」約50%および「レポート」約20%)を約70%、期末レポートを約30%の割合で評価する。
【教科書】
竹村彰通著「データサイエンス入門」岩波書店
【参考文献】
[1]竹村彰通・姫野哲人・高田聖治編「データサイエンス入門 第2版」学術図書出版社
[2]北川源四郎・竹村彰通編 内田誠一・川崎能典・考中大輔・佐久間淳・椎名洋・中川裕志・樋口知之・丸山宏著「教養としてのデータサイエンス」講談社
[3]濵田悦生著・狩野裕編「データサイエンスの基礎」講談社
[4]篠崎信雄・竹内秀一著「統計解析入門[第3版]」サイエンス社
[5]菅由紀子・佐伯諭・高橋範光・田中貴博・大川遥平・大黒健一・森谷和弘・參木裕之・北川淳一郎・守谷昌久・山之下拓仁・苅部直知・孝中大輔著「最短突破 データサイエンティスト検定(リテラシーレベル)公式レファレンスブック 第2版」技術評論社
[6]日本統計学会編「日本統計学会公式認定 統計検定1級対応 統計学」東京図書
[7]日本統計学会編「日本統計学会公式認定 統計検定準1級対応 統計学実践ワークブック」学術図書出版
[8]日本統計学会編「改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎」東京図書
[9]日本統計学会編「日本統計学会公式認定 統計検定3級対応 データの分析」東京図書
[10]日本統計学会編「日本統計学会公式認定 統計検定4級対応 資料の活用」東京図書
[11]日本統計学会編「日本統計学会公式認定 統計検定データサイエンス基礎対応 データアナリティクス基礎」日本能率協会マネジメントセンター
※その他については、授業中に随時提示する。
【特記事項】
[1]「数理・データサイエンス・AI教育」について
 内閣府の「統合イノベーション戦略推進会議」で2019年6月11日に決定された「AI戦略2019~人・産業・地域・政府全てにAI~」(以下「AI戦略」)があり、これを踏まえて、「統合イノベーション戦略2019」が2019年6月21日に閣議決定されている。AI戦略の中の「Ⅱ.未来への基盤作り:教育改革と研究開発体制の再構築」において教育改革に関することが詳細に記述されている。大目標として「デジタル社会の基礎知識(いわゆる『読み・書き・そろばん』的な素養)である『数理・データサイエンス・AI』に関する知識・技能、新たな社会の在り方や製品・サービスをデザインするために必要な基礎力など、持続可能な社会の創り手として必要な力を全ての国民が育み、社会のあらゆる分野で人材が活躍することを目指し、2025年の実現を念頭に今後の教育にいくつかの目標が設定されている。とりわけ、大学・高専・社会人に対する目標として「文理を問わず、全ての大学・高専生(約50万人卒/年)が、課程にて初級レベルの数理・データサイエンス・AIを習得」するものとされ、「多くの社会人(約100万人/年)が、基本的情報知識と、データサイエンス・AI等の実践的活用スキルを習得できる機会をあらゆる手段を用いて提供」し、「大学生、社会人に対するリベラルアーツ教育の充実(一面的なデータ解析の結果やAIを鵜呑みにしないための批判的思考力の養成も含む)」が具体的に示されている。
[2]本講義では、数理・データサイエンス・AI教育強化拠点コンソーシアムが策定した「モデルカリキュラム」に準拠し、その「導入」、「基礎」、「心得」を含む講義を行う。「導入」として、「1-1.社会で起きている変化」、「1-2.社会で活用されているデータ」、「1-3.データ・AIの活用領域」、「1-4.データ・AI利活用のための技術」、「1-5.データ・AI利活用の現場」、「1-6.データ・AI利活用の最新動向」を含む。「基礎」には「2-1.データを読む」、「2-2.データを説明する」、「2-3.データを扱う」を含む。そして「心得」には、「3-1.データ・AI利活用における留意事項」、「3-2.データを守る上での留意事項」を含む。具体的には、上記授業計画における「」内において、各項目との対応関係を補足的に示す。
 なお、「オプション」として「4-1.統計および数理基礎」「4-2.アルゴリズム基礎」「4-3.データ構造とプログラミング基礎」「4-4.時系列データ解析」「4-5.テキスト解析」「4-6.画像解析」「4-7.データハンドリング」「4-8.データ活用実践(教師あり学習)」「4-9.データ活用実践(教師なし学習)」を一部含む。
[3]基礎的な数学(中学校レベルから高等学校1年生レベルの数学)がある程度理解できていることを前提に授業を進める。
[4]「授業計画」や「評価方法」を変更する場合は、授業時あるいはmanabaを利用して変更内容等を事前に通知する。
[5]「ゲスト講師による実データの分析事例紹介」を除き、(1期)と(2期)の授業内容は基本的に同じである。
【開講期・曜日時限・ペア・教員名】
開講期・曜日時限が下記の表で示されていますが、履修できる曜日時限は学年・学科等により異なる場合があります。自分の「履修登録」画面に表示される曜日時限のみ履修登録することができます。

開講期 曜日時限 ペア 教員名
1期 金2 竹内 秀一
2期 金2 竹内 秀一