データサイエンス概論
開設大学 | 豊橋創造大学 |
---|---|
科目コード | 243202 |
担当教員 | 中澤 陽平(経営学部講師) |
学年配当 | 3年 |
単位数 | 2単位 |
曜日 | 火曜 |
開講期間 | 春学期 |
実施形式 | 対面 |
開講時間割1 | 3限 13:10 ~ 14:40 |
教室 | 豊橋創造大学キャンパス |
履修条件 | アンケート調査やマーケティング、人工知能(AI)に興味がある学生は履修を強く勧める。また、演習で実際に処理を行うため、基礎的なPC操作に関しては修得していることが望ましい。 |
募集定員 | 20 |
募集時期 | 4月 |
開講期間 | 4/5~7/24 |
講義概要 | サイエンスとは,ある分野を対象として科学的な方法により知識体型を築く活動のことをいう.このことからデータサイエンスとは,データを科学的に扱うことである.つまり,科学的な方法(データの収集,可視化,分析と解析,評価,考察)により,データを処理し,意思決定や行動に役立たせることである. IT技術の進歩により,企業は多種多様なデータをリアルタイムで入手することが可能となった.ビジネスの分野(マーケティング,経営,広告など)においては,この膨大なデータからデータ分析・解析を行い,問題発見・解決手法の提案をする力が求められる.これからの社会では,データサイエンスは必須のスキルとなりつつある. 本講義では,データサイエンスの基礎・基本である統計学(データを分析・解析),機械学習(データを分類・データから予測)について説明する.また,演習を交え分析・解析力を鍛える. 本講義は,座学と演習を交えて進める. また,Pythonを用いて演習を行う.(プログラミング等が主目的ではない.) 第1回(講義・演習)イントロダクション,データの種類と尺度,Pythonの基礎 第2回(講義・演習)代表値やばらつき具合いとデータの可視化(ヒストグラム・箱ひげ図) 第3回(講義・演習)相関係数と散布図 第4回(講義・演習)区間推定,母集団の調査(z検定,t検定,F検定) 第5回(講義・演習)対応のないデータと対応のあるデータ(t検定) 第6回(講義・演習)比率の検定(カイ二乗検定,マクネマー検定) 第7回(講義・演習)3群以上の平均値の差の検定(分散分析,多重比較) 第8回(講義・演習)ノンパラメトリック検定(2群:Mann-Whitney の U 検定,ウィルコクソンの符号付順位検定,3群以上:クラスカル・ウォリス検定,フリードマン検定) 第9回(講義・演習)機械学習とは,機械学習の手順 第10回(講義・演習)回帰:線形回帰 第11回(講義・演習)分類:ロジスティック回帰,SVM(サポートベクターマシン) 第12回(講義・演習)分類:決定木,ランダムフォレスト 第13回(講義・演習)分類:k-NN(k近傍法) 第14回(講義・演習)クラスタリング:k-means(k平均法) 第15回(講義・演習)まとめ・画像から数字の予測,PCA(主成分分析) (※受講学生の習熟度等により授業計画を変更することもある) ※演習課題は,提出締め切り後に解説とともにフィードバックを行う. |
テキスト・参考文献 | 【テキスト】 ・レジュメを配布する ・講義資料は,LMSを通じて配布する ・科目履修生は適宜個別に対応する 【参考書】 ・増井敏克: "RとPythonで学ぶ統計学入門", オーム社, 2021.5.27., 978-4-274-22705-9 森巧尚: "Python3年生 機械学習のしくみ 体験してわかる!会話でまなべる!", 翔泳社, 2021.12.6., 978-4-7981-6657-5 ・阿部真人:"データ分析に必須の知識・考え方 統計学入門", ソシム, 2021.11.27., 978-4-8026-1319-4 ・石村貞夫:"入門はじめての統計解析", 東京図書, 2006.11.1., 978-4-489-00746-0 羽山博: "やさしく学ぶ データ分析に必要な統計の教科書", 978-4-295-00365-6 |
試験・評価方法 | 演習課題(30%,LMSで提出.ほぼ毎回),小テスト(30%,LMSまたはペーパーで出題.3回程度),定期試験(40%,レポート課題)の結果から,到達目標が達成できているか評価する。 |
別途必要な経費 | 特になし |
その他特記事項 | 特になし |
科目名(英語) | Introduction to Detascience |
使用言語 | 日本語 |