该课程作为数据科学与大数据专业的核心课程,主要介绍数据科学与大数据专业应用中的重要数学原理与思想。课程不是对传统数学知识的简单重复与组合,而是通过对数据科学领域中的具体问题进行分解,分门别类的介绍不同的大数据分析任务及其相关的数学知识,将数学基础知识的教学融入到解决实际问题的算法原理上去,让学生在理解数据分析方法的同时,能够更加深刻的体会其中数学基础原理及其在算法设计中起到的作用,不断提高学生提出问题、分析问题、解决问题的能力。课程始终坚持理论联系实践的宗旨,以解决具体问题为驱动,提高学生学习的兴趣与积极性。
Overview
Syllabus
- 1 课程概述
- 1.1 课程概述
- 1.2 数据类型
- 1.3 数据科学能做什么
- 2 数学思想与数学分析
- 2.1 数学思想
- 2.2 数学分析
- 2.3 莱布尼茨的微积分思想
- 2.4 牛顿的微积分思想
- 3 空间与代数
- 3.1 空间概述
- 3.2 向量与矩阵
- 3.3 线性空间与矩阵乘法
- 3.4 特征值与特征向量
- 4 数据降维
- 4.1 数据降维
- 4.2 主成分分析
- 4.3 奇异值分解
- 4.4 非负矩阵分解
- 5 数据聚类
- 5.1 聚类分析概述
- 5.2 k-means算法
- 5.3 k-means算法的局限性
- 5.4 高斯混合模型
- 5.5 层次聚类与linkage函数
- 5.6 距离概述
- 6 数据分类
- 6.1 分类算法概述
- 6.2 线性支持向量机
- 6.3 非线性支持向量机
- 6.4 决策树算法
- 7 回归分析
- 7.1 线性回归
- 7.2 线性回归的评价
- 7.3 多项式回归
- 7.4 弹性网络
- 7.5 逻辑回归
- 8 图论概述
- 8.1 图论基础
- 8.2 复杂网络模型
- 8.3 基于拓扑结构的中心性
- 8.4 基于全局属性的中心性
- 8.5 谱聚类算法
- 9 概率基础
- 9.1 概率基础
- 9.2 理解假设检验
- 9.3 t检验与F检验
- 10 数据分析概述与案例
- 10.1 数据分析方法总结
- 10.2 数据分析案例
Taught by
Bolin Chen, Li Xingyi, and Shang Xuequn