Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

XuetangX

python数据挖掘

Qingdao University via XuetangX

Overview

课程背景


本课程的学习目的是通过深入探讨数据挖掘原理,训练Python程序编写能力,培养信息专业高年级本科学生具备初步的科研能力和解决实际问题的能力。

本课程面向零基础,以大量实例实战的方式,学习Python语言,以及数据挖掘基本原理和常用算法,最终成为Python数据挖掘分析师,初步掌握数据挖掘的算法。使同学们在学习本课程后,能实现利用Python语言的数据挖掘算法应用。


课程目标


目标1:具备熟练应用集成环境进行Python语言的编写、编译与调试的能力
目标2:具备良好的结构化程序设计的能力;
目标3:具备灵活运用Python语言完成对问题对象的模型建构并初步实现的能力。
目标4:学习和掌握数据挖掘的关联分析、分类分析、聚类分析等常用算法;
目标5:培养学生应用数据挖掘技术对现实数据进行有效分析和处理的能力;

目标6:掌握Python程序编程方法及其数据挖掘技术的Python实践方法。


课程设计原则


面向零基础,以大量实例实战的方式,学习Python语言,以及数据挖掘基本原理和常用算法,最终成为Python数据挖掘分析师。



Syllabus

  • 第一章 数据挖掘导论
    • 1.1 数据挖掘的社会需求
    • 1.2 什么是数据挖掘
    • 1.3 数据挖掘的分类
    • 1.4 数据挖掘的步骤
    • 1.5 数据挖掘与相关技术
  • 第二章 数据仓库与联机分析处理
    • 2.1 数据仓库与数据库的区别
    • 2.2 数据仓库的定义
    • 2.3 数据集市
    • 2.4 数据仓库系统结构
    • 2.5 数据仓库模型
    • 2.6 什么是OLAP
    • 2.7 OLAP的数据结构
    • 2.8 OLAP分类
    • 2.9 OLAP与数据挖掘的关系
  • 第三章 数据预处理与Python实践
    • 3.1 为什么数据预处理
    • 3.2 数据清理
    • 3.3 数据集成与变换
    • 3.4 数据规约
    • 3.5 数据离散化与概念分层
    • 3.6 Python环境安装
    • 3.7 Python数据读取
    • 3.8 Pandas数据预处理
    • 3.9 Pandas数据清洗
  • 第四章 关联分析技术
    • 4.1 什么是关联规则挖掘
    • 4.2 Apriori算法
    • 4.3 Apriori算法分析
    • 4.4 FP-Growth算法
    • 4.5 什么是多值关联规则
    • 4.6 多值关联规则挖掘算法
    • 4.7 多值关联规则的合并
    • 4.8 关联规则挖掘Python实践
  • 第五章 决策树分类分析
    • 5.1 什么是分类分析
    • 5.2 决策树分类的基本思想
    • 5.3 ID3决策树算法
    • 5.4 决策树算法的优劣
    • 5.5 C4.5决策树算法
    • 5.6 C4.5算法处理连续属性
    • 5.7 C4.5算法处理缺失值
    • 5.8 C4.5算法的交叉验证
    • 5.9 C4.5算法示例
    • 5.10 决策树算法的Python实践
    • 5.11 决策树案例
  • 第六章 随机森林分类分析
    • 6.1 随机森林基本思想
    • 6.2 CART构建决策树算法
    • 6.3 随机森林的投票机制
    • 6.4 随机森林Python实践——数据准备
    • 6.5 随机森林Python实践——模型训练与预测
    • 6.6 随机森林Python实践——交叉验证与精度调优
  • 第七章 贝叶斯分类分析
    • 7.1 朴素贝叶斯算法
    • 7.2 朴素贝叶斯Python实践——高斯朴素贝叶斯原理
    • 高斯朴素贝叶斯的Python实践
  • 第八章 支持向量机分类分析
    • 8.1 支持向量机分类原理
    • 8.2 优化算法简介
    • 8.3 支持向量机分类算法
    • 8.4 支持向量机分类示例
  • 第九章 感知器分类分析
    • 9.1 感知器分类思想
    • 9.2 感知机学习算法
    • 9.3 感知器学习示例
  • 第十章 划分聚类分析
    • 10.1 什么是聚类分析
    • 10.2 距离测算方式
    • 10.3 划分聚类的kmeans算法
    • 10.4 K中心点算法思想
    • 10.5 K中心点PAM算法示例
    • 10.6 Kmeans算法Python类介绍
    • 10.7 Kmeans算法训练预测Python实践
  • 第十一章 层次聚类分析
    • 11.1 层次聚类的基本思想
    • 11.2 最大最小距离测算方式的层次聚类
    • 11.3 中间距离测算方式
    • 11.4 重心法测算方式
    • 11.5 类平均法测算方式
    • 11.6 离差平方和测算方法
    • 11.7 Birch层次聚类基本思想
    • 11.8 Birch聚类特征树构建算法
    • 11.9聚类特征与簇直径的关系
    • 11.10 Birch层次聚类的Python实践
  • 第十二章 密度聚类分析
    • 12.1 密度聚类算法思想
    • 12.2 DBSCAN算法原理
    • 12.3 DBSCAN算法示例
    • 12.4 DBSCAN算法性能
    • 12.5 OPTICS密度聚类算法思想
    • 12.6 OPTICS算法示例-1
    • 12.7 OPTICS算法示例-2
    • 12.8 OPTICS算法描述
    • 12.9 DBSCAN密度聚类Python实践
    • 12.10 OPTICS密度聚类Python实践-1
    • 12.11 OPTICS密度聚类Python实践-2
  • 期末考试

    Taught by

    Wang Changying

    Tags

    Reviews

    Start your review of python数据挖掘

    Never Stop Learning.

    Get personalized course recommendations, track subjects and courses with reminders, and more.

    Someone learning on their laptop while sitting on the floor.