Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

XuetangX

数据挖掘与可视化

Southwestern University of Finance and Economics via XuetangX

Overview

    本课程将帮助大家理解数据挖掘的基本流程和步骤,掌握常用的数据挖掘模型和方法,熟练地利用python语言实现数据挖掘模型以及进行评价和优化,从而具备的基本的数据挖掘和处理的能力。教学内容主要包括10个部分,即:

  1. 数据挖掘概述

  2. 数据获取技术

  3. 数据探索和可视化技术

  4. 数据预处理技术

  5. 基本分类模型及应用

  6. 高级分类模型及应用

  7. 回归模型及应用

  8. 聚类模型及应用

  9. 关联规则挖掘模型及应用

  10.异常检测模型及应用


Syllabus

  • 第一章 数据挖掘概述
    • 1.1 数据挖掘概述
  • 第二章 数据获取
    • 2.1 本地数据的读取
    • 2.2 网络在线数据爬取
  • 第三章 数据探索
    • 3.1 数据的特征与统计描述
    • 3.2 数据可视化
    • 3.3 数据的相关性和相似性度量
  • 第四章 数据预处理
    • 4.1 数据清洗原理和方法
    • 4.2 数据变换原理和方法
    • 4.3 数据集成和规约原理和方法
    • 4.4 特征工程理论和方法
  • 第五章 基本的分类模型
    • 5.1 分类问题概述
    • 5.2 朴素贝叶斯分类器及应用
    • 5.3 K最近邻分类器及应用
    • 5.4 决策树的原理及应用
    • 5.5 模型性能评价方法
  • 第六章 高级分类模型
    • 6.1 装袋和随机森林的原理及应用
    • 6.2 提升的原理及应用
    • 6.3 类不平衡问题和处理方法
  • 第七章 回归模型
    • 7.1 线性回归模型的原理及应用
    • 7.2 支持向量回归模型的原理及应用
  • 第八章 聚类模型
    • 8.1 k-means聚类算法的基本原理
    • 8.2 k-means聚类算法的进一步讨论
    • 8.3 聚类算法的性能评价方法
    • 8.4 DBSCAN聚类算法的原理和应用
  • 第九章 关联规则分析模型
    • 9.1 关联规则挖掘的基本概念
    • 9.2 Apriori算法的原理和应用(一)
    • 9.3 Apriori算法的原理和应用(二)
    • 9.4 FP-growth算法的原理和应用
  • 第十章 异常检测模型
    • 10.1 异常检测的概念和基本方法
    • 10.2 孤立森林异常检测方法
  • 期中考试

    Taught by

    Lei Wang, JiangtaoQiu, and XiaolongChen

    Tags

    Reviews

    Start your review of 数据挖掘与可视化

    Never Stop Learning.

    Get personalized course recommendations, track subjects and courses with reminders, and more.

    Someone learning on their laptop while sitting on the floor.