Learn business and economic statistics using Python in this comprehensive course covering fundamental statistical concepts and programming techniques. Master Python basics, data manipulation with Pandas, and advanced statistical analysis methods. Explore data visualization using Matplotlib and Seaborn libraries, perform correlation analysis, and understand hypothesis testing. Dive into generalized correlation analysis including logistic regression and Poisson models. Study classification techniques like Naive Bayes, decision trees, and random forests. Analyze time series data using moving averages, exponential smoothing, and ARIMA models. Conclude with an introduction to deep learning, covering neural networks, RNN, LSTM, and GRU, with practical implementations using PyTorch. Gain hands-on experience through real-world business examples and comprehensive exercises throughout each module.
Overview
Syllabus
- 第一章:数据与统计
- 1.1 商务与经济统计的基本概念
- 1.2 python编程环境准备
- 第二章:python语言基础
- 2.1 Python 语法基础
- 2.2 Python 数据类型与数据容器
- 2.3 Python 运算符
- 2.4 Python 程序结构
- 2.5 Python 函数
- 第三章:Pandas数据读取与处理
- 3.1 Pandas数据结构
- 3.2 Pandas数据读取
- 3.3 Pandas数据处理
- 第四章:Pandas数据分析与汇总
- 4.1 描述统计准备
- 4.2 数值变量的描述统计
- 4.3 分组的数值变量的描述统计
- 4.4 分类变量的描述统计
- 4.5 分组的分类变量描述统计
- 第五章:Python数据可视化
- 5.1 分类变量的可视化(Matplotlib、Pandas)
- 5.2 数值变量的可视化(Pandas、Seaborn)
- 5.3 数值变量之间关系的可视化(Pandas, Seaborn)
- 第六章:相关性分析
- 6.1 假设检验
- 6.2 列联表分析
- 6.3 方差分析
- 6.4 一元线性回归
- 6.5 多元线性回归
- 第七章:广义相关性分析
- 7.1 Logistic 回归模型
- 7.2 多分类Logistic回归模型
- 7.3 泊松回归模型
- 7.4 负二项回归模型
- 第八章:分类数据分析
- 8.1 朴素贝叶斯模型
- 8.2 决策树
- 8.3 随机森林
- 8.4 模型评价
- 第九章:时间序列分析
- 9.1 时间序列概述
- 9.2 移动平均和指数平滑
- 9.3 趋势预测模型
- 9.4 ARIMA模型
- 9.5 实例分析
- 第十章:深度学习
- 10.1 神经网络简介
- 10.2 循环神经网络 RNN/长短时记忆网络 LSTM/门控循环单元 GRU
- 10.3 基于PyTorch的数据分析实例
- 期末考试
Taught by
Hu Yang