Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Tsinghua University

分布式数据系统应用实战-入门

Tsinghua University via XuetangX

Overview

本课程是大数据与人工智能相关的通识课,不涉及信息类专业知识的精通掌握。专业受众广泛,以注重实践应用和产教融合为特色,在国内外都具有一定创新性。基于开源分布式数据库(以开源的基于PostgreSQL的PB级分布式数据库Greenplum为例展开),以基本的大数据处理、分析及机器学习为目标,不涉及复杂的数据库应用开发和内核开发。帮助学习者了解大数据分析技术发展历程和技术趋势。使学习者在本领域方向上具有基本的动手实践、技术选择、分析判断等应用知识、能力和价值。

对应清华校内课程《分布式数据系统基础与应用》,为了方便MOOC学习者,课程分为《分布式数据系统实战-入门》《分布式数据系统实战-进阶》两门,其中《分布式数据系统实战-入门》课程内容大纲:

第1章-数据处理简史

第2章-分布式数据系统概述及生态 

第3章-系统实例安装部署 

第4章-基本使用与故障诊断 

第5章-常用数据类型及处理

第6章-分布式查询入门、调优与故障排查 

第7章-数据加载与导出

第8章-数据备份与恢复

Syllabus

  • 课程介绍
    • 参考资源
  • 第一章 数据处理简史
    • 1.1 引言
    • 1.2 数据处理简史
    • 1.3 关于NoSQL
  • 第二章 分布式数据系统概述及生态
    • 2.1 引言-Greenplum概述
    • 2.2 Greenplum分布式系统基础
    • 2.3 Greenplum核心架构
    • 2.4 Greenplum生态-本章小结
  • 第三章 系统实例安装部署
    • 3.1 Greenplum安装
    • 3.2 Greenplum部署
  • 第四章 基本使用与故障诊断
    • 4.1 Greenplum的基本使用(1)
    • 4.2 Greenplum的基本使用(2)
    • 4.3 Greenplum故障诊断-本章小结
  • 第五章 常用数据类型及处理
    • 5.1 Greenplum的数据类型简介
    • 5.2 基本数据类型及相关操作
    • 5.3 Greenplum复杂数据类型
    • 5.4 Greenplum的用户自定义类型
    • 5.5 本章小结
  • 第六章 分布式查询入门、调优与故障排查
    • 6.1 SQL语言简介
    • 6.2 SQL基础上手
    • 6.3 gpSQL
  • 第七章 数据加载与导出
    • 7.1 数据加载和导出的基本概念
    • 7.2 数据加载工具简介
    • 7.3 Greenplum外部表
    • 7.4 并行数据加载工具-本章小结
  • 第八章 数据备份与恢复
    • 8.1 数据库备份的意义
    • 8.2 串行数据备份与恢复工具
    • 8.3 并行数据备份与恢复工具
    • 8.4 本章小结
  • 期末考试

    Taught by

    Chao Li, Zhen Chen, Yandong Yao, Jiang Wu, Hao Wang, and Jialun Du

    Tags

    Reviews

    Start your review of 分布式数据系统应用实战-入门

    Never Stop Learning.

    Get personalized course recommendations, track subjects and courses with reminders, and more.

    Someone learning on their laptop while sitting on the floor.