Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Tsinghua University

分布式数据系统应用实战-进阶

Tsinghua University via XuetangX

Overview






本课程是大数据与人工智能相关的通识课,不涉及信息类专业知识的精通掌握。专业受众广泛,以注重实践应用和产教融合为特色,在国内外都具有一定创新性。基于开源分布式数据库(以开源的基于PostgreSQL的PB级分布式数据库Greenplum为例展开),以基本的大数据处理、分析及机器学习为目标,不涉及复杂的数据库应用开发和内核开发。帮助学习者了解大数据分析技术发展历程和技术趋势。使学习者在本领域方向上具有基本的动手实践、技术选择、分析判断等应用知识、能力和价值。


对应清华校内课程《分布式数据系统基础与应用》,为了方便MOOC学习者,课程分为《分布式数据系统实战-入门》《分布式数据系统实战-进阶》两门,其中《分布式数据系统实战-进阶》课程内容大纲:


第9章-高级查询(上) 


第10章-高级查询(中)


第11章-高级查询(下) 


第12章-流式数据加载与处理 


第13章-商业智能和可视化


第14章-数据安全


第15章-多源数据融合


第16章-高级分析入门


第17章-数据处理新技术与展望



Syllabus

  • 第九章 高级查询(上)
    • 9.1 课程介绍
    • 9.2 聚合函数
    • 9.3 嵌套查询
  • 第十章 高级查询(中)
    • 10.1 通用表表达式
    • 10.2 窗口函数
  • 第十一章 高级查询(下)
    • 11.1 多维数据分析
    • 11.2 过程语言
  • 第十二章 流式数据加载与处理
    • 12.1 流数据的基本概念
    • 12.2 Apache Kafka简介
    • 12.3 Kafka和Greenplum的集成 - 本章小结
  • 第十三章 商业智能和可视化
    • 第十四章 数据安全
      • 14.1 数据安全概述
      • 14.2 Greenplum数据库客户端访问控制
      • 14.3 Greenplum数据库权限控制
      • 14.4 Greenplum数据加密
      • 14.5 本章小结
    • 第十五章 多源数据融合
      • 15.1 数据联邦介绍
      • 15.2 Foreign Data Wrapper(FDW)框架
      • 15.3 Platform eXtensionFramework(PXF)框架
      • 15.4 本章小结
    • 第十六章 高级分析入门
      • 16.1 数据分析简介与MADlib简介
      • 16.2 MADlib高级分析入门
      • 16.3 MADlib对深度学习的支持 - 本章小结
    • 第十七章 数据处理新技术与展望
      • 17.1 数据处理新技术与展望
    • 期末小测

      Taught by

      Chao Li, Zhen Chen, Yandong Yao, Jiang Wu, Hao Wang, and Jialun Du

      Tags

      Reviews

      Start your review of 分布式数据系统应用实战-进阶

      Never Stop Learning.

      Get personalized course recommendations, track subjects and courses with reminders, and more.

      Someone learning on their laptop while sitting on the floor.