本课程是大数据与人工智能相关的通识课,不涉及信息类专业知识的精通掌握。专业受众广泛,以注重实践应用和产教融合为特色,在国内外都具有一定创新性。基于开源分布式数据库(以开源的基于PostgreSQL的PB级分布式数据库Greenplum为例展开),以基本的大数据处理、分析及机器学习为目标,不涉及复杂的数据库应用开发和内核开发。帮助学习者了解大数据分析技术发展历程和技术趋势。使学习者在本领域方向上具有基本的动手实践、技术选择、分析判断等应用知识、能力和价值。
对应清华校内课程《分布式数据系统基础与应用》,为了方便MOOC学习者,课程分为《分布式数据系统实战-入门》《分布式数据系统实战-进阶》两门,其中《分布式数据系统实战-入门》课程内容大纲:
第1章-数据处理简史
第2章-分布式数据系统概述及生态 
第3章-系统实例安装部署 
第4章-基本使用与故障诊断 
第5章-常用数据类型及处理
第6章-分布式查询入门、调优与故障排查 
第7章-数据加载与导出
第8章-数据备份与恢复