本课程是大数据与人工智能相关的通识课,不涉及信息类专业知识的精通掌握。专业受众广泛,以注重实践应用和产教融合为特色,在国内外都具有一定创新性。基于开源分布式数据库(以开源的基于PostgreSQL的PB级分布式数据库Greenplum为例展开),以基本的大数据处理、分析及机器学习为目标,不涉及复杂的数据库应用开发和内核开发。帮助学习者了解大数据分析技术发展历程和技术趋势。使学习者在本领域方向上具有基本的动手实践、技术选择、分析判断等应用知识、能力和价值。
对应清华校内课程《分布式数据系统基础与应用》,为了方便MOOC学习者,课程分为《分布式数据系统实战-入门》《分布式数据系统实战-进阶》两门,其中《分布式数据系统实战-进阶》课程内容大纲:
第9章-高级查询(上)
第10章-高级查询(中)
第11章-高级查询(下)
第12章-流式数据加载与处理
第13章-商业智能和可视化
第14章-数据安全
第15章-多源数据融合
第16章-高级分析入门
第17章-数据处理新技术与展望