本课程内容以大数据技术学习为主线,涵盖了大数据的完整生命周期。
在大数据概述模块,包含了大数据的基本概念、大数据的生命周期和典型技术架构等的学习,帮助我们建立对大数据的整体认知;在大数据采集技术模块,包含了针对不同来源的大数据采集技术的学习,以及数据预处理的相关知识和技术的学习;在大数据存储和管理模块,包含了大数据存储基础知识和核心技术的学习,如分布式文件系统、NoSQL数据库。大数据基础实验环境搭建将学习如何在虚拟机上搭建大数据实验环境,并熟悉Linux系统的基础操作。最后,在大数据处理与应用实践模块,将学习到Hadoop的安装与配置以及HDFS、HBase、Spark等大数据处理技术的使用,并最后通过实际项目案例体验大数据处理的全过程。