本课程是人文社会科学专业本科生数据科学与数据分析训练的系列课程之一。本门课程中,避免了以算法为中心的训练,选择从数据科学基本概念与原则入手。通过理解原理来思考数据分析目的,以此培养学生分析数据科学问题、评估数据科学解决方案以及数据科学战略评价等综合能力。课程涵盖的主题包括数据科学项目生命周期、探索性数据分析、数据可视化技术、模型构建与模型拟合以及模型评估等内容。
  本课程采用全英文授课,是一门国际化课程,旨在让人文社会科学领域的学生掌握数据科学的基本理论与知识,形成数据科学思维,掌握基础的数据处理技能,能够开展基本的数据分析和数据可视化工作。本课程坚持以数据为中心、以问题为导向、以培养数据科学思维为重点、理论与实践相结合以及兼顾数据管理与数据分析的教学理念与原则,通力培养学生形成问题意识、数据科学思维以及分析问题与解决问题的综合能力。本课程采用多元化的教学方法与教学手段。宏观上,采用课堂教学打牢基础、实践操作巩固能力、兼顾知识讲授与引导等方法与手段来提升教与学水平;微观上,采用案例分析法、比较法与中心发散思维方法等方法进行具体知识点的讲授。
This course focus on data science training for business practitioners and students in social science. We deliberately avoid algorithm-centered training in this course and emphasize studying how to apply some tools to solve practical problems. We will learn a relatively set of fundamental concepts or principles that underlie techniques for extracting useful knowledge from data. These concepts underlie the analysis of data-centered business problems, the reaction and evaluation of data science solutions, and the evaluation of general data science strategies and proposals. Enriching knowledge of data visualization, regression, classification, cluster, and data-analytic thinking is the thesis of this course.