Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

XuetangX

大数据算法

Harbin Institute of Technology via XuetangX

Overview

大数据不论在研究还是工程领域都是热点之一,算法是大数据管理与计算的核心主题。本课程试图简要介绍大数据计算中涉及到的基本算法设计方法。适用于大数据研究与开发人员,也适用于数据科学爱好者。
大数据算法这门课程旨在通过讲授一些大数据上基本算法设计思想,包括概率算法、I/O有效算法和并行算法,让听课的同学们接触到和传统算法课程不一样的算法设计与分析思路,并且以最新的研究成果为导向,让参与这门课程学习的同学了解大数据算法的前沿知识。通过这门课程的学习,同学可以掌握大数据算法设计的基本思想,并通过本门课程的作业,初步掌握大数据算法设计与分析的技术,并能够将其中的思想应用于实际的研究和开发。
大数据算法是一门年轻的课程,海外尽管有一些相关的课程已经开设,但是所讲的内容不尽相同,仅仅涉及到一个侧面。这门课程将采取广度优先的策略,尽可能多的囊括大数据算法的设计技术与思想,并试图梳理出一些知识体系。这门课程将为同学们提供一个大数据算法的“工具箱”,当在实际的科研与开发中设计到大数据算法的时候,可以从中寻找有用的算法工具继续深入的学习。

Syllabus

  • 第一讲 大数据算法概述
    • 1.1大数据的定义与特点
    • 1.2 大数据算法-求解大数据上计算问题的过程
    • 1.2 大数据算法-大数据算法的定义
    • 1.2 大数据算法-大数据算法的特点与难点
    • 1.3 大数据算法设计与分析
    • 第一讲 讨论
  • 第二讲 亚线性算法概述
    • 2.1 亚线性算法的定义
    • 2.2 水库抽样—空间亚线性算法
    • 2.3 平面图直径—时间亚线性计算算法
    • 2.4 全0数组判定—时间亚线性判定算法
  • 第三讲 亚线性算法例析
    • 3.1 数据流中频繁元素-基础知识
    • 3.1 数据流中频繁元素-算法与分析
    • 3.2 生成树权重(一)
    • 3.2 生成树权重(二)
    • 3.3 数组有序性判定
  • 第四讲 外存算法概述
    • 4.1 外存存储结构与外存算法
    • 4.2 外存排序算法(一)
    • 4.2 外存排序算法(二)[可选学]
    • 4.3 外存查找树
  • 第五讲 外存查找结构
    • 5.1 B树(一)
    • 5.1 B树(二)
    • 5.2 KD树
  • 第六讲 外存图数据算法
    • 6.1 表排序及其应用
    • 6.2 时间前向处理方法
    • 6.3 缩图法
  • 第七讲 基于MapReduce的并行算法设计
    • 7.1 MapReduce概述
    • 7.2 字数统计
    • 7.3 平均数计算
    • 7.4 单词共现矩阵的计算
  • 第八讲 MapReduce算法例析
    • 8.1 连接算法
    • 8.2 图算法(一)
    • 8.3 图算法(二)
  • 第九讲 非MapReduce的并行算法设计
    • 9.1 基于迭代处理平台的并行算法
    • 9.2 基于图处理平台的并行算法
  • 第十讲 众包算法
    • 10.1 众包的定义
    • 10.2 众包的实例
    • 10.3 众包的要素
    • 10.4 众包算法例析

Taught by

Hongzhi Wang

Tags

Reviews

Start your review of 大数据算法

Never Stop Learning.

Get personalized course recommendations, track subjects and courses with reminders, and more.

Someone learning on their laptop while sitting on the floor.