Distributed Training: Hybrid Parallelism and Gradient Optimization - Lecture 20

Overview

Learn advanced distributed training concepts in this MIT lecture covering hybrid parallelism, auto-parallelization techniques, and strategies for overcoming bandwidth and latency bottlenecks in machine learning systems. Explore gradient compression methods including gradient pruning with sparse communication and deep gradient compression, as well as gradient quantization approaches like 1-Bit SGD and TernGrad. Understand how delayed gradient updates can address latency challenges in distributed training environments. Delivered by Professor Song Han as part of the MIT 6.5940 course, this 59-minute lecture provides essential knowledge for implementing efficient distributed machine learning systems.

Syllabus

EfficientML.ai Lecture 20 - Distributed Training Part 2 (MIT 6.5940, Fall 2024)

Taught by

MIT HAN Lab

Reviews

Start your review of Distributed Training: Hybrid Parallelism and Gradient Optimization - Lecture 20

Taught by

Distributed Training: Hybrid Parallelism and Gradient Optimization - Lecture 20

Distributed Training and Gradient Compression - Lecture 14

Distributed Training Methods and Parallelization Techniques - Lecture 19

Distributed Training Methods for Efficient Machine Learning - Part 1

Distributed Training and Gradient Compression - Lecture 14

Distributed Training - Part I - Lecture 17

10 Best Machine Learning Courses for 2024: Scikit-learn, TensorFlow, and more

10 Best Deep Learning Courses for 2024

Never Stop Learning.