Trust Region & Proximal Policy Optimization

Pascal Poupart via YouTube Direct link

Trust Region Policy Optimization (TRPO) TRPOO Initialize sa to anything Loop forever (for each episode)

8

of 13

8 of 13

Trust Region Policy Optimization (TRPO) TRPOO Initialize sa to anything Loop forever (for each episode)

Class Central Classrooms beta

YouTube videos curated by Class Central.

Classroom Contents

Trust Region & Proximal Policy Optimization