Reinforcement Learning with Human Feedback - Understanding LLM Fine-tuning with PPO and DPO

Open Data Science via YouTube Direct link

- Large Language ModelsTransformers

2

of 6

2 of 6

- Large Language ModelsTransformers

Class Central Classrooms beta

YouTube videos curated by Class Central.

Classroom Contents

Reinforcement Learning with Human Feedback - Understanding LLM Fine-tuning with PPO and DPO