Direct Preference Optimization (DPO) - Advanced Fine-Tuning Technique

Trelis Research via YouTube Direct link

Required datasets and SFT models

8

of 13

8 of 13

Required datasets and SFT models

Class Central Classrooms beta

YouTube videos curated by Class Central.

Classroom Contents

Direct Preference Optimization (DPO) - Advanced Fine-Tuning Technique