Direct Preference Optimization - Fine-Tuning LLMs Without Reinforcement Learning

Serrano.Academy via YouTube Direct link

The Loss Function

5

of 6

5 of 6

The Loss Function

Class Central Classrooms beta

YouTube videos curated by Class Central.

Classroom Contents

Direct Preference Optimization - Fine-Tuning LLMs Without Reinforcement Learning

Play All

Automatically move to the next video in the Classroom when playback concludes