Sparse Is Enough in Scaling Transformers - ML Research Paper Explained

Yannic Kilcher via YouTube Direct link

- Recap: Transformer stack

2

of 6

2 of 6

- Recap: Transformer stack

Class Central Classrooms beta

YouTube videos curated by Class Central.

Classroom Contents

Sparse Is Enough in Scaling Transformers - ML Research Paper Explained