probabilities - Notable Digest

May

ORPO: Monolithic Preference Optimization without Reference Model (Paper Explained)

🆕 from Yannic Kilcher! Discover how ORPO simplifies preference optimization by integrating supervised fine-tuning and alignment steps into a unified procedure,

May 1, 2024

3 min read