Commit 225347a

committed

fix: Correct some errors in 'Direct Preference Optimization: Your Language Model is Secretly a Reward Model'

1 parent ec61f46 commit 225347aCopy full SHA for 225347a

1 file changed

+58

-66

lines changed

+58

-66

lines changed

Comments

(0)