llm-aligment topic

List llm-aligment repositories

RewardModelingBeyondBradleyTerry

Stars

Forks

Watchers

official implementation of ICLR'2025 paper: Rethinking Bradley-Terry Models in Preference-based Reward Modeling: Foundations, Theory, and Alternatives

holarissun

inverse-reinforcement-learning

large-language-models

largelanguagemodels

llm-aligment