Elle Michelle Yang

Research Intern

Publications

View by:

- Reward Models Inherit Value Biases from Pretraining
  
  Brian Christian, John Thompson, Elle, V. Adam, Hannah Rose Kirk, Chris Summerfield, T. Dumbalska
  
  2026 International Conference on Learning Representations | January 2026
  
  Publication
- Reward Model Perspectives: Whose Opinions Do Reward Models Reward?
  
  Elle
  
  2025 Empirical Methods in Natural Language Processing | October 2025
  
  DOI Publication Publication

- Reward Models Inherit Value Biases from Pretraining
  
  Brian Christian, John Thompson, Elle, V. Adam, Hannah Rose Kirk, Chris Summerfield, T. Dumbalska
  
  2026 International Conference on Learning Representations | January 2026
  
  Publication
- Reward Model Perspectives: Whose Opinions Do Reward Models Reward?
  
  Elle
  
  2025 Empirical Methods in Natural Language Processing | October 2025
  
  DOI Publication Publication

- Reward Models Inherit Value Biases from Pretraining
  
  Brian Christian, John Thompson, Elle, V. Adam, Hannah Rose Kirk, Chris Summerfield, T. Dumbalska
  
  2026 International Conference on Learning Representations | January 2026
  
  Publication
- Reward Model Perspectives: Whose Opinions Do Reward Models Reward?
  
  Elle
  
  2025 Empirical Methods in Natural Language Processing | October 2025
  
  DOI Publication Publication

Your Privacy Choices