zwhy's picture

2 2

zwhy

XiaohuaWang

·

AI & ML interests

None yet

Recent Activity

authored a paper 1 day ago

Reward Hacking in the Era of Large Models: Mechanisms, Emergent Misalignment, Challenges

upvoted a paper 1 day ago

Reward Hacking in the Era of Large Models: Mechanisms, Emergent Misalignment, Challenges

updated a model 3 months ago

XiaohuaWang/math-interactive-rl

View all activity

Organizations

Papers 1

arxiv:2604.13602

models 1

XiaohuaWang/math-interactive-rl

datasets 0

None public yet