zhangyiwan's picture

6

zhangyiwan

WindYiWan

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 2 months ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

updated a collection 2 months ago

upvoted a paper 3 months ago

Deep Research: A Systematic Survey

View all activity

Organizations

None yet

Collections 1

models 0

None public yet

datasets 0

None public yet