Zhendong Chu's picture

3

Zhendong Chu

Wesley123

AI & ML interests

Natural Language Processing, Recommender Systems

Recent Activity

upvoted a paper 4 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

upvoted a paper 8 months ago

TruthRL: Incentivizing Truthful LLMs via Reinforcement Learning

upvoted a paper about 1 year ago

WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning

View all activity

Organizations

None yet

upvoted a paper 4 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

Paper • 2605.21468 • Published 6 days ago • 46

upvoted a paper 8 months ago

TruthRL: Incentivizing Truthful LLMs via Reinforcement Learning

Paper • 2509.25760 • Published Sep 30, 2025 • 55

upvoted a paper about 1 year ago

WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning

Paper • 2505.16421 • Published May 22, 2025 • 19