Asa Cross

asacross

23

AI & ML interests

None yet

Recent Activity

upvoted a paper about 19 hours ago

Why Multi-Step Tool-Use Reinforcement Learning Collapses and How Supervisory Signals Fix It

upvoted a paper about 19 hours ago

Discretizing Reward Models

upvoted a paper 2 days ago

Constraint Tax in Open-Weight LLMs: An Empirical Study of Tool Calling Suppression Under Structured Output Constraints

View all activity

Organizations

None yet

models 0

None public yet

datasets 0

None public yet