Haolin Liu's picture

18

Haolin Liu

lhl616

AI & ML interests

None yet

Recent Activity

upvoted a paper 18 days ago

Training Data Efficiency in Multimodal Process Reward Models

upvoted a paper 19 days ago

Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing

upvoted a paper about 1 month ago

RelayLLM: Efficient Reasoning via Collaborative Decoding

View all activity

Organizations

None yet

upvoted a paper 18 days ago

Training Data Efficiency in Multimodal Process Reward Models

Paper • 2602.04145 • Published 19 days ago • 76

upvoted a paper 19 days ago

Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing

Paper • 2602.03845 • Published 19 days ago • 26

upvoted a paper about 1 month ago

RelayLLM: Efficient Reasoning via Collaborative Decoding

Paper • 2601.05167 • Published Jan 8 • 31

upvoted a paper about 2 months ago

Benchmark^2: Systematic Evaluation of LLM Benchmarks

Paper • 2601.03986 • Published Jan 7 • 34

upvoted 2 papers 2 months ago

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning

Paper • 2512.15687 • Published Dec 17, 2025 • 21

MotionEdit: Benchmarking and Learning Motion-Centric Image Editing

Paper • 2512.10284 • Published Dec 11, 2025 • 26

updated a model 3 months ago

lhl616/Qwen3-8B-axon-error-aware-128-8-ratio

8B • Updated Nov 29, 2025

published a model 3 months ago

lhl616/Qwen3-8B-axon-error-aware-128-8-ratio

8B • Updated Nov 29, 2025

updated a model 3 months ago

lhl616/Qwen3-8B-axon-error-aware-128-8-mixed

8B • Updated Nov 29, 2025

published a model 3 months ago

lhl616/Qwen3-8B-axon-error-aware-128-8-mixed

8B • Updated Nov 29, 2025

updated a model 3 months ago

lhl616/Qwen3-8B-Base-axon-ppo

8B • Updated Nov 29, 2025

published a model 3 months ago

lhl616/Qwen3-8B-Base-axon-ppo

8B • Updated Nov 29, 2025

updated a model 3 months ago

lhl616/Qwen3-8B-Base-axon-grpo-step-128-8

8B • Updated Nov 29, 2025

published a model 3 months ago

lhl616/Qwen3-8B-Base-axon-grpo-step-128-8

8B • Updated Nov 29, 2025

updated a model 3 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-ratio-new

8B • Updated Nov 29, 2025

published a model 3 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-ratio-new

8B • Updated Nov 29, 2025

updated a model 3 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-dense-passk

8B • Updated Nov 29, 2025

published a model 3 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-dense-passk

8B • Updated Nov 29, 2025

updated a model 3 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-dense-nstd-0.5-0.8-step-2

8B • Updated Nov 29, 2025 • 1

published a model 3 months ago

lhl616/Qwen3-8B-Base-axon-error-aware-128-8-dense-nstd-0.5-0.8-step-2

8B • Updated Nov 29, 2025 • 1