🔄 In a Training Loop

Lewis Tunstall PRO

lewtun

huggingface

·

https://lewtun.github.io/blog/

AI & ML interests

LLMs, LLMs, LLMs

Recent Activity

upvoted a paper 40 minutes ago

AsyncOPD: How Stale Can On-Policy Distillation Be?

liked a Space 2 days ago

rl-llm-wiki/rl-dashboard

published a bucket 3 days ago

lewtun/trl-internal-testing

View all activity

Organizations

lewtun 's models 324

lewtun/qwen3-0.6b-wordle-grpo

Text Generation • 0.6B • Updated 13 days ago • 36

lewtun/Qwen3-4B-Capybara-SFT

Text Generation • 4B • Updated 13 days ago • 86

lewtun/qwen3-4b-capybara

Text Generation • 4B • Updated 13 days ago • 95

lewtun/qwen3-0.6b-capybara-smoke

Text Generation • 0.6B • Updated 23 days ago • 65

lewtun/qwen3-0.6b-capybara

Text Generation • 0.6B • Updated 24 days ago • 50

lewtun/qwen3-0.6b-capybara-1step

Text Generation • 0.6B • Updated 24 days ago • 64

lewtun/qwen3-0.6b-angrygiraffe-sft

Text Generation • 0.6B • Updated 28 days ago • 69

lewtun/qwen3-4b-hermes-tooluse

Text Generation • 4B • Updated 28 days ago • 50

lewtun/qwen3-0.6b-sft-capybara

Text Generation • 0.6B • Updated May 12 • 52

lewtun/smollm2-1.7b-capybara-sft

lewtun/qwen3-0.6b-openthoughts3-sft

lewtun/smollm2-135m-capybara-csv

Text Generation • 0.1B • Updated May 11 • 35 • 1

lewtun/smollm2-135m-capybara-jsonl

Text Generation • 0.1B • Updated May 11 • 31

lewtun/SmolLM2-360M-Instruct-capybara-sft

lewtun/SmolLM2-360M-OpenMathReasoning

Text Generation • 0.4B • Updated May 11 • 29

lewtun/qwen3-0.6b-capybara-sft

Text Generation • 0.6B • Updated May 8 • 26

lewtun/qwen3-06b-ultrachat-sft

Text Generation • 0.6B • Updated May 8 • 3

lewtun/SmolLM2-135M-smoltalk-sft

lewtun/SmolLM2-1.7B-Snappy-Lyte

lewtun/SmolLM2-135M-SFT-Capybara-LoRA

lewtun/SmolLM2-1.7B-SmolTalk-SFT-LoRA

lewtun/SmolLM2-135M-OpenThoughts-SFT

lewtun/SmolLM2-135M-Capybara-SFT

Text Generation • 0.1B • Updated May 7 • 42

lewtun/SmolLM2-135M-no-robots

lewtun/yolo-mode

Text Generation • 0.1B • Updated May 1 • 4

lewtun/smollm-yolo

Text Generation • 0.1B • Updated May 1 • 27

lewtun/gpt-oss-20b-goblin-mode

Updated Apr 30 • 2

lewtun/smollm2-135M-everyday-sft

Text Generation • 0.1B • Updated Apr 30 • 32

lewtun/gpt-oss-20b-goblin-mode-smoke

lewtun/SmolLM2-360M-SFT-everyday-conversations

Text Generation • 0.4B • Updated Apr 30 • 30