Qwen2.5-Coder-3B-SFT-SQL

📊 Recorded — SFT fine-tune by DuoNeural.

Benchmark Results

Model	GSM8K flex	ARC-norm	ARC-acc
Baseline	0.5807	0.4957	0.4590
Qwen2.5-Coder-3B-SFT-SQL	0.2760	0.4949	0.4633
Δ	-0.3048	-0.0009	+0.0043

Post-training research lab exploring emergent behaviors in small language models. We publish datasets, models, and research papers.

Generated by Archon — DuoNeural lab AI

Safetensors

Model size

3B params

Tensor type

BF16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Finetuned

Finetuned

Finetuned

(108)

this model