Sanyam0605
/

sarvam-1-NVFP4

Text Generation

text-generation-inference

8-bit precision

Model card Files Files and versions

1.83 GB

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

Sanyam0605's picture

Add model card

68e1c0a verified about 1 month ago

.gitattributes

1.52 kB
initial commit about 1 month ago
README.md

2.48 kB
Add model card about 1 month ago
chat_template.jinja

945 Bytes
Upload sarvamai/sarvam-1 quantized with NVFP4 (modelopt) about 1 month ago
config.json

1.66 kB
Upload sarvamai/sarvam-1 quantized with NVFP4 (modelopt) about 1 month ago
generation_config.json

193 Bytes
Upload sarvamai/sarvam-1 quantized with NVFP4 (modelopt) about 1 month ago
hf_quant_config.json

268 Bytes
Upload sarvamai/sarvam-1 quantized with NVFP4 (modelopt) about 1 month ago
model.safetensors

1.82 GB
xet

Upload sarvamai/sarvam-1 quantized with NVFP4 (modelopt) about 1 month ago
special_tokens_map.json

437 Bytes
Upload sarvamai/sarvam-1 quantized with NVFP4 (modelopt) about 1 month ago
tokenizer.json

8.51 MB
Upload sarvamai/sarvam-1 quantized with NVFP4 (modelopt) about 1 month ago
tokenizer.model

1.94 MB
xet

Upload sarvamai/sarvam-1 quantized with NVFP4 (modelopt) about 1 month ago
tokenizer_config.json

774 kB
Upload sarvamai/sarvam-1 quantized with NVFP4 (modelopt) about 1 month ago