Macromrit
/

SmolLM2-135M-GRPO-Trained-For-Reasoning

Model card Files Files and versions

SmolLM2-135M-GRPO-Trained-For-Reasoning

277 MB

1 contributor

History: 5 commits

Macromrit's picture

Update README.md

d95fa21 verified 10 months ago