Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections trending this week

Qwen/Qwen3.5-397B-A17B

Image-Text-to-Text • 403B • Updated 9 days ago • 1.76M • • 1.38k
Qwen/Qwen3.5-397B-A17B-FP8

Image-Text-to-Text • 403B • Updated 26 days ago • 602k • 142
Qwen/Qwen3.5-122B-A10B

Image-Text-to-Text • 125B • Updated 22 days ago • 639k • • 454
Qwen/Qwen3.5-122B-A10B-FP8

Image-Text-to-Text • 125B • Updated 26 days ago • 772k • 73

Nemotron-Cascade 2

Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation

about 15 hours ago

nvidia/Nemotron-Cascade-2-30B-A3B

Text Generation • 32B • Updated about 20 hours ago • 19.7k • 244
nvidia/Nemotron-Cascade-2-RL-data

Viewer • Updated 4 days ago • 55.7k • 353 • 25
nvidia/Nemotron-Cascade-2-SFT-Data

Viewer • Updated 5 days ago • 15.9M • 3.73k • 25
Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation

Paper • 2603.19220 • Published 5 days ago • 54

NVIDIA Nemotron v3

Open, Production-ready Enterprise Models

about 15 hours ago

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-BF16

Text Generation • 124B • Updated about 23 hours ago • 116k • 290
nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated 5 days ago • 690k • 193
nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated 5 days ago • 869k • 205
nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-Base-BF16

Text Generation • 124B • Updated 10 days ago • 9.59k • 21

Unsloth Dynamic 2.0 Quants

New 2.0 version of our Dynamic GGUF + Quants. Dynamic 2.0 achieves superior accuracy & SOTA quantization performance.

unsloth/Qwen3.5-35B-A3B-GGUF

Image-Text-to-Text • 35B • Updated 19 days ago • 2.1M • 723
unsloth/Qwen3.5-9B-GGUF

Image-Text-to-Text • 9B • Updated 22 days ago • 1.31M • 403
unsloth/Qwen3.5-27B-GGUF

Image-Text-to-Text • 27B • Updated 19 days ago • 944k • 346
unsloth/Qwen3.5-122B-A10B-GGUF

Image-Text-to-Text • 122B • Updated 19 days ago • 522k • 211

Our second generation of FLUX

black-forest-labs/FLUX.2-dev

Image-to-Image • Updated Feb 17 • 988k • • 1.46k
black-forest-labs/FLUX.2-klein-9B

Image-to-Image • Updated 29 days ago • 109k • 560
black-forest-labs/FLUX.2-klein-9b-kv

Image-to-Image • Updated 12 days ago • 8.55k • 121
black-forest-labs/FLUX.2-klein-4B

Image-to-Image • Updated 29 days ago • 271k • • 566

Qwen3.5-Claude-4.6-Opus-Reasoning-Distilled-v2

Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-v2

Image-Text-to-Text • 28B • Updated 4 days ago • 4.82k • 26
Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF

Image-Text-to-Text • 27B • Updated 4 days ago • 33.8k • 90
Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-v2

Image-Text-to-Text • 10B • Updated 1 day ago • 23.1k • 109
Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF

Image-Text-to-Text • 9B • Updated 1 day ago • 43.9k • 115

Qwen3.5-Claude-4.6-Opus-Reasoning-Distilled

Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

Image-Text-to-Text • 28B • Updated about 13 hours ago • 164k • 1.15k
Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-GGUF

Image-Text-to-Text • 27B • Updated about 13 hours ago • 461k • 333
Jackrong/Qwen3.5-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled

Text Generation • 36B • Updated 17 days ago • 4.22k • 51
Jackrong/Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled

Text Generation • 5B • Updated 17 days ago • 6.01k • 19

Mistral Small 4

A state-of-the-art model, open-weight, with a granular Mixture-of-Experts architecture that fuses instruct, reasoning and agentic skills.

mistralai/Mistral-Small-4-119B-2603

119B • Updated about 22 hours ago • 36.9k • 319
mistralai/Mistral-Small-4-119B-2603-NVFP4

Updated 7 days ago • 2.81k • 69
mistralai/Mistral-Small-4-119B-2603-eagle

Updated 7 days ago • 253 • 34

Meta's Llama 3.2 language models & evals

meta-llama/Llama-3.2-1B

Text Generation • 1B • Updated Oct 24, 2024 • 1.98M • 2.34k
meta-llama/Llama-3.2-1B-Instruct

Text Generation • 1B • Updated Oct 24, 2024 • 4.2M • • 1.33k
meta-llama/Llama-3.2-3B-Instruct

Text Generation • 3B • Updated Oct 24, 2024 • 6.27M • • 2.06k
meta-llama/Llama-3.2-3B

Text Generation • 3B • Updated Oct 24, 2024 • 1.23M • 707

DINOv3: foundation models producing excellent dense features, outperforming SotA w/o fine-tuning - https://arxiv.org/abs/2508.10104

facebook/dinov3-vit7b16-pretrain-lvd1689m

Image Feature Extraction • 7B • Updated Aug 19, 2025 • 31.8k • 218
facebook/dinov3-vits16-pretrain-lvd1689m

Image Feature Extraction • 21.6M • Updated Aug 19, 2025 • 150k • 76
facebook/dinov3-convnext-small-pretrain-lvd1689m

Image Feature Extraction • 49.5M • Updated Aug 19, 2025 • 24.5k • 22
facebook/dinov3-vitb16-pretrain-lvd1689m

Image Feature Extraction • 85.7M • Updated Aug 19, 2025 • 904k • 110

Qwen/Qwen3.5-397B-A17B

Image-Text-to-Text • 403B • Updated 9 days ago • 1.76M • • 1.38k
Qwen/Qwen3.5-397B-A17B-FP8

Image-Text-to-Text • 403B • Updated 26 days ago • 602k • 142
Qwen/Qwen3.5-122B-A10B

Image-Text-to-Text • 125B • Updated 22 days ago • 639k • • 454
Qwen/Qwen3.5-122B-A10B-FP8

Image-Text-to-Text • 125B • Updated 26 days ago • 772k • 73

Qwen3.5-Claude-4.6-Opus-Reasoning-Distilled-v2

Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-v2

Image-Text-to-Text • 28B • Updated 4 days ago • 4.82k • 26
Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF

Image-Text-to-Text • 27B • Updated 4 days ago • 33.8k • 90
Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-v2

Image-Text-to-Text • 10B • Updated 1 day ago • 23.1k • 109
Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF

Image-Text-to-Text • 9B • Updated 1 day ago • 43.9k • 115

Nemotron-Cascade 2

Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation

about 15 hours ago

nvidia/Nemotron-Cascade-2-30B-A3B

Text Generation • 32B • Updated about 20 hours ago • 19.7k • 244
nvidia/Nemotron-Cascade-2-RL-data

Viewer • Updated 4 days ago • 55.7k • 353 • 25
nvidia/Nemotron-Cascade-2-SFT-Data

Viewer • Updated 5 days ago • 15.9M • 3.73k • 25
Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation

Paper • 2603.19220 • Published 5 days ago • 54

Qwen3.5-Claude-4.6-Opus-Reasoning-Distilled

Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

Image-Text-to-Text • 28B • Updated about 13 hours ago • 164k • 1.15k
Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-GGUF

Image-Text-to-Text • 27B • Updated about 13 hours ago • 461k • 333
Jackrong/Qwen3.5-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled

Text Generation • 36B • Updated 17 days ago • 4.22k • 51
Jackrong/Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled

Text Generation • 5B • Updated 17 days ago • 6.01k • 19

NVIDIA Nemotron v3

Open, Production-ready Enterprise Models

about 15 hours ago

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-BF16

Text Generation • 124B • Updated about 23 hours ago • 116k • 290
nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated 5 days ago • 690k • 193
nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated 5 days ago • 869k • 205
nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-Base-BF16

Text Generation • 124B • Updated 10 days ago • 9.59k • 21

Mistral Small 4

A state-of-the-art model, open-weight, with a granular Mixture-of-Experts architecture that fuses instruct, reasoning and agentic skills.

mistralai/Mistral-Small-4-119B-2603

119B • Updated about 22 hours ago • 36.9k • 319
mistralai/Mistral-Small-4-119B-2603-NVFP4

Updated 7 days ago • 2.81k • 69
mistralai/Mistral-Small-4-119B-2603-eagle

Updated 7 days ago • 253 • 34

Unsloth Dynamic 2.0 Quants

New 2.0 version of our Dynamic GGUF + Quants. Dynamic 2.0 achieves superior accuracy & SOTA quantization performance.

unsloth/Qwen3.5-35B-A3B-GGUF

Image-Text-to-Text • 35B • Updated 19 days ago • 2.1M • 723
unsloth/Qwen3.5-9B-GGUF

Image-Text-to-Text • 9B • Updated 22 days ago • 1.31M • 403
unsloth/Qwen3.5-27B-GGUF

Image-Text-to-Text • 27B • Updated 19 days ago • 944k • 346
unsloth/Qwen3.5-122B-A10B-GGUF

Image-Text-to-Text • 122B • Updated 19 days ago • 522k • 211

Meta's Llama 3.2 language models & evals

meta-llama/Llama-3.2-1B

Text Generation • 1B • Updated Oct 24, 2024 • 1.98M • 2.34k
meta-llama/Llama-3.2-1B-Instruct

Text Generation • 1B • Updated Oct 24, 2024 • 4.2M • • 1.33k
meta-llama/Llama-3.2-3B-Instruct

Text Generation • 3B • Updated Oct 24, 2024 • 6.27M • • 2.06k
meta-llama/Llama-3.2-3B

Text Generation • 3B • Updated Oct 24, 2024 • 1.23M • 707

Our second generation of FLUX

black-forest-labs/FLUX.2-dev

Image-to-Image • Updated Feb 17 • 988k • • 1.46k
black-forest-labs/FLUX.2-klein-9B

Image-to-Image • Updated 29 days ago • 109k • 560
black-forest-labs/FLUX.2-klein-9b-kv

Image-to-Image • Updated 12 days ago • 8.55k • 121
black-forest-labs/FLUX.2-klein-4B

Image-to-Image • Updated 29 days ago • 271k • • 566

DINOv3: foundation models producing excellent dense features, outperforming SotA w/o fine-tuning - https://arxiv.org/abs/2508.10104

facebook/dinov3-vit7b16-pretrain-lvd1689m

Image Feature Extraction • 7B • Updated Aug 19, 2025 • 31.8k • 218
facebook/dinov3-vits16-pretrain-lvd1689m

Image Feature Extraction • 21.6M • Updated Aug 19, 2025 • 150k • 76
facebook/dinov3-convnext-small-pretrain-lvd1689m

Image Feature Extraction • 49.5M • Updated Aug 19, 2025 • 24.5k • 22
facebook/dinov3-vitb16-pretrain-lvd1689m

Image Feature Extraction • 85.7M • Updated Aug 19, 2025 • 904k • 110

Previous
1
2
3
...
19,156
Next

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs