Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

251

Full-text search

Active filters: modelopt

nvidia/Kimi-K2.5-NVFP4

Text Generation • Updated 5 days ago • 225k • 61

nvidia/Qwen3.5-397B-A17B-NVFP4

Text Generation • Updated 19 days ago • 92.9k • 63

txn545/Qwen3.5-122B-A10B-NVFP4

Text Generation • 64B • Updated 8 days ago • 121k • 10

osoleve/Qwen3.5-27B-Text-NVFP4-MTP

Text Generation • 17B • Updated 4 days ago • 6k • 9

AxionML/Qwen3.5-9B-NVFP4

Image-Text-to-Text • 7B • Updated 7 days ago • 24.7k • 5

NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4

Text Generation • 16B • Updated Aug 5, 2025 • 29.3k • 13

nvidia/Llama-4-Scout-17B-16E-Instruct-NVFP4

56B • Updated Dec 12, 2025 • 19.7k • 24

nvidia/Qwen3-235B-A22B-Instruct-2507-NVFP4

Text Generation • 120B • Updated Jan 30 • 3.92k • 5

nvidia/Qwen3-Coder-480B-A35B-Instruct-NVFP4

Text Generation • 241B • Updated Feb 5 • 1.43k • 5

lukealonso/MiniMax-M2.5-REAP-139B-A10B-NVFP4

80B • Updated 14 days ago • 13.8k • 23

nvidia/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Sep 9, 2025 • 33k • 15

nvidia/Qwen3-32B-NVFP4

Text Generation • 17B • Updated Sep 9, 2025 • 25.7k • 11

nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1-FP4-QAD

Image-Text-to-Text • Updated Oct 9, 2025 • 379 • 14

nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated 29 days ago • 69.2k • 33

lukealonso/MiniMax-M2.5-NVFP4

130B • Updated 21 days ago • 76.6k • 36

alphakek/GLM-4.7-Flash-heretic-NVFP4

Text Generation • 17B • Updated 20 days ago • 229 • 1

txn545/Qwen3.5-35B-A3B-NVFP4

Text Generation • Updated 8 days ago • 21.8k • 3

festr2/GLM-5-NVFP4-MTP

435B • Updated 8 days ago • 3.29k • 1

AxionML/Qwen3.5-122B-A10B-NVFP4

Image-Text-to-Text • 62B • Updated 7 days ago • 411 • 1

AxionML/Qwen3.5-27B-NVFP4

Image-Text-to-Text • 17B • Updated 7 days ago • 763 • 1

AxionML/Qwen3.5-35B-A3B-NVFP4

Image-Text-to-Text • Updated 7 days ago • 81.2k • 1

kleinpanic93/Nemotron-Terminal-32B-NVFP4

Text Generation • 17B • Updated 7 days ago • 134 • 1

kleinpanic93/Qwen3-Coder-30B-A3B-Instruct-NVFP4

Text Generation • 31B • Updated 6 days ago • 39 • 1

nvidia/Llama-4-Maverick-17B-128E-Instruct-FP8

402B • Updated Jul 29, 2025 • 481 • 12

nvidia/Llama-4-Scout-17B-16E-Instruct-FP8

109B • Updated Dec 12, 2025 • 43.2k • 11

ishan24/test_modelopt_quant

Updated Apr 25, 2025 • 4

nvidia/Llama-4-Maverick-17B-128E-Eagle3

Updated Sep 3, 2025 • 45 • 9

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 65k • 24

jiangchengchengNLP/L3.3-MS-Nevoria-70b-FP8

Text Generation • 71B • Updated Nov 29, 2025 • 2

NVFP4/Qwen3-30B-A3B-Instruct-2507-FP4

Text Generation • 16B • Updated Aug 1, 2025 • 1.48k • 12