Inference Optimization

community

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

krishnateja95 updated a model 2 days ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507_7.0_bits_mode_heuristic

krishnateja95 published a model 2 days ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507_7.0_bits_mode_heuristic

krishnateja95 updated a model 2 days ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507_7.0_bits_mode_noise

View all activity

Collections 6

View 6 collections

models 215

datasets 6

inference-optimization/speculators-qwen3-30b-a3b-instruct

Preview • Updated 4 days ago • 39

inference-optimization/speculators-qwen3-32b-instruct

Preview • Updated 4 days ago • 48

inference-optimization/gpt-oss-20b-nan-hidden-states-repro

Updated 11 days ago • 29

inference-optimization/SWE-bench_Multilingual

Viewer • Updated 20 days ago • 300 • 15

inference-optimization/SWE-bench_Verified

Viewer • Updated 20 days ago • 500 • 83

inference-optimization/SWE-bench_Lite

Viewer • Updated 20 days ago • 323 • 59

Inference Optimization

AI & ML interests

Recent Activity

Collections 6

inference-optimization/test_tencentbac_fastmtp

inference-optimization/test_qwen3_next_mtp

inference-optimization/Qwen3-Next-80B-A3B-Instruct_mtp_speculator

inference-optimization/Qwen3-Next-80B-A3B-Instruct-MTP-ultrachat-epoch3

inference-optimization/granite-4.0-h-tiny-FP8-block

RedHatAI/granite-4.0-h-tiny-FP8-dynamic

inference-optimization/granite-4.0-h-tiny-quantized.w4a16

inference-optimization/granite-4.0-h-tiny-NVFP4

inference-optimization/test_tencentbac_fastmtp

inference-optimization/test_qwen3_next_mtp

inference-optimization/Qwen3-Next-80B-A3B-Instruct_mtp_speculator

inference-optimization/Qwen3-Next-80B-A3B-Instruct-MTP-ultrachat-epoch3

inference-optimization/granite-4.0-h-tiny-FP8-block

RedHatAI/granite-4.0-h-tiny-FP8-dynamic

inference-optimization/granite-4.0-h-tiny-quantized.w4a16

inference-optimization/granite-4.0-h-tiny-NVFP4

models 215

inference-optimization/Qwen3-30B-A3B-Instruct-2507_7.0_bits_mode_heuristic

inference-optimization/Qwen3-30B-A3B-Instruct-2507_7.0_bits_mode_noise

inference-optimization/Qwen3-30B-A3B-Instruct-2507_7.0_bits_mode_hybrid

inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.5_bits_mode_heuristic

inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.5_bits_mode_noise

inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.5_bits_mode_hybrid

inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.0_bits_mode_heuristic

inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.0_bits_mode_noise

inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.0_bits_mode_hybrid

inference-optimization/Qwen3-30B-A3B-Instruct-2507_5.5_bits_mode_heuristic

datasets 6

inference-optimization/speculators-qwen3-30b-a3b-instruct

inference-optimization/speculators-qwen3-32b-instruct

inference-optimization/gpt-oss-20b-nan-hidden-states-repro

inference-optimization/SWE-bench_Multilingual

inference-optimization/SWE-bench_Verified

inference-optimization/SWE-bench_Lite

AI & ML interests

Recent Activity

Team members 15

Collections 6

models 215 Sort: Recently updated

datasets 6 Sort: Recently updated

models 215

datasets 6