whisper.cpp

Running

App Files Files Community

whisper.cpp / ggml /src /ggml-vulkan /vulkan-shaders /dequant_funcs_cm2.comp

Commit History

llama : add gpt-oss (llama/15091)

bf225d6

ggerganov

ngxson HF Staff slaren commited on Aug 5, 2025

vulkan: use uint array index to avoid glslang bug (llama/13193)

fd2d86d

jeffbolznv commited on Apr 30, 2025

vulkan: In coopmat2 mmq, load q4_k/q5_k scales through shared memory (llama/12833)

4b7a407

jeffbolznv commited on Apr 9, 2025

vulkan: optimize iq1 coopmat2 dequant functions (llama/12427)

53dd8ad

jeffbolznv commited on Mar 19, 2025

vulkan: use fp32 in coopmat2 q4_k dequant function (llama/12309)

9ca84c6

jeffbolznv commited on Mar 17, 2025

vulkan: matmul dequantization improvements (llama/12015)

ffdf466

Eve commited on Feb 28, 2025

vulkan: initial support for IQ1_S and IQ1_M quantizations (llama/11528)

0d2e888

Rémy O commited on Feb 15, 2025

vulkan: optimize coopmat2 iq2/iq3 callbacks (llama/11521)

3731f13

jeffbolznv commited on Feb 6, 2025

vulkan: initial support for IQ4_XS quantization (llama/11501)

ed46ad5

Rémy O commited on Feb 6, 2025

vulkan: implement initial support for IQ2 and IQ3 quantizations (llama/11360)

bd93c1b

Rémy Oudompheng

jeffbolznv commited on Jan 29, 2025

vulkan: optimize coopmat2 q4_k/q5_k dequant functions. (llama/11206)

ee122d3

jeffbolznv commited on Jan 16, 2025

vulkan: optimize coopmat2 q2_k dequant function (llama/11130)

d49a569

jeffbolznv commited on Jan 16, 2025

vulkan: optimize coopmat2 dequant functions (llama/10855)

5e70c43

jeffbolznv commited on Dec 21, 2024

vulkan: Add VK_NV_cooperative_matrix2 support for mul_mat and flash attention (llama/10206)

d10b47b

jeffbolznv commited on Dec 5, 2024

Commit History

llama : add gpt-oss (llama/15091) bf225d6

vulkan: use uint array index to avoid glslang bug (llama/13193) fd2d86d

vulkan: In coopmat2 mmq, load q4_k/q5_k scales through shared memory (llama/12833) 4b7a407

vulkan: optimize iq1 coopmat2 dequant functions (llama/12427) 53dd8ad

vulkan: use fp32 in coopmat2 q4_k dequant function (llama/12309) 9ca84c6

vulkan: matmul dequantization improvements (llama/12015) ffdf466

vulkan: initial support for IQ1_S and IQ1_M quantizations (llama/11528) 0d2e888

vulkan: optimize coopmat2 iq2/iq3 callbacks (llama/11521) 3731f13

vulkan: initial support for IQ4_XS quantization (llama/11501) ed46ad5

vulkan: implement initial support for IQ2 and IQ3 quantizations (llama/11360) bd93c1b

vulkan: optimize coopmat2 q4_k/q5_k dequant functions. (llama/11206) ee122d3

vulkan: optimize coopmat2 q2_k dequant function (llama/11130) d49a569

vulkan: optimize coopmat2 dequant functions (llama/10855) 5e70c43

vulkan: Add VK_NV_cooperative_matrix2 support for mul_mat and flash attention (llama/10206) d10b47b