Commits · Xenobd/whisper.cpp

finetune: SGD optimizer, more CLI args (llama/13873)

f585fe7

Jonathan Graehl

OccamRazor

JohannesGaessler commited on Aug 14

ggml : update `ggml_rope_multi` (llama/12665)

b4896dc

Judd

ggerganov commited on Aug 13

llama : add gpt-oss (llama/15091)

bf225d6

ggerganov

ngxson HF Staff slaren commited on Aug 5

sync : resolve conflicts (ggml/0)

497add0

ggerganov commited on Jul 12

ggml : add ggml_scale_bias (llama/14417)

573d50a

ngxson HF Staff commited on Jul 9

CUDA: add bilinear interpolation for upscale (llama/14563)

68ded09

am17an commited on Jul 8

ggml : implement GEGLU_ERF and GEGLU_QUICK ops (llama/14445)

f798922

Sigbjørn Skjæret commited on Jul 3

ggml : fix FA mask dim 2 and 3 (llama/14505)

a89dc81

ggerganov commited on Jul 3

llama : initial Mamba-2 support (llama/9126)

1b4087e

compilade commited on Jul 2

ggml : support bcast ggml_soft_max_ext, ggml_flash_attn_ext (llama/14435)

ebacb3e

ggerganov commited on Jul 12

ggml : Callback before abort (llama/14481)

ccee17d

Bytealyzer Diego Devesa commited on Jul 2

ggml : add version function to get lib version (ggml/1286)

880f633

danbev

ggerganov commited on Jul 2

Add Conv2d for CPU (llama/14388)

68eb27a

am17an commited on Jun 30

ggml : implement REGLU/GEGLU/SWIGLU ops (llama/14158)

add5c0f

Sigbjørn Skjæret

ggerganov

OccamRazor Akarshan

jeffbolznv commited on Jun 29

ggml : add ggml_set_rows (llama/14274)

ac46a22

rgerganov

ggerganov commited on Jun 27

ggml-cpu : "align corners" for bilinear upscale/downscale (ggml/1285)

88e7829

Acly commited on Jul 1

Add `ggml_roll` (ggml/1274)

71923e5

Acly commited on Jun 18

threading: support for GGML_SCHED_PRIO_LOW, update thread info on Windows to avoid throttling (llama/12995)

d5d55f2

Max Krasnyansky Diego Devesa commited on May 31

ggml : add ggml_repeat_4d (llama/13824)

3fe8af8

ngxson HF Staff commited on May 27

ggml : remove ggml_graph_import and ggml_graph_export declarations (ggml/1247)

3c9a1d2

rgerganov commited on May 30

ggml : fix the order of ggml_unary_op (llama/13718)

bdae2b3

ngxson HF Staff commited on May 23

ggml : add ggml_gelu_erf() (llama/13667)

6c9cd9a

ngxson HF Staff commited on May 21

llama/ggml: add LLM training support (llama/10544)

8d3b3c1

JohannesGaessler commited on May 12

CUDA: fix bad asserts for partial offload (llama/13337)

23e676b

JohannesGaessler commited on May 6

CUDA: fix q_nope_absorbed prec for DS 2 Lite f16 (llama/13137)

e9c9d4b

JohannesGaessler commited on Apr 28

ggml : Depthwise 2D convolution (ggml/1152)

0c950d5

Acly commited on Apr 17

ggml : add bilinear upscale support (ggml/1185)

4c5e449

Diego Devesa commited on Apr 9

ggml : add more generic custom op, remove deprecated custom ops (ggml/1183)

ba7a5f8

Diego Devesa commited on Apr 9

metal : improve FA + improve MoE (llama/12612)

04a3389

ggerganov commited on Mar 28

llama: Add support for RWKV v7 architecture (llama/12412)

727de7e

mollysama commited on Mar 17

ggml : portability fixes for VS 2017 (llama/12150)

49e3343

mgroeber9110 Marcus Groeber commited on Mar 4

cleanup: fix compile warnings associated with gnu_printf (llama/11811)

ef6a968

bandoti commited on Feb 12

CUDA: use mma PTX instructions for FlashAttention (llama/11583)

f328957

JohannesGaessler Diego Devesa commited on Feb 2

CUDA: backwards pass for misc. ops, add tests (llama/11257)

2fbcec1

JohannesGaessler commited on Jan 16

RoPE: fix back, CUDA support for back + noncont. (llama/11240)

131a21e

JohannesGaessler commited on Jan 15

llama: add support for QRWKV6 model architecture (llama/11001)

4a6b7e0

mollysama

ggerganov

compilade commited on Jan 10

GGUF: C++ refactor, backend support, misc fixes (llama/11030)

21c5b64

JohannesGaessler commited on Jan 7

tts : add OuteTTS support (llama/10784)

8d0f0ac

ggerganov commited on Dec 18, 2024

llama : add Qwen2VL support + multimodal RoPE (llama/10361)

219d12b

RzZ

ggerganov commited on Dec 14, 2024

ggml : refactor online repacking (llama/10446)

163128e

Djip007

ggerganov commited on Dec 7, 2024

ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034)

154bbc0

PABannier commited on Dec 3, 2024

ggml-cpu: support IQ4_NL_4_4 by runtime repack (llama/10541)

bf73242

shupeif commited on Nov 28, 2024

ggml : add support for dynamic loading of backends (llama/10469)

b73266f

Diego Devesa

ggerganov commited on Nov 25, 2024

ggml: new optimization interface (ggml/988)

dd33ace

JohannesGaessler commited on Nov 16, 2024

ggml : build backends as libraries (llama/10256)

3dc93f3

Diego Devesa

ggerganov R0CKSTAR commited on Nov 14, 2024

metal : optimize FA kernels (llama/10171)

44ff932

ggerganov commited on Nov 8, 2024

Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (llama/10133)

f58e658

Zhiyuan Li

ggerganov Diego Devesa

pacominev Yuri Khrustalev Meng, Hengyu commited on Nov 7, 2024

ggml : move CPU backend to a separate file (llama/10144)

0f447f2

Diego Devesa commited on Nov 3, 2024

llama : add simple-chat example (llama/10124)

41ff26f

Diego Devesa Xuan Son Nguyen commited on Nov 1, 2024

ggml : remove ggml_scratch (llama/10121)

3f0b7ba

ggerganov commited on Nov 1, 2024

Commit History

finetune: SGD optimizer, more CLI args (llama/13873) f585fe7

ggml : update `ggml_rope_multi` (llama/12665) b4896dc

llama : add gpt-oss (llama/15091) bf225d6

sync : resolve conflicts (ggml/0) 497add0

ggml : add ggml_scale_bias (llama/14417) 573d50a

CUDA: add bilinear interpolation for upscale (llama/14563) 68ded09

ggml : implement GEGLU_ERF and GEGLU_QUICK ops (llama/14445) f798922

ggml : fix FA mask dim 2 and 3 (llama/14505) a89dc81

llama : initial Mamba-2 support (llama/9126) 1b4087e

ggml : support bcast ggml_soft_max_ext, ggml_flash_attn_ext (llama/14435) ebacb3e

ggml : Callback before abort (llama/14481) ccee17d

ggml : add version function to get lib version (ggml/1286) 880f633

Add Conv2d for CPU (llama/14388) 68eb27a

ggml : implement REGLU/GEGLU/SWIGLU ops (llama/14158) add5c0f

ggml : add ggml_set_rows (llama/14274) ac46a22

ggml-cpu : "align corners" for bilinear upscale/downscale (ggml/1285) 88e7829

Add `ggml_roll` (ggml/1274) 71923e5

threading: support for GGML_SCHED_PRIO_LOW, update thread info on Windows to avoid throttling (llama/12995) d5d55f2

ggml : add ggml_repeat_4d (llama/13824) 3fe8af8

ggml : remove ggml_graph_import and ggml_graph_export declarations (ggml/1247) 3c9a1d2

ggml : fix the order of ggml_unary_op (llama/13718) bdae2b3

ggml : add ggml_gelu_erf() (llama/13667) 6c9cd9a

llama/ggml: add LLM training support (llama/10544) 8d3b3c1

CUDA: fix bad asserts for partial offload (llama/13337) 23e676b

CUDA: fix q_nope_absorbed prec for DS 2 Lite f16 (llama/13137) e9c9d4b

ggml : Depthwise 2D convolution (ggml/1152) 0c950d5

ggml : add bilinear upscale support (ggml/1185) 4c5e449

ggml : add more generic custom op, remove deprecated custom ops (ggml/1183) ba7a5f8

metal : improve FA + improve MoE (llama/12612) 04a3389

llama: Add support for RWKV v7 architecture (llama/12412) 727de7e

ggml : portability fixes for VS 2017 (llama/12150) 49e3343

cleanup: fix compile warnings associated with gnu_printf (llama/11811) ef6a968

CUDA: use mma PTX instructions for FlashAttention (llama/11583) f328957

CUDA: backwards pass for misc. ops, add tests (llama/11257) 2fbcec1

RoPE: fix back, CUDA support for back + noncont. (llama/11240) 131a21e

llama: add support for QRWKV6 model architecture (llama/11001) 4a6b7e0

GGUF: C++ refactor, backend support, misc fixes (llama/11030) 21c5b64

tts : add OuteTTS support (llama/10784) 8d0f0ac

llama : add Qwen2VL support + multimodal RoPE (llama/10361) 219d12b

ggml : refactor online repacking (llama/10446) 163128e

ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034) 154bbc0

ggml-cpu: support IQ4_NL_4_4 by runtime repack (llama/10541) bf73242

ggml : add support for dynamic loading of backends (llama/10469) b73266f

ggml: new optimization interface (ggml/988) dd33ace

ggml : build backends as libraries (llama/10256) 3dc93f3

metal : optimize FA kernels (llama/10171) 44ff932

Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (llama/10133) f58e658

ggml : move CPU backend to a separate file (llama/10144) 0f447f2

llama : add simple-chat example (llama/10124) 41ff26f

ggml : remove ggml_scratch (llama/10121) 3f0b7ba

finetune: SGD optimizer, more CLI args (llama/13873)

f585fe7

ggml : update `ggml_rope_multi` (llama/12665)

b4896dc

llama : add gpt-oss (llama/15091)

bf225d6

sync : resolve conflicts (ggml/0)

497add0

ggml : add ggml_scale_bias (llama/14417)

573d50a

CUDA: add bilinear interpolation for upscale (llama/14563)

68ded09

ggml : implement GEGLU_ERF and GEGLU_QUICK ops (llama/14445)

f798922

ggml : fix FA mask dim 2 and 3 (llama/14505)

a89dc81

llama : initial Mamba-2 support (llama/9126)

1b4087e

ggml : support bcast ggml_soft_max_ext, ggml_flash_attn_ext (llama/14435)

ebacb3e

ggml : Callback before abort (llama/14481)

ccee17d

ggml : add version function to get lib version (ggml/1286)

880f633

Add Conv2d for CPU (llama/14388)

68eb27a

ggml : implement REGLU/GEGLU/SWIGLU ops (llama/14158)

add5c0f

ggml : add ggml_set_rows (llama/14274)

ac46a22

ggml-cpu : "align corners" for bilinear upscale/downscale (ggml/1285)

88e7829

Add `ggml_roll` (ggml/1274)

71923e5

threading: support for GGML_SCHED_PRIO_LOW, update thread info on Windows to avoid throttling (llama/12995)

d5d55f2

ggml : add ggml_repeat_4d (llama/13824)

3fe8af8

ggml : remove ggml_graph_import and ggml_graph_export declarations (ggml/1247)

3c9a1d2

ggml : fix the order of ggml_unary_op (llama/13718)

bdae2b3

ggml : add ggml_gelu_erf() (llama/13667)

6c9cd9a

llama/ggml: add LLM training support (llama/10544)

8d3b3c1

CUDA: fix bad asserts for partial offload (llama/13337)

23e676b

CUDA: fix q_nope_absorbed prec for DS 2 Lite f16 (llama/13137)

e9c9d4b

ggml : Depthwise 2D convolution (ggml/1152)

0c950d5

ggml : add bilinear upscale support (ggml/1185)

4c5e449

ggml : add more generic custom op, remove deprecated custom ops (ggml/1183)

ba7a5f8

metal : improve FA + improve MoE (llama/12612)

04a3389

llama: Add support for RWKV v7 architecture (llama/12412)

727de7e

ggml : portability fixes for VS 2017 (llama/12150)

49e3343

cleanup: fix compile warnings associated with gnu_printf (llama/11811)

ef6a968

CUDA: use mma PTX instructions for FlashAttention (llama/11583)

f328957

CUDA: backwards pass for misc. ops, add tests (llama/11257)

2fbcec1

RoPE: fix back, CUDA support for back + noncont. (llama/11240)

131a21e

llama: add support for QRWKV6 model architecture (llama/11001)

4a6b7e0

GGUF: C++ refactor, backend support, misc fixes (llama/11030)

21c5b64

tts : add OuteTTS support (llama/10784)

8d0f0ac

llama : add Qwen2VL support + multimodal RoPE (llama/10361)

219d12b

ggml : refactor online repacking (llama/10446)

163128e

ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034)

154bbc0

ggml-cpu: support IQ4_NL_4_4 by runtime repack (llama/10541)

bf73242

ggml : add support for dynamic loading of backends (llama/10469)

b73266f

ggml: new optimization interface (ggml/988)

dd33ace

ggml : build backends as libraries (llama/10256)

3dc93f3

metal : optimize FA kernels (llama/10171)

44ff932

Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (llama/10133)

f58e658

ggml : move CPU backend to a separate file (llama/10144)

0f447f2

llama : add simple-chat example (llama/10124)

41ff26f

ggml : remove ggml_scratch (llama/10121)

3f0b7ba