llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2025-04-17 03:56:07 +00:00

History

Xuan-Son Nguyen be3bbd6215

ggml : x2 speed for WASM by optimizing SIMD (#11453 )

* ggml : x2 speed for WASM by optimizing SIMD

* fix bad merging

* rm trailing spaces

* rm redundant clamp

* better quantize_row_q8_K

Co-authored-by: camel-cdr <camel-cdr@protonmail.com>

* remove memset that causes buffer overflow
Co-authored-by: camel-cdr <camel-cdr@protonmail.com>

---------

Co-authored-by: camel-cdr <camel-cdr@protonmail.com>

2025-02-13 00:33:45 +01:00

cmake

cmake: add ggml find package (#11369 )

2025-01-26 12:07:48 -04:00

include

cleanup: fix compile warnings associated with gnu_printf (#11811 )

2025-02-12 10:06:53 -04:00

src

ggml : x2 speed for WASM by optimizing SIMD (#11453 )

2025-02-13 00:33:45 +01:00

.gitignore

vulkan : cmake integration (#8119 )

2024-07-13 18:12:39 +02:00

CMakeLists.txt

cmake: Add ability to pass in GGML_BUILD_NUMBER (ggml/1096)

2025-02-04 12:59:15 +02:00