llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2025-04-20 05:26:07 +00:00

History

llama : accept a list of devices to use to offload a model (#10497 )

* llama : accept a list of devices to use to offload a model

* accept `--dev none` to completely disable offloading

* fix dev list with dl backends

* rename env parameter to LLAMA_ARG_DEVICE for consistency

2024-11-25 19:30:06 +01:00

llama.h

llama : accept a list of devices to use to offload a model (#10497 )

2024-11-25 19:30:06 +01:00