musa: override warp_size of musa device to 32 (#12445)

Signed-off-by: Xiaodong Ye <xiaodong.ye@mthreads.com>
2025-04-16 03:26:08 +00:00 · 2025-03-19 02:28:26 +08:00 · 2025-03-19 02:28:26 +08:00 · bb115d2bf7
commit bb115d2bf7
parent 29fff308c7
1 changed files with 2 additions and 0 deletions
--- a/ggml/src/ggml-cuda/ggml-cuda.cu
+++ b/ggml/src/ggml-cuda/ggml-cuda.cu
@ -262,6 +262,8 @@ static ggml_cuda_device_info ggml_cuda_init() {
                      id, prop.name, prop.gcnArchName, info.devices[id].cc & 0xffff,
                      device_vmm ? "yes" : "no", prop.warpSize);
 #elif defined(GGML_USE_MUSA)
+        // FIXME: Ensure compatibility with varying warp sizes across different MUSA archs.
+        info.devices[id].warp_size = 32;
        // TODO: refine the .cc to reflect MUSA's actual CC capabilities
        info.devices[id].smpbo = prop.sharedMemPerBlockOptin;
        info.devices[id].cc = 100*prop.major + 10*prop.minor;