backend(build): set CUDA arch defaults before enable_language(CUDA) #2855

cebtenzzre · 2024-08-13T16:57:40Z

This change included in v3.2.0 introduced a build regression that caused llama.cpp to build for only the CUDA 5.2 compute architecture by default. Normally this would only be a performance regression, but for whatever reason this seems to be causing incorrect output. If this fix is confirmed, we should report the issue upstream.

Why the defaults were wrong before this PR is best explained in my own words from a month ago: enable_language(CUDA) sets CMAKE_CUDA_ARCHITECTURES (assuming CMP0104 is enabled), so any defaults of our own must be set before this. This unfortunately means this code must be moved into the main backend CMakeLists.txt.

Follow-up to #2802

Signed-off-by: Jared Van Bortel <jared@nomic.ai>

cebtenzzre added 2 commits August 13, 2024 12:50

backend(build): set CUDA arch defaults before enable_language(CUDA)

710f31e

Signed-off-by: Jared Van Bortel <jared@nomic.ai>

changelog: add entry for this PR

4a13543

Signed-off-by: Jared Van Bortel <jared@nomic.ai>

cebtenzzre marked this pull request as ready for review August 13, 2024 17:11

cebtenzzre requested a review from manyoso August 13, 2024 17:11

manyoso approved these changes Aug 13, 2024

View reviewed changes

manyoso merged commit 7463b21 into main Aug 13, 2024
6 of 20 checks passed

cebtenzzre mentioned this pull request Aug 14, 2024

After Updating to v3.2.0: GPT4All Replies with 'GGGG' and Crashes When Using RAG #2851

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

backend(build): set CUDA arch defaults before enable_language(CUDA) #2855

backend(build): set CUDA arch defaults before enable_language(CUDA) #2855

cebtenzzre commented Aug 13, 2024

backend(build): set CUDA arch defaults before enable_language(CUDA) #2855

backend(build): set CUDA arch defaults before enable_language(CUDA) #2855

Conversation

cebtenzzre commented Aug 13, 2024