Proper convolution mode for fast GPU processing #350

nshmyrev · 2023-10-05T19:53:31Z

Default convolution mode is very slow, as a result sherpa-onnx-gpu is much slower than CPU. With this fix the decoding speed is ok.

See also

microsoft/onnxruntime#12880 (comment)

https://onnxruntime.ai/docs/execution-providers/CUDA-ExecutionProvider.html#cudnn_conv_algo_search

csukuangfj · 2023-10-07T08:06:06Z

Thank you for your first contribution!

Proper convolution mode for fast GPU processing

04c5261

csukuangfj merged commit c12286f into k2-fsa:master Oct 7, 2023

XiaYucca pushed a commit to XiaYucca/sherpa-onnx that referenced this pull request Jan 9, 2025

Proper convolution mode for fast GPU processing (k2-fsa#350)

28a168d

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Proper convolution mode for fast GPU processing #350

Proper convolution mode for fast GPU processing #350

nshmyrev commented Oct 5, 2023

csukuangfj commented Oct 7, 2023

Proper convolution mode for fast GPU processing #350

Proper convolution mode for fast GPU processing #350

Conversation

nshmyrev commented Oct 5, 2023

csukuangfj commented Oct 7, 2023