AlexeyAB
2018-01-07 aeb15b3cb9157f5d0b2a9962e17de22560b8a1b2
src/gemm.c
@@ -177,6 +177,7 @@
        float *C_gpu, int ldc)
{
    cublasHandle_t handle = blas_handle();
   cudaError_t stream_status = cublasSetStream(handle, get_cuda_stream());
    cudaError_t status = cublasSgemm(handle, (TB ? CUBLAS_OP_T : CUBLAS_OP_N), 
            (TA ? CUBLAS_OP_T : CUBLAS_OP_N), N, M, K, &ALPHA, B_gpu, ldb, A_gpu, lda, &BETA, C_gpu, ldc);
    check_error(status);