~speedprog/mtg/mtg_card_detector.git

			@@ -368,6 +368,14 @@
			if(i < N) X[iINCX] = min(ALPHA, max(-ALPHA, X[iINCX]));
			}

			__global__ void supp_kernel(int N, float ALPHA, float *X, int INCX)
			{
			int i = (blockIdx.x + blockIdx.ygridDim.x) blockDim.x + threadIdx.x;
			if(i < N) {
			if((X[iINCX] X[iINCX]) < (ALPHA ALPHA)) X[i*INCX] = 0;
			}
			}

			__global__ void scal_kernel(int N, float ALPHA, float *X, int INCX)
			{
			int i = (blockIdx.x + blockIdx.ygridDim.x) blockDim.x + threadIdx.x;
			@@ -552,6 +560,12 @@
			check_error(cudaPeekAtLastError());
			}

			extern "C" void supp_ongpu(int N, float ALPHA, float * X, int INCX)
			{
			supp_kernel<<<cuda_gridsize(N), BLOCK>>>(N, ALPHA, X, INCX);
			check_error(cudaPeekAtLastError());
			}

			extern "C" void fill_ongpu(int N, float ALPHA, float * X, int INCX)
			{
			fill_kernel<<<cuda_gridsize(N), BLOCK>>>(N, ALPHA, X, INCX);
			@@ -633,6 +647,7 @@
			}



			__global__ void weighted_sum_kernel(int n, float a, float b, float s, float c)
			{
			int i = (blockIdx.x + blockIdx.ygridDim.x) blockDim.x + threadIdx.x;