~speedprog/mtg/mtg_card_detector.git

			@@ -17,7 +17,7 @@
			{
			int i = (blockIdx.x + blockIdx.ygridDim.x) blockDim.x + threadIdx.x;
			if (i >= n) return;
			binary[i] = (x[i] > 0) ? 1 : -1;
			binary[i] = (x[i] >= 0) ? 1 : -1;
			}

			void binarize_gpu(float x, int n, float binary)
			@@ -60,6 +60,7 @@
			mean = mean / size;
			for(i = 0; i < size; ++i){
			binary[fsize + i] = (filters[fsize + i] > 0) ? mean : -mean;
			//binary[fsize + i] = filters[fsize + i];
			}
			}

			@@ -71,12 +72,6 @@

			void forward_convolutional_layer_gpu(convolutional_layer l, network_state state)
			{
			int i;
			int m = l.n;
			int k = l.sizel.sizel.c;
			int n = convolutional_out_height(l)*
			convolutional_out_width(l);

			fill_ongpu(l.outputs*l.batch, 0, l.output_gpu, 1);
			if(l.binary){
			binarize_filters_gpu(l.filters_gpu, l.n, l.cl.sizel.size, l.binary_filters_gpu);
			@@ -86,9 +81,7 @@
			if(l.xnor){
			binarize_filters_gpu(l.filters_gpu, l.n, l.cl.sizel.size, l.binary_filters_gpu);
			swap_binary(&l);
			for(i = 0; i < l.batch; ++i){
			binarize_input_gpu(state.input + il.inputs, l.c, l.hl.w, l.binary_input_gpu + i*l.inputs);
			}
			binarize_gpu(state.input, l.cl.hl.w*l.batch, l.binary_input_gpu);
			state.input = l.binary_input_gpu;
			}

			@@ -109,6 +102,10 @@
			l.output_gpu);

			#else
			int i;
			int m = l.n;
			int k = l.sizel.sizel.c;
			int n = l.out_w*l.out_h;
			for(i = 0; i < l.batch; ++i){
			im2col_ongpu(state.input + il.cl.h*l.w, l.c, l.h, l.w, l.size, l.stride, l.pad, state.workspace);
			float * a = l.filters_gpu;
			@@ -121,23 +118,18 @@
			if (l.batch_normalize) {
			forward_batchnorm_layer_gpu(l, state);
			}
			add_bias_gpu(l.output_gpu, l.biases_gpu, l.batch, l.n, n);
			add_bias_gpu(l.output_gpu, l.biases_gpu, l.batch, l.n, l.out_w*l.out_h);

			activate_array_ongpu(l.output_gpu, mnl.batch, l.activation);
			activate_array_ongpu(l.output_gpu, l.outputs*l.batch, l.activation);
			//if(l.dot > 0) dot_error_gpu(l);
			if(l.binary \|\| l.xnor) swap_binary(&l);
			}

			void backward_convolutional_layer_gpu(convolutional_layer l, network_state state)
			{
			int m = l.n;
			int n = l.sizel.sizel.c;
			int k = convolutional_out_height(l)*
			convolutional_out_width(l);
			gradient_array_ongpu(l.output_gpu, l.outputs*l.batch, l.activation, l.delta_gpu);

			gradient_array_ongpu(l.output_gpu, mkl.batch, l.activation, l.delta_gpu);

			backward_bias_gpu(l.bias_updates_gpu, l.delta_gpu, l.batch, l.n, k);
			backward_bias_gpu(l.bias_updates_gpu, l.delta_gpu, l.batch, l.n, l.out_w*l.out_h);

			if(l.batch_normalize){
			backward_batchnorm_layer_gpu(l, state);
			@@ -181,6 +173,10 @@
			}

			#else
			int m = l.n;
			int n = l.sizel.sizel.c;
			int k = l.out_w*l.out_h;

			int i;
			for(i = 0; i < l.batch; ++i){
			float * a = l.delta_gpu;