~speedprog/mtg/mtg_card_detector.git

			@@ -304,7 +304,7 @@

			const size_t global_size[] = {layer.n};

			clEnqueueNDRangeKernel(queue, kernel, 1, 0, global_size, 0, 0, 0, 0);
			cl.error = clEnqueueNDRangeKernel(queue, kernel, 1, 0, global_size, 0, 0, 0, 0);
			check_error(cl);
			}

			@@ -336,9 +336,9 @@
			cl.error = clSetKernelArg(kernel, i++, sizeof(layer.output_cl), (void*) &layer.output_cl);
			check_error(cl);

			const size_t global_size[] = {layer.batch, layer.n*size};
			const size_t global_size[] = {layer.n*size, layer.batch};

			clEnqueueNDRangeKernel(queue, kernel, 2, 0, global_size, 0, 0, 0, 0);
			cl.error = clEnqueueNDRangeKernel(queue, kernel, 2, 0, global_size, 0, 0, 0, 0);
			check_error(cl);
			}

			@@ -400,7 +400,6 @@

			gemm_ongpu_offset(0,1,m,n,k,1,a,imk,k,b,ikn,k,1,c,0,n);
			}
			//cl_read_array(layer.delta_cl, layer.delta, mklayer.batch);

			if(delta_cl){
			m = layer.sizelayer.sizelayer.c;