~speedprog/mtg/mtg_card_detector.git

			@@ -1,3 +1,7 @@
			#include "cuda_runtime.h"
			#include "curand.h"
			#include "cublas_v2.h"

			extern "C" {
			#include "maxpool_layer.h"
			#include "cuda.h"
			@@ -77,10 +81,10 @@
			d += (valid && indexes[out_index] == index) ? delta[out_index] : 0;
			}
			}
			prev_delta[index] = d;
			prev_delta[index] += d;
			}

			extern "C" void forward_maxpool_layer_gpu(maxpool_layer layer, float *input)
			extern "C" void forward_maxpool_layer_gpu(maxpool_layer layer, network_state state)
			{
			int h = (layer.h-1)/layer.stride + 1;
			int w = (layer.w-1)/layer.stride + 1;
			@@ -88,15 +92,15 @@

			size_t n = hwc*layer.batch;

			forward_maxpool_layer_kernel<<<cuda_gridsize(n), BLOCK>>>(n, layer.h, layer.w, layer.c, layer.stride, layer.size, input, layer.output_gpu, layer.indexes_gpu);
			forward_maxpool_layer_kernel<<<cuda_gridsize(n), BLOCK>>>(n, layer.h, layer.w, layer.c, layer.stride, layer.size, state.input, layer.output_gpu, layer.indexes_gpu);
			check_error(cudaPeekAtLastError());
			}

			extern "C" void backward_maxpool_layer_gpu(maxpool_layer layer, float * delta)
			extern "C" void backward_maxpool_layer_gpu(maxpool_layer layer, network_state state)
			{
			size_t n = layer.hlayer.wlayer.c*layer.batch;

			backward_maxpool_layer_kernel<<<cuda_gridsize(n), BLOCK>>>(n, layer.h, layer.w, layer.c, layer.stride, layer.size, layer.delta_gpu, delta, layer.indexes_gpu);
			backward_maxpool_layer_kernel<<<cuda_gridsize(n), BLOCK>>>(n, layer.h, layer.w, layer.c, layer.stride, layer.size, layer.delta_gpu, state.delta, layer.indexes_gpu);
			check_error(cudaPeekAtLastError());
			}