~speedprog/mtg/mtg_card_detector.git

parent: 19d3ae72 | patch | commit | ignore whitespace

Joseph Redmon

2014-12-18 f88baf4a3a756140cef3ca07be98cabb803d80ae

99 problems

8 files modified

	Makefile	2 ●●●●● patch \| view \| raw \| blame \| history
	src/cnn.c	14 ●●●●● patch \| view \| raw \| blame \| history
	src/dropout_layer.c	9 ●●●●● patch \| view \| raw \| blame \| history
	src/dropout_layer.cl	4 ●●●●● patch \| view \| raw \| blame \| history
	src/dropout_layer.h	2 ●●●●● patch \| view \| raw \| blame \| history
	src/network.c	5 ●●●●● patch \| view \| raw \| blame \| history
	src/network_gpu.c	5 ●●●●● patch \| view \| raw \| blame \| history
	src/parser.c	6 ●●●●● patch \| view \| raw \| blame \| history

 Makefile

@@ -27,7 +27,7 @@
endif
endif
CFLAGS= $(COMMON) $(OPTS)
#CFLAGS= $(COMMON) -O0 -g
CFLAGS= $(COMMON) -O0 -g
LDFLAGS+=`pkg-config --libs opencv` -lm -pthread
VPATH=./src/
EXEC=cnn

 src/cnn.c

@@ -380,22 +380,24 @@
void train_nist(char *cfgfile)
{
    srand(222222);
    srand(time(0));
    network net = parse_network_cfg(cfgfile);
    // srand(time(0));
    data train = load_categorical_data_csv("data/mnist/mnist_train.csv", 0, 10);
    data test = load_categorical_data_csv("data/mnist/mnist_test.csv",0,10);
    normalize_data_rows(train);
    normalize_data_rows(test);
    network net = parse_network_cfg(cfgfile);
    int count = 0;
    int iters = 60000/net.batch + 1;
    while(++count <= 10){
        clock_t start = clock(), end;
        normalize_data_rows(train);
        normalize_data_rows(test);
        float loss = train_network_sgd(net, train, iters);
        end = clock();
        float test_acc = 0;
        //if(count%1 == 0) test_acc = network_accuracy(net, test);
        if(count%1 == 0) test_acc = network_accuracy(net, test);
        end = clock();
        printf("%d: Loss: %f, Test Acc: %f, Time: %lf seconds\n", count, loss, test_acc,(float)(end-start)/CLOCKS_PER_SEC);
    }
    free_data(train);
    free_data(test);
    char buff[256];
    sprintf(buff, "%s.trained", cfgfile);
    save_network(net, buff);

 src/dropout_layer.c

@@ -10,9 +10,11 @@
    layer->probability = probability;
    layer->inputs = inputs;
    layer->batch = batch;
    layer->output = calloc(inputs*batch, sizeof(float));
    layer->rand = calloc(inputs*batch, sizeof(float));
    layer->scale = 1./(1.-probability);
    #ifdef GPU
    layer->output_cl = cl_make_array(layer->output, inputs*batch);
    layer->rand_cl = cl_make_array(layer->rand, inputs*batch);
    #endif
    return layer;
@@ -24,14 +26,15 @@
    for(i = 0; i < layer.batch * layer.inputs; ++i){
        float r = rand_uniform();
        layer.rand[i] = r;
        if(r < layer.probability) input[i] = 0;
        else input[i] *= layer.scale;
        if(r < layer.probability) layer.output[i] = 0;
        else layer.output[i] = input[i]*layer.scale;
    }
}

void backward_dropout_layer(dropout_layer layer, float *delta)
{
    int i;
    if(!delta) return;
    for(i = 0; i < layer.batch * layer.inputs; ++i){
        float r = layer.rand[i];
        if(r < layer.probability) delta[i] = 0;
@@ -66,6 +69,7 @@
    cl.error = clSetKernelArg(kernel, i++, sizeof(layer.rand_cl), (void*) &layer.rand_cl);
    cl.error = clSetKernelArg(kernel, i++, sizeof(layer.probability), (void*) &layer.probability);
    cl.error = clSetKernelArg(kernel, i++, sizeof(layer.scale), (void*) &layer.scale);
    cl.error = clSetKernelArg(kernel, i++, sizeof(layer.output_cl), (void*) &layer.output_cl);
    check_error(cl);

    const size_t global_size[] = {size};
@@ -86,6 +90,7 @@
    cl.error = clSetKernelArg(kernel, i++, sizeof(layer.rand_cl), (void*) &layer.rand_cl);
    cl.error = clSetKernelArg(kernel, i++, sizeof(layer.probability), (void*) &layer.probability);
    cl.error = clSetKernelArg(kernel, i++, sizeof(layer.scale), (void*) &layer.scale);
    cl.error = clSetKernelArg(kernel, i++, sizeof(delta), (void*) &delta);
    check_error(cl);

    const size_t global_size[] = {size};

 src/dropout_layer.cl

@@ -1,5 +1,5 @@
__kernel void yoloswag420blazeit360noscope(__global float *input, __global float *rand, float prob, float scale)
__kernel void yoloswag420blazeit360noscope(__global float *input, __global float *rand, float prob, float scale, __global float *output)
{
    int id = get_global_id(0);
    input[id] = (rand[id] < prob) ? 0 : input[id]*scale;
    output[id] = (rand[id] < prob) ? 0 : input[id]*scale;
}

 src/dropout_layer.h

@@ -8,8 +8,10 @@
    float probability;
    float scale;
    float *rand;
    float *output;
    #ifdef GPU
    cl_mem rand_cl;
    cl_mem output_cl;
    #endif
} dropout_layer;


 src/network.c

@@ -74,6 +74,7 @@
            if(!train) continue;
            dropout_layer layer = *(dropout_layer *)net.layers[i];
            forward_dropout_layer(layer, input);
            input = layer.output;
        }
        else if(net.types[i] == FREEWEIGHT){
            if(!train) continue;
@@ -119,7 +120,8 @@
        softmax_layer layer = *(softmax_layer *)net.layers[i];
        return layer.output;
    } else if(net.types[i] == DROPOUT){
        return get_network_output_layer(net, i-1);
        dropout_layer layer = *(dropout_layer *)net.layers[i];
        return layer.output;
    } else if(net.types[i] == FREEWEIGHT){
        return get_network_output_layer(net, i-1);
    } else if(net.types[i] == CONNECTED){
@@ -153,6 +155,7 @@
        softmax_layer layer = *(softmax_layer *)net.layers[i];
        return layer.delta;
    } else if(net.types[i] == DROPOUT){
        if(i == 0) return 0;
        return get_network_delta_layer(net, i-1);
    } else if(net.types[i] == FREEWEIGHT){
        return get_network_delta_layer(net, i-1);

 src/network_gpu.c

@@ -52,6 +52,7 @@
            if(!train) continue;
            dropout_layer layer = *(dropout_layer *)net.layers[i];
            forward_dropout_layer_gpu(layer, input);
            input = layer.output_cl;
        }
        else if(net.types[i] == CROP){
            crop_layer layer = *(crop_layer *)net.layers[i];
@@ -138,7 +139,8 @@
        softmax_layer layer = *(softmax_layer *)net.layers[i];
        return layer.output_cl;
    } else if(net.types[i] == DROPOUT){
        return get_network_output_cl_layer(net, i-1);
        dropout_layer layer = *(dropout_layer *)net.layers[i];
        return layer.output_cl;
    }
    return 0;
}
@@ -161,6 +163,7 @@
        softmax_layer layer = *(softmax_layer *)net.layers[i];
        return layer.delta_cl;
    } else if(net.types[i] == DROPOUT){
        if(i == 0) return 0;
        return get_network_delta_cl_layer(net, i-1);
    }
    return 0;

 src/parser.c

@@ -245,6 +245,12 @@
    if(count == 0){
        net->batch = option_find_int(options, "batch",1);
        input = option_find_int(options, "input",1);
        float learning_rate = option_find_float(options, "learning_rate", .001);
        float momentum = option_find_float(options, "momentum", .9);
        float decay = option_find_float(options, "decay", .0001);
        net->learning_rate = learning_rate;
        net->momentum = momentum;
        net->decay = decay;
    }else{
        input =  get_network_output_size_layer(*net, count-1);
    }

			@@ -27,7 +27,7 @@
			endif
			endif
			CFLAGS= $(COMMON) $(OPTS)
			#CFLAGS= $(COMMON) -O0 -g
			CFLAGS= $(COMMON) -O0 -g
			LDFLAGS+=`pkg-config --libs opencv` -lm -pthread
			VPATH=./src/
			EXEC=cnn

			@@ -380,22 +380,24 @@
			void train_nist(char *cfgfile)
			{
			srand(222222);
			srand(time(0));
			network net = parse_network_cfg(cfgfile);
			// srand(time(0));
			data train = load_categorical_data_csv("data/mnist/mnist_train.csv", 0, 10);
			data test = load_categorical_data_csv("data/mnist/mnist_test.csv",0,10);
			normalize_data_rows(train);
			normalize_data_rows(test);
			network net = parse_network_cfg(cfgfile);
			int count = 0;
			int iters = 60000/net.batch + 1;
			while(++count <= 10){
			clock_t start = clock(), end;
			normalize_data_rows(train);
			normalize_data_rows(test);
			float loss = train_network_sgd(net, train, iters);
			end = clock();
			float test_acc = 0;
			//if(count%1 == 0) test_acc = network_accuracy(net, test);
			if(count%1 == 0) test_acc = network_accuracy(net, test);
			end = clock();
			printf("%d: Loss: %f, Test Acc: %f, Time: %lf seconds\n", count, loss, test_acc,(float)(end-start)/CLOCKS_PER_SEC);
			}
			free_data(train);
			free_data(test);
			char buff[256];
			sprintf(buff, "%s.trained", cfgfile);
			save_network(net, buff);

			@@ -10,9 +10,11 @@
			layer->probability = probability;
			layer->inputs = inputs;
			layer->batch = batch;
			layer->output = calloc(inputs*batch, sizeof(float));
			layer->rand = calloc(inputs*batch, sizeof(float));
			layer->scale = 1./(1.-probability);
			#ifdef GPU
			layer->output_cl = cl_make_array(layer->output, inputs*batch);
			layer->rand_cl = cl_make_array(layer->rand, inputs*batch);
			#endif
			return layer;
			@@ -24,14 +26,15 @@
			for(i = 0; i < layer.batch * layer.inputs; ++i){
			float r = rand_uniform();
			layer.rand[i] = r;
			if(r < layer.probability) input[i] = 0;
			else input[i] *= layer.scale;
			if(r < layer.probability) layer.output[i] = 0;
			else layer.output[i] = input[i]*layer.scale;
			}
			}

			void backward_dropout_layer(dropout_layer layer, float *delta)
			{
			int i;
			if(!delta) return;
			for(i = 0; i < layer.batch * layer.inputs; ++i){
			float r = layer.rand[i];
			if(r < layer.probability) delta[i] = 0;
			@@ -66,6 +69,7 @@
			cl.error = clSetKernelArg(kernel, i++, sizeof(layer.rand_cl), (void*) &layer.rand_cl);
			cl.error = clSetKernelArg(kernel, i++, sizeof(layer.probability), (void*) &layer.probability);
			cl.error = clSetKernelArg(kernel, i++, sizeof(layer.scale), (void*) &layer.scale);
			cl.error = clSetKernelArg(kernel, i++, sizeof(layer.output_cl), (void*) &layer.output_cl);
			check_error(cl);

			const size_t global_size[] = {size};
			@@ -86,6 +90,7 @@
			cl.error = clSetKernelArg(kernel, i++, sizeof(layer.rand_cl), (void*) &layer.rand_cl);
			cl.error = clSetKernelArg(kernel, i++, sizeof(layer.probability), (void*) &layer.probability);
			cl.error = clSetKernelArg(kernel, i++, sizeof(layer.scale), (void*) &layer.scale);
			cl.error = clSetKernelArg(kernel, i++, sizeof(delta), (void*) &delta);
			check_error(cl);

			const size_t global_size[] = {size};

			@@ -1,5 +1,5 @@
			__kernel void yoloswag420blazeit360noscope(__global float input, __global float rand, float prob, float scale)
			__kernel void yoloswag420blazeit360noscope(__global float input, __global float rand, float prob, float scale, __global float *output)
			{
			int id = get_global_id(0);
			input[id] = (rand[id] < prob) ? 0 : input[id]*scale;
			output[id] = (rand[id] < prob) ? 0 : input[id]*scale;
			}

			@@ -8,8 +8,10 @@
			float probability;
			float scale;
			float *rand;
			float *output;
			#ifdef GPU
			cl_mem rand_cl;
			cl_mem output_cl;
			#endif
			} dropout_layer;

			@@ -74,6 +74,7 @@
			if(!train) continue;
			dropout_layer layer = (dropout_layer )net.layers[i];
			forward_dropout_layer(layer, input);
			input = layer.output;
			}
			else if(net.types[i] == FREEWEIGHT){
			if(!train) continue;
			@@ -119,7 +120,8 @@
			softmax_layer layer = (softmax_layer )net.layers[i];
			return layer.output;
			} else if(net.types[i] == DROPOUT){
			return get_network_output_layer(net, i-1);
			dropout_layer layer = (dropout_layer )net.layers[i];
			return layer.output;
			} else if(net.types[i] == FREEWEIGHT){
			return get_network_output_layer(net, i-1);
			} else if(net.types[i] == CONNECTED){
			@@ -153,6 +155,7 @@
			softmax_layer layer = (softmax_layer )net.layers[i];
			return layer.delta;
			} else if(net.types[i] == DROPOUT){
			if(i == 0) return 0;
			return get_network_delta_layer(net, i-1);
			} else if(net.types[i] == FREEWEIGHT){
			return get_network_delta_layer(net, i-1);

			@@ -52,6 +52,7 @@
			if(!train) continue;
			dropout_layer layer = (dropout_layer )net.layers[i];
			forward_dropout_layer_gpu(layer, input);
			input = layer.output_cl;
			}
			else if(net.types[i] == CROP){
			crop_layer layer = (crop_layer )net.layers[i];
			@@ -138,7 +139,8 @@
			softmax_layer layer = (softmax_layer )net.layers[i];
			return layer.output_cl;
			} else if(net.types[i] == DROPOUT){
			return get_network_output_cl_layer(net, i-1);
			dropout_layer layer = (dropout_layer )net.layers[i];
			return layer.output_cl;
			}
			return 0;
			}
			@@ -161,6 +163,7 @@
			softmax_layer layer = (softmax_layer )net.layers[i];
			return layer.delta_cl;
			} else if(net.types[i] == DROPOUT){
			if(i == 0) return 0;
			return get_network_delta_cl_layer(net, i-1);
			}
			return 0;

			@@ -245,6 +245,12 @@
			if(count == 0){
			net->batch = option_find_int(options, "batch",1);
			input = option_find_int(options, "input",1);
			float learning_rate = option_find_float(options, "learning_rate", .001);
			float momentum = option_find_float(options, "momentum", .9);
			float decay = option_find_float(options, "decay", .0001);
			net->learning_rate = learning_rate;
			net->momentum = momentum;
			net->decay = decay;
			}else{
			input = get_network_output_size_layer(*net, count-1);
			}