~speedprog/mtg/mtg_card_detector.git

			@@ -2,21 +2,27 @@
			#include <string.h>
			#include <stdlib.h>

			#include "blas.h"
			#include "parser.h"
			#include "assert.h"
			#include "activations.h"
			#include "crop_layer.h"
			#include "cost_layer.h"
			#include "convolutional_layer.h"
			#include "activation_layer.h"
			#include "normalization_layer.h"
			#include "batchnorm_layer.h"
			#include "deconvolutional_layer.h"
			#include "connected_layer.h"
			#include "rnn_layer.h"
			#include "gru_layer.h"
			#include "crnn_layer.h"
			#include "maxpool_layer.h"
			#include "reorg_layer.h"
			#include "softmax_layer.h"
			#include "dropout_layer.h"
			#include "detection_layer.h"
			#include "region_layer.h"
			#include "avgpool_layer.h"
			#include "local_layer.h"
			#include "route_layer.h"
			@@ -37,16 +43,20 @@
			int is_deconvolutional(section *s);
			int is_connected(section *s);
			int is_rnn(section *s);
			int is_gru(section *s);
			int is_crnn(section *s);
			int is_maxpool(section *s);
			int is_reorg(section *s);
			int is_avgpool(section *s);
			int is_dropout(section *s);
			int is_softmax(section *s);
			int is_normalization(section *s);
			int is_batchnorm(section *s);
			int is_crop(section *s);
			int is_shortcut(section *s);
			int is_cost(section *s);
			int is_detection(section *s);
			int is_region(section *s);
			int is_route(section *s);
			list read_cfg(char filename);

			@@ -109,13 +119,6 @@

			deconvolutional_layer layer = make_deconvolutional_layer(batch,h,w,c,n,size,stride,activation);

			char *weights = option_find_str(options, "weights", 0);
			char *biases = option_find_str(options, "biases", 0);
			parse_data(weights, layer.filters, cnsize*size);
			parse_data(biases, layer.biases, n);
			#ifdef GPU
			if(weights \|\| biases) push_deconvolutional_layer(layer);
			#endif
			return layer;
			}

			@@ -145,7 +148,10 @@
			int n = option_find_int(options, "filters",1);
			int size = option_find_int(options, "size",1);
			int stride = option_find_int(options, "stride",1);
			int pad = option_find_int(options, "pad",0);
			int pad = option_find_int_quiet(options, "pad",0);
			int padding = option_find_int_quiet(options, "padding",0);
			if(pad) padding = size/2;

			char *activation_s = option_find_str(options, "activation", "logistic");
			ACTIVATION activation = get_activation(activation_s);

			@@ -157,18 +163,12 @@
			if(!(h && w && c)) error("Layer before convolutional layer must output image.");
			int batch_normalize = option_find_int_quiet(options, "batch_normalize", 0);
			int binary = option_find_int_quiet(options, "binary", 0);
			int xnor = option_find_int_quiet(options, "xnor", 0);

			convolutional_layer layer = make_convolutional_layer(batch,h,w,c,n,size,stride,pad,activation, batch_normalize, binary);
			convolutional_layer layer = make_convolutional_layer(batch,h,w,c,n,size,stride,padding,activation, batch_normalize, binary, xnor);
			layer.flipped = option_find_int_quiet(options, "flipped", 0);
			layer.dot = option_find_float_quiet(options, "dot", 0);

			char *weights = option_find_str(options, "weights", 0);
			char *biases = option_find_str(options, "biases", 0);
			parse_data(weights, layer.filters, cnsize*size);
			parse_data(biases, layer.biases, n);
			#ifdef GPU
			if(weights \|\| biases) push_convolutional_layer(layer);
			#endif
			return layer;
			}

			@@ -203,6 +203,16 @@
			return l;
			}

			layer parse_gru(list *options, size_params params)
			{
			int output = option_find_int(options, "output",1);
			int batch_normalize = option_find_int_quiet(options, "batch_normalize", 0);

			layer l = make_gru_layer(params.batch, params.inputs, output, params.time_steps, batch_normalize);

			return l;
			}

			connected_layer parse_connected(list *options, size_params params)
			{
			int output = option_find_int(options, "output",1);
			@@ -212,13 +222,6 @@

			connected_layer layer = make_connected_layer(params.batch, params.inputs, output, activation, batch_normalize);

			char *weights = option_find_str(options, "weights", 0);
			char *biases = option_find_str(options, "biases", 0);
			parse_data(biases, layer.biases, output);
			parse_data(weights, layer.weights, params.inputs*output);
			#ifdef GPU
			if(weights \|\| biases) push_connected_layer(layer);
			#endif
			return layer;
			}

			@@ -230,6 +233,32 @@
			return layer;
			}

			layer parse_region(list *options, size_params params)
			{
			int coords = option_find_int(options, "coords", 4);
			int classes = option_find_int(options, "classes", 20);
			int num = option_find_int(options, "num", 1);

			params.w = option_find_int(options, "side", params.w);
			params.h = option_find_int(options, "side", params.h);

			layer l = make_region_layer(params.batch, params.w, params.h, num, classes, coords);
			assert(l.outputs == params.inputs);

			l.log = option_find_int_quiet(options, "log", 0);
			l.sqrt = option_find_int_quiet(options, "sqrt", 0);

			l.softmax = option_find_int(options, "softmax", 0);
			l.max_boxes = option_find_int_quiet(options, "max",30);
			l.jitter = option_find_float(options, "jitter", .2);
			l.rescore = option_find_int_quiet(options, "rescore",0);

			l.coord_scale = option_find_float(options, "coord_scale", 1);
			l.object_scale = option_find_float(options, "object_scale", 1);
			l.noobject_scale = option_find_float(options, "noobject_scale", 1);
			l.class_scale = option_find_float(options, "class_scale", 1);
			return l;
			}
			detection_layer parse_detection(list *options, size_params params)
			{
			int coords = option_find_int(options, "coords", 1);
			@@ -242,12 +271,15 @@
			layer.softmax = option_find_int(options, "softmax", 0);
			layer.sqrt = option_find_int(options, "sqrt", 0);

			layer.max_boxes = option_find_int_quiet(options, "max",30);
			layer.coord_scale = option_find_float(options, "coord_scale", 1);
			layer.forced = option_find_int(options, "forced", 0);
			layer.object_scale = option_find_float(options, "object_scale", 1);
			layer.noobject_scale = option_find_float(options, "noobject_scale", 1);
			layer.class_scale = option_find_float(options, "class_scale", 1);
			layer.jitter = option_find_float(options, "jitter", .2);
			layer.random = option_find_int_quiet(options, "random", 0);
			layer.reorg = option_find_int_quiet(options, "reorg", 0);
			return layer;
			}

			@@ -257,6 +289,7 @@
			COST_TYPE type = get_cost_type(type_s);
			float scale = option_find_float_quiet(options, "scale",1);
			cost_layer layer = make_cost_layer(params.batch, params.inputs, type, scale);
			layer.ratio = option_find_float_quiet(options, "ratio",0);
			return layer;
			}

			@@ -284,10 +317,26 @@
			return l;
			}

			layer parse_reorg(list *options, size_params params)
			{
			int stride = option_find_int(options, "stride",1);

			int batch,h,w,c;
			h = params.h;
			w = params.w;
			c = params.c;
			batch=params.batch;
			if(!(h && w && c)) error("Layer before reorg layer must output image.");

			layer layer = make_reorg_layer(batch,w,h,c,stride);
			return layer;
			}

			maxpool_layer parse_maxpool(list *options, size_params params)
			{
			int stride = option_find_int(options, "stride",1);
			int size = option_find_int(options, "size",stride);
			int padding = option_find_int_quiet(options, "padding", (size-1)/2);

			int batch,h,w,c;
			h = params.h;
			@@ -296,7 +345,7 @@
			batch=params.batch;
			if(!(h && w && c)) error("Layer before maxpool layer must output image.");

			maxpool_layer layer = make_maxpool_layer(batch,h,w,c,size,stride);
			maxpool_layer layer = make_maxpool_layer(batch,h,w,c,size,stride,padding);
			return layer;
			}

			@@ -333,6 +382,12 @@
			return l;
			}

			layer parse_batchnorm(list *options, size_params params)
			{
			layer l = make_batchnorm_layer(params.batch, params.w, params.h, params.c);
			return l;
			}

			layer parse_shortcut(list *options, size_params params, network net)
			{
			char *l = option_find(options, "from");
			@@ -411,6 +466,7 @@

			learning_rate_policy get_policy(char *s)
			{
			if (strcmp(s, "random")==0) return RANDOM;
			if (strcmp(s, "poly")==0) return POLY;
			if (strcmp(s, "constant")==0) return CONSTANT;
			if (strcmp(s, "step")==0) return STEP;
			@@ -438,11 +494,19 @@
			net->c = option_find_int_quiet(options, "channels",0);
			net->inputs = option_find_int_quiet(options, "inputs", net->h * net->w * net->c);
			net->max_crop = option_find_int_quiet(options, "max_crop",net->w*2);
			net->min_crop = option_find_int_quiet(options, "min_crop",net->w);

			net->angle = option_find_float_quiet(options, "angle", 0);
			net->aspect = option_find_float_quiet(options, "aspect", 1);
			net->saturation = option_find_float_quiet(options, "saturation", 1);
			net->exposure = option_find_float_quiet(options, "exposure", 1);
			net->hue = option_find_float_quiet(options, "hue", 0);

			if(!net->inputs && !(net->h && net->w && net->c)) error("No input parameters supplied");

			char *policy_s = option_find_str(options, "policy", "constant");
			net->policy = get_policy(policy_s);
			net->burn_in = option_find_int_quiet(options, "burn_in", 0);
			if(net->policy == STEP){
			net->step = option_find_int(options, "step", 1);
			net->scale = option_find_float(options, "scale", 1);
			@@ -475,7 +539,7 @@
			} else if (net->policy == SIG){
			net->gamma = option_find_float(options, "gamma", 1);
			net->step = option_find_int(options, "step", 1);
			} else if (net->policy == POLY){
			} else if (net->policy == POLY \|\| net->policy == RANDOM){
			net->power = option_find_float(options, "power", 1);
			}
			net->max_batches = option_find_int(options, "max_batches", 0);
			@@ -487,6 +551,7 @@
			node *n = sections->front;
			if(!n) error("Config file has no sections");
			network net = make_network(sections->size - 1);
			net.gpu_index = gpu_index;
			size_params params;

			section s = (section )n->val;
			@@ -501,6 +566,7 @@
			params.batch = net.batch;
			params.time_steps = net.time_steps;

			size_t workspace_size = 0;
			n = n->next;
			int count = 0;
			free_section(s);
			@@ -520,6 +586,8 @@
			l = parse_deconvolutional(options, params);
			}else if(is_rnn(s)){
			l = parse_rnn(options, params);
			}else if(is_gru(s)){
			l = parse_gru(options, params);
			}else if(is_crnn(s)){
			l = parse_crnn(options, params);
			}else if(is_connected(s)){
			@@ -528,14 +596,20 @@
			l = parse_crop(options, params);
			}else if(is_cost(s)){
			l = parse_cost(options, params);
			}else if(is_region(s)){
			l = parse_region(options, params);
			}else if(is_detection(s)){
			l = parse_detection(options, params);
			}else if(is_softmax(s)){
			l = parse_softmax(options, params);
			}else if(is_normalization(s)){
			l = parse_normalization(options, params);
			}else if(is_batchnorm(s)){
			l = parse_batchnorm(options, params);
			}else if(is_maxpool(s)){
			l = parse_maxpool(options, params);
			}else if(is_reorg(s)){
			l = parse_reorg(options, params);
			}else if(is_avgpool(s)){
			l = parse_avgpool(options, params);
			}else if(is_route(s)){
			@@ -557,6 +631,7 @@
			l.dontloadscales = option_find_int_quiet(options, "dontloadscales", 0);
			option_unused(options);
			net.layers[count] = l;
			if (l.workspace_size > workspace_size) workspace_size = l.workspace_size;
			free_section(s);
			n = n->next;
			++count;
			@@ -570,9 +645,57 @@
			free_list(sections);
			net.outputs = get_network_output_size(net);
			net.output = get_network_output(net);
			if(workspace_size){
			//printf("%ld\n", workspace_size);
			#ifdef GPU
			if(gpu_index >= 0){
			net.workspace = cuda_make_array(0, (workspace_size-1)/sizeof(float)+1);
			}else {
			net.workspace = calloc(1, workspace_size);
			}
			#else
			net.workspace = calloc(1, workspace_size);
			#endif
			}
			return net;
			}

			LAYER_TYPE string_to_layer_type(char * type)
			{

			if (strcmp(type, "[shortcut]")==0) return SHORTCUT;
			if (strcmp(type, "[crop]")==0) return CROP;
			if (strcmp(type, "[cost]")==0) return COST;
			if (strcmp(type, "[detection]")==0) return DETECTION;
			if (strcmp(type, "[region]")==0) return REGION;
			if (strcmp(type, "[local]")==0) return LOCAL;
			if (strcmp(type, "[deconv]")==0
			\|\| strcmp(type, "[deconvolutional]")==0) return DECONVOLUTIONAL;
			if (strcmp(type, "[conv]")==0
			\|\| strcmp(type, "[convolutional]")==0) return CONVOLUTIONAL;
			if (strcmp(type, "[activation]")==0) return ACTIVE;
			if (strcmp(type, "[net]")==0
			\|\| strcmp(type, "[network]")==0) return NETWORK;
			if (strcmp(type, "[crnn]")==0) return CRNN;
			if (strcmp(type, "[gru]")==0) return GRU;
			if (strcmp(type, "[rnn]")==0) return RNN;
			if (strcmp(type, "[conn]")==0
			\|\| strcmp(type, "[connected]")==0) return CONNECTED;
			if (strcmp(type, "[max]")==0
			\|\| strcmp(type, "[maxpool]")==0) return MAXPOOL;
			if (strcmp(type, "[reorg]")==0) return REORG;
			if (strcmp(type, "[avg]")==0
			\|\| strcmp(type, "[avgpool]")==0) return AVGPOOL;
			if (strcmp(type, "[dropout]")==0) return DROPOUT;
			if (strcmp(type, "[lrn]")==0
			\|\| strcmp(type, "[normalization]")==0) return NORMALIZATION;
			if (strcmp(type, "[batchnorm]")==0) return BATCHNORM;
			if (strcmp(type, "[soft]")==0
			\|\| strcmp(type, "[softmax]")==0) return SOFTMAX;
			if (strcmp(type, "[route]")==0) return ROUTE;
			return BLANK;
			}

			int is_shortcut(section *s)
			{
			return (strcmp(s->type, "[shortcut]")==0);
			@@ -585,6 +708,10 @@
			{
			return (strcmp(s->type, "[cost]")==0);
			}
			int is_region(section *s)
			{
			return (strcmp(s->type, "[region]")==0);
			}
			int is_detection(section *s)
			{
			return (strcmp(s->type, "[detection]")==0);
			@@ -616,6 +743,10 @@
			{
			return (strcmp(s->type, "[crnn]")==0);
			}
			int is_gru(section *s)
			{
			return (strcmp(s->type, "[gru]")==0);
			}
			int is_rnn(section *s)
			{
			return (strcmp(s->type, "[rnn]")==0);
			@@ -625,6 +756,10 @@
			return (strcmp(s->type, "[conn]")==0
			\|\| strcmp(s->type, "[connected]")==0);
			}
			int is_reorg(section *s)
			{
			return (strcmp(s->type, "[reorg]")==0);
			}
			int is_maxpool(section *s)
			{
			return (strcmp(s->type, "[max]")==0
			@@ -646,6 +781,11 @@
			\|\| strcmp(s->type, "[normalization]")==0);
			}

			int is_batchnorm(section *s)
			{
			return (strcmp(s->type, "[batchnorm]")==0);
			}

			int is_softmax(section *s)
			{
			return (strcmp(s->type, "[soft]")==0
			@@ -717,21 +857,57 @@

			for (j = 0; j < l.n; ++j){
			int index = jl.cl.size*l.size;
			fwrite(l.filters+index, sizeof(float), l.cl.sizel.size, fp);
			fwrite(l.weights+index, sizeof(float), l.cl.sizel.size, fp);
			for (k = 0; k < l.cl.sizel.size; ++k) fwrite(&zero, sizeof(float), 1, fp);
			}
			for (j = 0; j < l.n; ++j){
			int index = jl.cl.size*l.size;
			for (k = 0; k < l.cl.sizel.size; ++k) fwrite(&zero, sizeof(float), 1, fp);
			fwrite(l.filters+index, sizeof(float), l.cl.sizel.size, fp);
			fwrite(l.weights+index, sizeof(float), l.cl.sizel.size, fp);
			}
			}
			}
			fclose(fp);
			}

			void save_convolutional_weights_binary(layer l, FILE *fp)
			{
			#ifdef GPU
			if(gpu_index >= 0){
			pull_convolutional_layer(l);
			}
			#endif
			binarize_weights(l.weights, l.n, l.cl.sizel.size, l.binary_weights);
			int size = l.cl.sizel.size;
			int i, j, k;
			fwrite(l.biases, sizeof(float), l.n, fp);
			if (l.batch_normalize){
			fwrite(l.scales, sizeof(float), l.n, fp);
			fwrite(l.rolling_mean, sizeof(float), l.n, fp);
			fwrite(l.rolling_variance, sizeof(float), l.n, fp);
			}
			for(i = 0; i < l.n; ++i){
			float mean = l.binary_weights[i*size];
			if(mean < 0) mean = -mean;
			fwrite(&mean, sizeof(float), 1, fp);
			for(j = 0; j < size/8; ++j){
			int index = isize + j8;
			unsigned char c = 0;
			for(k = 0; k < 8; ++k){
			if (j*8 + k >= size) break;
			if (l.binary_weights[index + k] > 0) c = (c \| 1<<k);
			}
			fwrite(&c, sizeof(char), 1, fp);
			}
			}
			}

			void save_convolutional_weights(layer l, FILE *fp)
			{
			if(l.binary){
			//save_convolutional_weights_binary(l, fp);
			//return;
			}
			#ifdef GPU
			if(gpu_index >= 0){
			pull_convolutional_layer(l);
			@@ -744,7 +920,19 @@
			fwrite(l.rolling_mean, sizeof(float), l.n, fp);
			fwrite(l.rolling_variance, sizeof(float), l.n, fp);
			}
			fwrite(l.filters, sizeof(float), num, fp);
			fwrite(l.weights, sizeof(float), num, fp);
			}

			void save_batchnorm_weights(layer l, FILE *fp)
			{
			#ifdef GPU
			if(gpu_index >= 0){
			pull_batchnorm_layer(l);
			}
			#endif
			fwrite(l.scales, sizeof(float), l.c, fp);
			fwrite(l.rolling_mean, sizeof(float), l.c, fp);
			fwrite(l.rolling_variance, sizeof(float), l.c, fp);
			}

			void save_connected_weights(layer l, FILE *fp)
			@@ -765,6 +953,9 @@

			void save_weights_upto(network net, char *filename, int cutoff)
			{
			#ifdef GPU
			cuda_set_device(net.gpu_index);
			#endif
			fprintf(stderr, "Saving weights to %s\n", filename);
			FILE *fp = fopen(filename, "w");
			if(!fp) file_error(filename);
			@@ -784,10 +975,19 @@
			save_convolutional_weights(l, fp);
			} if(l.type == CONNECTED){
			save_connected_weights(l, fp);
			} if(l.type == BATCHNORM){
			save_batchnorm_weights(l, fp);
			} if(l.type == RNN){
			save_connected_weights(*(l.input_layer), fp);
			save_connected_weights(*(l.self_layer), fp);
			save_connected_weights(*(l.output_layer), fp);
			} if(l.type == GRU){
			save_connected_weights(*(l.input_z_layer), fp);
			save_connected_weights(*(l.input_r_layer), fp);
			save_connected_weights(*(l.input_h_layer), fp);
			save_connected_weights(*(l.state_z_layer), fp);
			save_connected_weights(*(l.state_r_layer), fp);
			save_connected_weights(*(l.state_h_layer), fp);
			} if(l.type == CRNN){
			save_convolutional_weights(*(l.input_layer), fp);
			save_convolutional_weights(*(l.self_layer), fp);
			@@ -801,7 +1001,7 @@
			int locations = l.out_w*l.out_h;
			int size = l.sizel.sizel.cl.nlocations;
			fwrite(l.biases, sizeof(float), l.outputs, fp);
			fwrite(l.filters, sizeof(float), size, fp);
			fwrite(l.weights, sizeof(float), size, fp);
			}
			}
			fclose(fp);
			@@ -831,10 +1031,15 @@
			if(transpose){
			transpose_matrix(l.weights, l.inputs, l.outputs);
			}
			//printf("Biases: %f mean %f variance\n", mean_array(l.biases, l.outputs), variance_array(l.biases, l.outputs));
			//printf("Weights: %f mean %f variance\n", mean_array(l.weights, l.outputsl.inputs), variance_array(l.weights, l.outputsl.inputs));
			if (l.batch_normalize && (!l.dontloadscales)){
			fread(l.scales, sizeof(float), l.outputs, fp);
			fread(l.rolling_mean, sizeof(float), l.outputs, fp);
			fread(l.rolling_variance, sizeof(float), l.outputs, fp);
			//printf("Scales: %f mean %f variance\n", mean_array(l.scales, l.outputs), variance_array(l.scales, l.outputs));
			//printf("rolling_mean: %f mean %f variance\n", mean_array(l.rolling_mean, l.outputs), variance_array(l.rolling_mean, l.outputs));
			//printf("rolling_variance: %f mean %f variance\n", mean_array(l.rolling_variance, l.outputs), variance_array(l.rolling_variance, l.outputs));
			}
			#ifdef GPU
			if(gpu_index >= 0){
			@@ -843,27 +1048,67 @@
			#endif
			}

			void load_batchnorm_weights(layer l, FILE *fp)
			{
			fread(l.scales, sizeof(float), l.c, fp);
			fread(l.rolling_mean, sizeof(float), l.c, fp);
			fread(l.rolling_variance, sizeof(float), l.c, fp);
			#ifdef GPU
			if(gpu_index >= 0){
			push_batchnorm_layer(l);
			}
			#endif
			}

			void load_convolutional_weights_binary(layer l, FILE *fp)
			{
			fread(l.biases, sizeof(float), l.n, fp);
			if (l.batch_normalize && (!l.dontloadscales)){
			fread(l.scales, sizeof(float), l.n, fp);
			fread(l.rolling_mean, sizeof(float), l.n, fp);
			fread(l.rolling_variance, sizeof(float), l.n, fp);
			}
			int size = l.cl.sizel.size;
			int i, j, k;
			for(i = 0; i < l.n; ++i){
			float mean = 0;
			fread(&mean, sizeof(float), 1, fp);
			for(j = 0; j < size/8; ++j){
			int index = isize + j8;
			unsigned char c = 0;
			fread(&c, sizeof(char), 1, fp);
			for(k = 0; k < 8; ++k){
			if (j*8 + k >= size) break;
			l.weights[index + k] = (c & 1<<k) ? mean : -mean;
			}
			}
			}
			#ifdef GPU
			if(gpu_index >= 0){
			push_convolutional_layer(l);
			}
			#endif
			}

			void load_convolutional_weights(layer l, FILE *fp)
			{
			if(l.binary){
			//load_convolutional_weights_binary(l, fp);
			//return;
			}
			int num = l.nl.cl.size*l.size;
			fread(l.biases, sizeof(float), l.n, fp);
			if (l.batch_normalize && (!l.dontloadscales)){
			fread(l.scales, sizeof(float), l.n, fp);
			fread(l.rolling_mean, sizeof(float), l.n, fp);
			fread(l.rolling_variance, sizeof(float), l.n, fp);
			/*
			int i;
			for(i = 0; i < l.n; ++i){
			if(l.rolling_mean[i] > 1 \|\| l.rolling_mean[i] < -1 \|\| l.rolling_variance[i] > 1 \|\| l.rolling_variance[i] < -1)
			printf("%f %f\n", l.rolling_mean[i], l.rolling_variance[i]);
			}
			*/
			}
			fflush(stdout);
			fread(l.filters, sizeof(float), num, fp);
			fread(l.weights, sizeof(float), num, fp);
			//if(l.c == 3) scal_cpu(num, 1./256, l.weights, 1);
			if (l.flipped) {
			transpose_matrix(l.filters, l.cl.sizel.size, l.n);
			transpose_matrix(l.weights, l.cl.sizel.size, l.n);
			}
			//if (l.binary) binarize_weights(l.weights, l.n, l.cl.sizel.size, l.weights);
			#ifdef GPU
			if(gpu_index >= 0){
			push_convolutional_layer(l);
			@@ -874,6 +1119,9 @@

			void load_weights_upto(network net, char filename, int cutoff)
			{
			#ifdef GPU
			cuda_set_device(net->gpu_index);
			#endif
			fprintf(stderr, "Loading weights from %s...", filename);
			fflush(stdout);
			FILE *fp = fopen(filename, "rb");
			@@ -898,7 +1146,7 @@
			if(l.type == DECONVOLUTIONAL){
			int num = l.nl.cl.size*l.size;
			fread(l.biases, sizeof(float), l.n, fp);
			fread(l.filters, sizeof(float), num, fp);
			fread(l.weights, sizeof(float), num, fp);
			#ifdef GPU
			if(gpu_index >= 0){
			push_deconvolutional_layer(l);
			@@ -908,6 +1156,9 @@
			if(l.type == CONNECTED){
			load_connected_weights(l, fp, transpose);
			}
			if(l.type == BATCHNORM){
			load_batchnorm_weights(l, fp);
			}
			if(l.type == CRNN){
			load_convolutional_weights(*(l.input_layer), fp);
			load_convolutional_weights(*(l.self_layer), fp);
			@@ -918,11 +1169,19 @@
			load_connected_weights(*(l.self_layer), fp, transpose);
			load_connected_weights(*(l.output_layer), fp, transpose);
			}
			if(l.type == GRU){
			load_connected_weights(*(l.input_z_layer), fp, transpose);
			load_connected_weights(*(l.input_r_layer), fp, transpose);
			load_connected_weights(*(l.input_h_layer), fp, transpose);
			load_connected_weights(*(l.state_z_layer), fp, transpose);
			load_connected_weights(*(l.state_r_layer), fp, transpose);
			load_connected_weights(*(l.state_h_layer), fp, transpose);
			}
			if(l.type == LOCAL){
			int locations = l.out_w*l.out_h;
			int size = l.sizel.sizel.cl.nlocations;
			fread(l.biases, sizeof(float), l.outputs, fp);
			fread(l.filters, sizeof(float), size, fp);
			fread(l.weights, sizeof(float), size, fp);
			#ifdef GPU
			if(gpu_index >= 0){
			push_local_layer(l);