~speedprog/mtg/mtg_card_detector.git

			@@ -10,7 +10,7 @@
			#include <string.h>
			#include <stdlib.h>

			layer make_yolo_layer(int batch, int w, int h, int n, int total, int *mask, int classes)
			layer make_yolo_layer(int batch, int w, int h, int n, int total, int *mask, int classes, int max_boxes)
			{
			int i;
			layer l = {0};
			@@ -38,7 +38,8 @@
			l.bias_updates = calloc(n*2, sizeof(float));
			l.outputs = hwn*(classes + 4 + 1);
			l.inputs = l.outputs;
			l.truths = 90*(4 + 1);
			l.max_boxes = max_boxes;
			l.truths = l.max_boxes(4 + 1); // 90(4 + 1);
			l.delta = calloc(batch*l.outputs, sizeof(float));
			l.output = calloc(batch*l.outputs, sizeof(float));
			for(i = 0; i < total*2; ++i){
			@@ -108,18 +109,41 @@
			}


			void delta_yolo_class(float output, float delta, int index, int class, int classes, int stride, float *avg_cat)
			void delta_yolo_class(float output, float delta, int index, int class_id, int classes, int stride, float *avg_cat, int focal_loss)
			{
			int n;
			if (delta[index]){
			delta[index + strideclass] = 1 - output[index + strideclass];
			if(avg_cat) avg_cat += output[index + strideclass];
			delta[index + strideclass_id] = 1 - output[index + strideclass_id];
			if(avg_cat) avg_cat += output[index + strideclass_id];
			return;
			}
			for(n = 0; n < classes; ++n){
			delta[index + striden] = ((n == class)?1 : 0) - output[index + striden];
			if(n == class && avg_cat) avg_cat += output[index + striden];
			}
			// Focal loss
			if (focal_loss) {
			// Focal Loss
			float alpha = 0.5; // 0.25 or 0.5
			//float gamma = 2; // hardcoded in many places of the grad-formula

			int ti = index + stride*class_id;
			float pt = output[ti] + 0.000000000000001F;
			// http://fooplot.com/#W3sidHlwZSI6MCwiZXEiOiItKDEteCkqKDIqeCpsb2coeCkreC0xKSIsImNvbG9yIjoiIzAwMDAwMCJ9LHsidHlwZSI6MTAwMH1d
			float grad = -(1 - pt) * (2 * pt*logf(pt) + pt - 1); // http://blog.csdn.net/linmingan/article/details/77885832
			//float grad = (1 - pt) * (2 * pt*logf(pt) + pt - 1); // https://github.com/unsky/focal-loss

			for (n = 0; n < classes; ++n) {
			delta[index + striden] = (((n == class_id) ? 1 : 0) - output[index + striden]);

			delta[index + striden] = alpha*grad;

			if (n == class_id) avg_cat += output[index + striden];
			}
			}
			else {
			// default
			for (n = 0; n < classes; ++n) {
			delta[index + striden] = ((n == class_id) ? 1 : 0) - output[index + striden];
			if (n == class_id && avg_cat) avg_cat += output[index + striden];
			}
			}
			}

			static int entry_index(layer l, int batch, int location, int entry)
			@@ -195,7 +219,7 @@
			int class = state.truth[best_t(4 + 1) + bl.truths + 4];
			if (l.map) class = l.map[class];
			int class_index = entry_index(l, b, nl.wl.h + j*l.w + i, 4 + 1);
			delta_yolo_class(l.output, l.delta, class_index, class, l.classes, l.w*l.h, 0);
			delta_yolo_class(l.output, l.delta, class_index, class, l.classes, l.w*l.h, 0, l.focal_loss);
			box truth = float_to_box_stride(state.truth + best_t(4 + 1) + bl.truths, 1);
			delta_yolo_box(truth, l.output, l.biases, l.mask[n], box_index, i, j, l.w, l.h, state.net.w, state.net.h, l.delta, (2-truth.wtruth.h), l.wl.h);
			}
			@@ -235,7 +259,7 @@
			int class = state.truth[t(4 + 1) + bl.truths + 4];
			if (l.map) class = l.map[class];
			int class_index = entry_index(l, b, mask_nl.wl.h + j*l.w + i, 4 + 1);
			delta_yolo_class(l.output, l.delta, class_index, class, l.classes, l.w*l.h, &avg_cat);
			delta_yolo_class(l.output, l.delta, class_index, class, l.classes, l.w*l.h, &avg_cat, l.focal_loss);

			++count;
			++class_count;