AlexeyAB
2018-04-02 726cebd3fb67d65ec6d2d49fa6bfba4c053085df
src/yolo_layer.c
@@ -10,7 +10,7 @@
#include <string.h>
#include <stdlib.h>
layer make_yolo_layer(int batch, int w, int h, int n, int total, int *mask, int classes)
layer make_yolo_layer(int batch, int w, int h, int n, int total, int *mask, int classes, int max_boxes)
{
    int i;
    layer l = {0};
@@ -38,7 +38,8 @@
    l.bias_updates = calloc(n*2, sizeof(float));
    l.outputs = h*w*n*(classes + 4 + 1);
    l.inputs = l.outputs;
    l.truths = 90*(4 + 1);
   l.max_boxes = max_boxes;
    l.truths = l.max_boxes*(4 + 1); // 90*(4 + 1);
    l.delta = calloc(batch*l.outputs, sizeof(float));
    l.output = calloc(batch*l.outputs, sizeof(float));
    for(i = 0; i < total*2; ++i){
@@ -378,9 +379,26 @@
        return;
    }
    cuda_pull_array(l.output_gpu, state.input, l.batch*l.inputs);
    forward_yolo_layer(l, state);
    //cuda_pull_array(l.output_gpu, state.input, l.batch*l.inputs);
   float *in_cpu = calloc(l.batch*l.inputs, sizeof(float));
   cuda_pull_array(l.output_gpu, in_cpu, l.batch*l.inputs);
   float *truth_cpu = 0;
   if (state.truth) {
      int num_truth = l.batch*l.truths;
      truth_cpu = calloc(num_truth, sizeof(float));
      cuda_pull_array(state.truth, truth_cpu, num_truth);
   }
   network_state cpu_state = state;
   cpu_state.net = state.net;
   cpu_state.index = state.index;
   cpu_state.train = state.train;
   cpu_state.truth = truth_cpu;
   cpu_state.input = in_cpu;
   forward_yolo_layer(l, cpu_state);
    //forward_yolo_layer(l, state);
    cuda_push_array(l.delta_gpu, l.delta, l.batch*l.outputs);
   free(in_cpu);
   if (cpu_state.truth) free(cpu_state.truth);
}
void backward_yolo_layer_gpu(const layer l, network_state state)