Joseph Redmon
2016-09-25 481b57a96a9ef29b112caec1bb3e17ffb043ceae
src/softmax_layer.c
@@ -19,14 +19,20 @@
    l.outputs = inputs;
    l.output = calloc(inputs*batch, sizeof(float));
    l.delta = calloc(inputs*batch, sizeof(float));
    l.forward = forward_softmax_layer;
    l.backward = backward_softmax_layer;
    #ifdef GPU
    l.forward_gpu = forward_softmax_layer_gpu;
    l.backward_gpu = backward_softmax_layer_gpu;
    l.output_gpu = cuda_make_array(l.output, inputs*batch); 
    l.delta_gpu = cuda_make_array(l.delta, inputs*batch); 
    #endif
    return l;
}
void softmax_array(float *input, int n, float *output)
void softmax_array(float *input, int n, float temp, float *output)
{
    int i;
    float sum = 0;
@@ -35,12 +41,12 @@
        if(input[i] > largest) largest = input[i];
    }
    for(i = 0; i < n; ++i){
        sum += exp(input[i]-largest);
        sum += exp(input[i]/temp-largest/temp);
    }
    if(sum) sum = largest+log(sum);
    if(sum) sum = largest/temp+log(sum);
    else sum = largest-100;
    for(i = 0; i < n; ++i){
        output[i] = exp(input[i]-sum);
        output[i] = exp(input[i]/temp-sum);
    }
}
@@ -50,7 +56,7 @@
    int inputs = l.inputs / l.groups;
    int batch = l.batch * l.groups;
    for(b = 0; b < batch; ++b){
        softmax_array(state.input+b*inputs, inputs, l.output+b*inputs);
        softmax_array(state.input+b*inputs, inputs, l.temperature, l.output+b*inputs);
    }
}