Joseph Redmon
2014-12-03 ff67f0347653c35c67ddbafad8dc76bbd868047e
src/convolutional_layer.c
@@ -304,7 +304,7 @@
    const size_t global_size[] = {layer.n};
    clEnqueueNDRangeKernel(queue, kernel, 1, 0, global_size, 0, 0, 0, 0);
    cl.error = clEnqueueNDRangeKernel(queue, kernel, 1, 0, global_size, 0, 0, 0, 0);
    check_error(cl);
}
@@ -336,9 +336,9 @@
    cl.error = clSetKernelArg(kernel, i++, sizeof(layer.output_cl), (void*) &layer.output_cl);
    check_error(cl);
    const size_t global_size[] = {layer.batch, layer.n*size};
    const size_t global_size[] = {layer.n*size, layer.batch};
    clEnqueueNDRangeKernel(queue, kernel, 2, 0, global_size, 0, 0, 0, 0);
    cl.error = clEnqueueNDRangeKernel(queue, kernel, 2, 0, global_size, 0, 0, 0, 0);
    check_error(cl);
}
@@ -400,7 +400,6 @@
        gemm_ongpu_offset(0,1,m,n,k,1,a,i*m*k,k,b,i*k*n,k,1,c,0,n);
    }
    //cl_read_array(layer.delta_cl, layer.delta, m*k*layer.batch);
    if(delta_cl){
        m = layer.size*layer.size*layer.c;