Joseph Redmon
2013-12-10 ad9dbfe16495204453b1b7f8593d320751f76ca0
CSE546 submission
4 files modified
49 ■■■■ changed files
nist.cfg 15 ●●●● patch | view | raw | blame | history
src/convolutional_layer.c 2 ●●● patch | view | raw | blame | history
src/network.c 2 ●●● patch | view | raw | blame | history
src/tests.c 30 ●●●●● patch | view | raw | blame | history
nist.cfg
@@ -2,7 +2,7 @@
width=28
height=28
channels=1
filters=6
filters=5
size=5
stride=1
activation=ramp
@@ -11,7 +11,7 @@
stride=2
[conv]
filters=16
filters=50
size=5
stride=1
activation=ramp
@@ -19,17 +19,8 @@
[maxpool]
stride=2
[conv]
filters=120
size=3
stride=1
activation=ramp
[maxpool]
stride=2
[conn]
output = 80
output = 100
activation=ramp
[conn]
src/convolutional_layer.c
@@ -39,7 +39,7 @@
    layer->w = w;
    layer->c = c;
    layer->n = n;
    layer->edge = 1;
    layer->edge = 0;
    layer->stride = stride;
    layer->kernels = calloc(n, sizeof(image));
    layer->kernel_updates = calloc(n, sizeof(image));
src/network.c
@@ -63,7 +63,7 @@
        }
        else if(net.types[i] == CONNECTED){
            connected_layer layer = *(connected_layer *)net.layers[i];
            update_connected_layer(layer, step, momentum, decay);
            update_connected_layer(layer, step, momentum, 0);
        }
    }
}
src/tests.c
@@ -195,26 +195,31 @@
void test_nist()
{
    srand(444444);
    srand(888888);
    network net = parse_network_cfg("nist.cfg");
    data train = load_categorical_data_csv("mnist/mnist_train.csv", 0, 10);
    data test = load_categorical_data_csv("mnist/mnist_test.csv",0,10);
    normalize_data_rows(train);
    normalize_data_rows(test);
    randomize_data(train);
    //randomize_data(train);
    int count = 0;
    double lr = .0005;
    while(++count <= 1){
        double acc = train_network_sgd(net, train, 10000, lr, .9, .001);
        printf("Training Accuracy: %lf\n", acc);
        lr /= 2;
    }
    double momentum = .9;
    double decay = 0.01;
    while(++count <= 1000){
        double acc = train_network_sgd(net, train, 1000, lr, momentum, decay);
        printf("Training Accuracy: %lf, Params: %f %f %f\n", acc, lr, momentum, decay);
        visualize_network(net);
        cvWaitKey(100);
        //lr /= 2;
        if(count%5 == 0 && 0){
    double train_acc = network_accuracy(net, train);
    fprintf(stderr, "\nTRAIN: %f\n", train_acc);
    double test_acc = network_accuracy(net, test);
    fprintf(stderr, "TEST: %f\n\n", test_acc);
    printf("%d, %f, %f\n", count, train_acc, test_acc);
    //end = clock();
    //printf("Neural Net Learning: %lf seconds\n", (double)(end-start)/CLOCKS_PER_SEC);
        }
    }
}
void test_ensemble()
@@ -223,7 +228,6 @@
    srand(888888);
    data d = load_categorical_data_csv("mnist/mnist_train.csv", 0, 10);
    normalize_data_rows(d);
    randomize_data(d);
    data test = load_categorical_data_csv("mnist/mnist_test.csv", 0,10);
    normalize_data_rows(test);
    data train = d;
@@ -237,10 +241,12 @@
    for(i = 0; i < n; ++i){
        int count = 0;
        double lr = .0005;
        double momentum = .9;
        double decay = .01;
        network net = parse_network_cfg("nist.cfg");
        while(++count <= 5){
            double acc = train_network_sgd(net, train, train.X.rows, lr, .9, .001);
            printf("Training Accuracy: %lf\n", acc);
        while(++count <= 15){
            double acc = train_network_sgd(net, train, train.X.rows, lr, momentum, decay);
            printf("Training Accuracy: %lf Learning Rate: %f Momentum: %f Decay: %f\n", acc, lr, momentum, decay );
            lr /= 2; 
        }
        matrix partial = network_predict_data(net, test);