Joseph Redmon
2014-10-25 14303717dcddae43cdc55beb0685dae86f566fd8
src/cnn.c
@@ -278,29 +278,24 @@
   free_data(train);
}
void train_full()
void train_assira()
{
   network net = parse_network_cfg("cfg/imagenet.cfg");
   network net = parse_network_cfg("cfg/assira.cfg");
    int imgs = 1000/net.batch+1;
    //imgs = 1;
   srand(2222222);
   int i = 0;
   char *labels[] = {"cat","dog"};
   float lr = .00001;
   float momentum = .9;
   float decay = 0.01;
    clock_t time;
   while(1){
      i += 1000;
      data train = load_data_image_pathfile_random("images/assira/train.list", 1000, labels, 2, 256, 256);
      //image im = float_to_image(256, 256, 3,train.X.vals[0]);
      //visualize_network(net);
      //cvWaitKey(100);
      //show_image(im, "input");
      //cvWaitKey(100);
      //scale_data_rows(train, 1./255.);
        time=clock();
      data train = load_data_image_pathfile_random("data/assira/train.list", imgs*net.batch, labels, 2, 256, 256);
      normalize_data_rows(train);
      clock_t start = clock(), end;
      float loss = train_network_sgd(net, train, 1000);
      end = clock();
      printf("%d: %f, Time: %lf seconds, LR: %f, Momentum: %f, Decay: %f\n", i, loss, (float)(end-start)/CLOCKS_PER_SEC, lr, momentum, decay);
        printf("Loaded: %lf seconds\n", sec(clock()-time));
        time=clock();
      float loss = train_network_sgd(net, train, imgs);
      printf("%d: %f, Time: %lf seconds\n", i, loss, sec(clock()-time));
      free_data(train);
      if(i%10000==0){
         char buff[256];
@@ -311,9 +306,69 @@
   }
}
void train_imagenet()
{
   network net = parse_network_cfg("cfg/imagenet_backup_710.cfg");
    printf("Learning Rate: %g, Momentum: %g, Decay: %g\n", net.learning_rate, net.momentum, net.decay);
    int imgs = 1000/net.batch+1;
    //imgs=1;
   srand(888888);
   int i = 0;
    char **labels = get_labels("/home/pjreddie/data/imagenet/cls.labels.list");
    list *plist = get_paths("/home/pjreddie/data/imagenet/cls.cropped.list");
    char **paths = (char **)list_to_array(plist);
    clock_t time;
   while(1){
      i += 1;
        time=clock();
      data train = load_data_random(imgs*net.batch, paths, plist->size, labels, 1000, 256, 256);
      normalize_data_rows(train);
        printf("Loaded: %lf seconds\n", sec(clock()-time));
        time=clock();
        #ifdef GPU
      float loss = train_network_sgd_gpu(net, train, imgs);
      printf("%d: %f, %lf seconds, %d images\n", i, loss, sec(clock()-time), i*imgs*net.batch);
        #endif
      free_data(train);
      if(i%10==0){
         char buff[256];
         sprintf(buff, "/home/pjreddie/imagenet_backup/imagenet_backup_%d.cfg", i);
         save_network(net, buff);
      }
   }
}
void test_imagenet()
{
   network net = parse_network_cfg("cfg/imagenet_test.cfg");
    //imgs=1;
   srand(2222222);
   int i = 0;
    char **names = get_labels("cfg/shortnames.txt");
    clock_t time;
    char filename[256];
    int indexes[10];
   while(1){
        gets(filename);
        image im = load_image_color(filename, 256, 256);
        normalize_image(im);
        printf("%d %d %d\n", im.h, im.w, im.c);
        float *X = im.data;
        time=clock();
        float *predictions = network_predict(net, X);
        top_predictions(net, 10, indexes);
      printf("%s: Predicted in %f seconds.\n", filename, sec(clock()-time));
        for(i = 0; i < 10; ++i){
            int index = indexes[i];
            printf("%s: %f\n", names[index], predictions[index]);
        }
      free_image(im);
   }
}
void test_visualize()
{
   network net = parse_network_cfg("cfg/voc_imagenet.cfg");
   network net = parse_network_cfg("cfg/assira_backup_740000.cfg");
   srand(2222222);
   visualize_network(net);
   cvWaitKey(0);
@@ -329,7 +384,7 @@
   for(i = 0; i < total; ++i){
      visualize_network(net);
      cvWaitKey(100);
      data test = load_data_image_pathfile_part("images/assira/test.list", i, total, labels, 2, 256, 256);
      data test = load_data_image_pathfile_part("data/assira/test.list", i, total, labels, 2, 256, 256);
      image im = float_to_image(256, 256, 3,test.X.vals[0]);
      show_image(im, "input");
      cvWaitKey(100);
@@ -369,8 +424,8 @@
        clock_t start = clock(), end;
        float loss = train_network_sgd(net, train, iters);
        end = clock();
        visualize_network(net);
        cvWaitKey(5000);
        //visualize_network(net);
        //cvWaitKey(5000);
        //float test_acc = network_accuracy(net, test);
        //printf("%d: Loss: %f, Test Acc: %f, Time: %lf seconds, LR: %f, Momentum: %f, Decay: %f\n", count, loss, test_acc,(float)(end-start)/CLOCKS_PER_SEC, net.learning_rate, net.momentum, net.decay);
@@ -378,7 +433,7 @@
            float test_acc = network_accuracy(net, test);
            printf("%d: Loss: %f, Test Acc: %f, Time: %lf seconds, LR: %f, Momentum: %f, Decay: %f\n", count, loss, test_acc,(float)(end-start)/CLOCKS_PER_SEC, net.learning_rate, net.momentum, net.decay);
            char buff[256];
            sprintf(buff, "/home/pjreddie/cifar/cifar2_%d.cfg", count);
            sprintf(buff, "/home/pjreddie/cifar/cifar10_2_%d.cfg", count);
            save_network(net, buff);
        }else{
            printf("%d: Loss: %f, Time: %lf seconds, LR: %f, Momentum: %f, Decay: %f\n", count, loss, (float)(end-start)/CLOCKS_PER_SEC, net.learning_rate, net.momentum, net.decay);
@@ -902,9 +957,14 @@
int main(int argc, char *argv[])
{
    //train_full();
    test_gpu_blas();
    //test_blas();
    //train_assira();
   //test_visualize();
    //test_distribution();
    //feenableexcept(FE_DIVBYZERO | FE_INVALID | FE_OVERFLOW);
    //train_imagenet();
    //test_imagenet();
    //test_blas();
    //test_visualize();
@@ -916,7 +976,7 @@
    //test_ensemble();
    //test_nist_single();
    //test_nist();
    train_nist();
    //train_nist();
    //test_convolutional_layer();
    //test_col2im();
    //test_cifar10();