Roland Singer
2018-08-22 dbdd31ee211fe8b1ac7e93ceadf7b34b8d304f34
src/gemm.h
@@ -4,6 +4,9 @@
#include <stdint.h>
#include <stddef.h>
void convolution_2d(int w, int h, int ksize, int n, int c, int pad, int stride,
    float *weights, float *input, float *output, float *mean);
static inline void set_bit(unsigned char *const dst, size_t index) {
    size_t dst_i = index / 8;
    int dst_shift = index % 8;
@@ -31,6 +34,10 @@
    int channels, int height, int width,
    int ksize, int stride, int pad, float* data_col);
void im2col_cpu_custom_transpose(float* data_im,
    int channels, int height, int width,
    int ksize, int stride, int pad, float* data_col, int ldb_align);
void activate_array_cpu_custom(float *x, const int n, const ACTIVATION a);
@@ -39,6 +46,11 @@
        float *B, int ldb,
        float *C, int ldc);
void forward_maxpool_layer_avx(float *src, float *dst, int *indexes, int size, int w, int h, int out_w, int out_h, int c,
    int pad, int stride, int batch);
void gemm(int TA, int TB, int M, int N, int K, float ALPHA,
                    float *A, int lda,
                    float *B, int ldb,