Boost.Python和Boost.Numpy的使用

习惯上python之后，我很自然的就想到怎么和C++代码结合的问题了，毕竟核心计算模块不敢用python做，之前用过swig，但是感觉不够灵活，方便。后来找到了boost库，开始上手会遇到一些乱七八糟的问题，但是做完了回头看看，还是蛮方便的，起码相对于swig来说。

需求其实是要在树莓派上做个KWS模型，提特征和网络前向的代码不想再重新写了（虽然之前已经实现过了），所以突发奇想，基于kaldi给python写一个wrapper调用就行了。

Boost库的安装

分为俩类，一类不需要编译成库文件，包含头文件即可使用，另外一类是需要编译安装库文件的，使用的时候加上链接，Boost.Python就属于后一类，安装完成Boost.python之后，默认会编译numpy库，所以可以直接使用boost.numpy

Boost Python和Numpy的使用

boost python一般用来封装C++的API给python调用，一般编译成特定的lib，使用python的时候，直接import就行了
boost numpy一般给C++提供直接处理传，返回入numpy矩阵的功能

Boost Python/Numpy初步使用

Boost Python
正常定义C++类和成员函数，使用BOOST_PYTHON_MODULE定义模块名和对应的函数导出名就行了，详见boost.python
Boost Numpy
这个主要是一系列API掌握就行了，详见boost.python(Numpy)

使用boost封装kaldi nnet1的网络前向

一个简单的使用例子，基本操作都在里面

#include <boost/python.hpp>
#include <boost/python/numpy.hpp>
#include "nnet/nnet-nnet.h"
#include "nnet/nnet-loss.h"


using namespace kaldi;
using namespace kaldi::nnet1;

// 命名空间
namespace py = boost::python;
namespace np = boost::python::numpy;

class NnetWrapper {

public:
    NnetWrapper(std::string nnet_mdl = "final.nnet");
    // 传入，返回numpy类型
    np::ndarray Predict(np::ndarray &vector);
private:
    Nnet nnet_;
    // keep memory not free
    CuMatrix<BaseFloat> nnet_out;
};

NnetWrapper::NnetWrapper(std::string nnet_mdl) {
    nnet_.Read(nnet_mdl);
}

np::ndarray NnetWrapper::Predict(np::ndarray &vector) {

    int cols, rows;
    // 获取内建dtype
    KALDI_ASSERT(vector.get_dtype() == np::dtype::get_builtin<float>());
    // 获取维度
    KALDI_ASSERT(vector.get_nd() <= 2);

    cols = vector.shape(vector.get_nd() - 1);
    KALDI_ASSERT(cols == nnet_.InputDim());

    rows = vector.get_nd() == 1 ? 1: vector.shape(0);
    // 获取数据指针
    CuSubMatrix<BaseFloat> nnet_in(reinterpret_cast<BaseFloat*>(vector.get_data()),
                                   rows, cols, vector.strides(0) / sizeof(BaseFloat));

    nnet_.Feedforward(nnet_in, &nnet_out);
    // 有已知数据，建立ndarray类型变量，传参如下：
    // data_addr, dtype, shape, stride, obj
    return np::from_data(nnet_out.Data(), np::dtype::get_builtin<float>(),
                         py::make_tuple(rows, nnet_out.NumCols()),
                         py::make_tuple(nnet_out.Stride() * sizeof(BaseFloat), sizeof(BaseFloat)),
                         py::object());
}


BOOST_PYTHON_MODULE(pynnet1) {
    using namespace boost::python;
    // 初始化numpy模块
    np::initialize();
    // 导出构造函数为init, 可选参数输入，和预测函数Predict为predict
    class_<NnetWrapper>("nnet1", init<optional<std::string> >())
            .def("predict", &NnetWrapper::Predict);
}

Cmake编译，基于python2.7

给python调用肯定编译成库，注意

如果不用numpy，只需要额外链接python2.7和boost_python俩个库
使用numpy的话，链接boost_numpy
boost库默认安装在/usr/local/lib之下，头文件在/usr/local/include/boost里面，编译时需要指定这些目录
Cmake完整如下

cmake_minimum_required(VERSION 3.5)
project(PyNnet1)

set(CMAKE_CXX_STANDARD 11)
set(TARGET pynnet1)
set(KALDI_DIR ../../../Document/git/kaldi)
set(BOOST_LIB /usr/local/lib)
set(PYTHON_INC /usr/include/python2.7)
# -I
include_directories(${PYTHON_INC} ${KALDI_DIR}/tools/openfst/include ${KALDI_DIR}/tools/CLAPACK ${KALDI_DIR}/src)
# -L
link_directories(${KALDI_DIR}/src/lib ${BOOST_LIB})

add_definitions(-O3 -g -std=c++11 -DHAVE_CLAPACK)
set(SOURCE_FILES nnet-wrapper.cpp)

add_library(${TARGET} SHARED ${SOURCE_FILES})
# 默认生成格式为libXXX.so，现在不需要前缀
set_target_properties(${TARGET} PROPERTIES PREFIX "")
target_link_libraries(${TARGET} python2.7 boost_numpy boost_python pthread kaldi-base kaldi-cudamatrix kaldi-nnet)