en/latest/online__EM__funcs_8hpp_source.html

 #pragma once

 #include "alloc_model/alloc_model_params.hpp"
 #include "defs.hpp"
 #include "online_EM_defs.hpp"
 #include "util/sampling.hpp"
 #include <cmath>
 #include <gsl/gsl_sf_gamma.h>
 #include <utility>
 #include <vector>

 namespace bnmf_algs {
 namespace details {
 namespace online_EM {

 template <typename T> size_t init_nan_values(matrix_t<T>& X) {
     const auto x = static_cast<size_t>(X.rows());
     const auto y = static_cast<size_t>(X.cols());

     T nonnan_sum = T();
     size_t nonnan_count = 0;

     #pragma omp parallel for reduction(+:nonnan_sum,nonnan_count)
     for (size_t i = 0; i < x; ++i) {
         for (size_t j = 0; j < y; ++j) {
             if (not std::isnan(X(i, j))) {
                 nonnan_sum += X(i, j);
                 ++nonnan_count;
             }
         }
     }

     if (nonnan_count != 0) {
         const T nonnan_mean = nonnan_sum / nonnan_count;

         #pragma omp parallel for schedule(static)
         for (size_t i = 0; i < x; ++i) {
             for (size_t j = 0; j < y; ++j) {
                 if (std::isnan(X(i, j))) {
                     X(i, j) = nonnan_mean;
                 }
             }
         }
     }

     return nonnan_count;
 }

 template <typename Scalar>
 std::pair<matrix_t<Scalar>, matrix_t<Scalar>>
 init_alpha_beta(const std::vector<alloc_model::Params<Scalar>>& param_vec,
                 size_t y) {
     const auto x = static_cast<size_t>(param_vec[0].alpha.size());
     const auto z = static_cast<size_t>(param_vec.size());

     matrix_t<Scalar> alpha(x, z);
     matrix_t<Scalar> beta(z, y);

     #pragma omp parallel for schedule(static)
     for (size_t k = 0; k < z; ++k) {
         for (size_t i = 0; i < x; ++i) {
             alpha(i, k) = param_vec[k].alpha[i];
         }

         for (size_t j = 0; j < y; ++j) {
             beta(k, j) = param_vec[k].beta[j];
         }
     }

     return std::make_pair(alpha, beta);
 }

 template <typename T>
 std::tuple<matrix_t<T>, matrix_t<T>, vector_t<T>>
 init_S_xx(const matrix_t<T>& X_full, size_t z, const std::vector<size_t>& ii,
           const std::vector<size_t>& jj) {
     const auto x = static_cast<size_t>(X_full.rows());
     const auto y = static_cast<size_t>(X_full.cols());

     // results
     matrix_t<T> S_pjk = matrix_t<T>::Zero(y, z);
     matrix_t<T> S_ipk = matrix_t<T>::Zero(x, z);
     vector_t<T> S_ppk = vector_t<T>::Zero(z);

     util::gsl_rng_wrapper rnd_gen(gsl_rng_alloc(gsl_rng_taus), gsl_rng_free);

     vector_t<double> dirichlet_params = vector_t<double>::Constant(z, 1);

     #pragma omp parallel
     {
         // thread local variables
         vector_t<T> fiber(z);
         vector_t<double> fiber_double(z);
         matrix_t<T> S_pjk_local = matrix_t<T>::Zero(y, z);
         matrix_t<T> S_ipk_local = matrix_t<T>::Zero(x, z);
         vector_t<T> S_ppk_local = vector_t<T>::Zero(z);

         // do in parallel
         #pragma omp for
         for (size_t t = 0; t < ii.size(); ++t) {
             size_t i = ii[t], j = jj[t];

             gsl_ran_dirichlet(rnd_gen.get(), z, dirichlet_params.data(),
                               fiber_double.data());
             fiber = fiber_double.template cast<T>();
             fiber = fiber.array() * X_full(i, j);

             S_pjk_local.row(j) += fiber;
             S_ipk_local.row(i) += fiber;
             S_ppk_local += fiber;
         }

         // reduce local variables into accumulators one thread at a time
         #pragma omp critical
         {
             S_pjk += S_pjk_local;
             S_ipk += S_ipk_local;
             S_ppk += S_ppk_local;
         }
     }

     return std::make_tuple(S_pjk, S_ipk, S_ppk);
 }

 template <typename T, typename Scalar, typename PsiFunction>
 void update_logW(const matrix_t<Scalar>& alpha, const matrix_t<T>& S_ipk,
                  const vector_t<Scalar>& alpha_pk, const vector_t<T>& S_ppk,
                  const PsiFunction& psi_fn, matrix_t<double>& logW) {
     const auto x = static_cast<size_t>(alpha.rows());
     const auto z = static_cast<size_t>(alpha.cols());

     vector_t<T> psi_of_sums(z);
     #pragma omp parallel for schedule(static)
     for (size_t k = 0; k < z; ++k) {
         psi_of_sums(k) = psi_fn(alpha_pk(k) + S_ppk(k));
     }

     #pragma omp parallel for schedule(static)
     for (size_t i = 0; i < x; ++i) {
         for (size_t k = 0; k < z; ++k) {
             logW(i, k) = psi_fn(alpha(i, k) + S_ipk(i, k)) - psi_of_sums(k);
         }
     }
 }

 template <typename T, typename Scalar, typename PsiFunction>
 void update_logH(const matrix_t<Scalar>& beta, const matrix_t<T>& S_pjk,
                  const Scalar b, const PsiFunction& psi_fn,
                  matrix_t<double>& logH) {
     const auto z = static_cast<size_t>(beta.rows());
     const auto y = static_cast<size_t>(beta.cols());

     const Scalar logb = std::log(b + 1);

     #pragma omp parallel for schedule(static)
     for (size_t k = 0; k < z; ++k) {
         for (size_t j = 0; j < y; ++j) {
             logH(k, j) = psi_fn(beta(k, j) + S_pjk(j, k)) - logb;
         }
     }
 }

 template <typename T>
 std::tuple<std::vector<size_t>, std::vector<size_t>, std::vector<T>>
 find_nonzero(const matrix_t<T>& X) {
     std::vector<size_t> ii, jj;
     std::vector<T> xx;

     for (long i = 0; i < X.rows(); ++i) {
         for (long j = 0; j < X.cols(); ++j) {
             T x_ij = X(i, j);
             if (std::isnan(x_ij) || x_ij > std::numeric_limits<T>::epsilon()) {
                 ii.push_back(static_cast<size_t>(i));
                 jj.push_back(static_cast<size_t>(j));
                 xx.push_back(x_ij);
             }
         }
     }

     return std::make_tuple(ii, jj, xx);
 }

 template <typename T>
 double update_allocation(const std::vector<size_t>& ii,
                          const std::vector<size_t>& jj,
                          const std::vector<T>& xx, bld::EMResult<T>& res,
                          vector_t<T>& S_ppk) {

     const auto x = static_cast<size_t>(res.X_full.rows());
     const auto y = static_cast<size_t>(res.X_full.cols());
     const auto z = static_cast<size_t>(S_ppk.cols());

     double delta_log_PS = 0;

     #pragma omp parallel
     {
         matrix_t<T> S_pjk = matrix_t<T>::Zero(y, z);
         matrix_t<T> S_ipk = matrix_t<T>::Zero(x, z);
         vector_t<T> S_ppk_local = vector_t<T>::Zero(z);

         vector_t<T> gammaln_max_fiber(z);
         vector_t<T> log_p(z);
         vector_t<T> max_fiber(z);

         double delta_log_PS_local = 0;

         #pragma omp for
         for (size_t t = 0; t < xx.size(); ++t) {
             const size_t i = ii[t];
             const size_t j = jj[t];
             const T orig_x_ij = xx[t];

             log_p = res.logW.row(i) + res.logH.col(j).transpose();
             const vector_t<T> log_p_exp = log_p.array().exp();

             // maximization step
             if (std::isnan(orig_x_ij)) {
                 max_fiber = log_p_exp.array().floor();
                 res.X_full(i, j) = max_fiber.sum();
             } else {
                 util::multinomial_mode(orig_x_ij, log_p_exp, max_fiber);
             }

             S_pjk.row(j) += max_fiber;
             S_ipk.row(i) += max_fiber;
             S_ppk_local += max_fiber;

             for (size_t k = 0; k < z; ++k) {
                 gammaln_max_fiber(k) = gsl_sf_lngamma(max_fiber(k) + 1);
             }
             delta_log_PS_local -= gammaln_max_fiber.sum();
         }

         #pragma omp critical
         {
             res.S_pjk += S_pjk;
             res.S_ipk += S_ipk;
             S_ppk += S_ppk_local;
             delta_log_PS += delta_log_PS_local;
         }
     }

     return delta_log_PS;
 }

 template <typename T, typename Scalar>
 double delta_log_PS(const matrix_t<Scalar>& alpha, const matrix_t<Scalar>& beta,
                     const matrix_t<T>& S_ipk, const matrix_t<T>& S_pjk,
                     const vector_t<Scalar>& alpha_pk, const vector_t<T>& S_ppk,
                     Scalar b) {
     double delta = -(std::log(b + 1) * S_ppk.sum());

     #pragma omp parallel for schedule(static) reduction(+:delta)
     for (long k = 0; k < alpha.cols(); ++k) {
         for (long i = 0; i < alpha.rows(); ++i) {
             delta += gsl_sf_lngamma(alpha(i, k) + S_ipk(i, k));
         }

         for (long j = 0; j < beta.cols(); ++j) {
             delta += gsl_sf_lngamma(beta(k, j) + S_pjk(j, k));
         }

         delta -= gsl_sf_lngamma(alpha_pk(k) + S_ppk(k));
     }

     return delta;
 }

 } // namespace EM
 } // namespace details
 } // namespace bnmf_algs
bnmf_algs::alloc_model::Params
Structure to hold the parameters for the Allocation Model .
Definition: alloc_model_params.hpp:25

bnmf_algs::details::online_EM::update_logH
void update_logH(const matrix_t< Scalar > &beta, const matrix_t< T > &S_pjk, const Scalar b, const PsiFunction &psi_fn, matrix_t< double > &logH)
Perform an update on logW matrix.
Definition: online_EM_funcs.hpp:221

bnmf_algs::bld::online_EM
EMResult< T > online_EM(const matrix_t< T > &X, const std::vector< alloc_model::Params< Scalar >> &param_vec, const size_t max_iter=1000, const bool use_psi_appr=false)
Complete a matrix containing unobserved values given as NaN using an EM procedure according to the al...
Definition: online_EM.hpp:50

bnmf_algs::details::online_EM::delta_log_PS
double delta_log_PS(const matrix_t< Scalar > &alpha, const matrix_t< Scalar > &beta, const matrix_t< T > &S_ipk, const matrix_t< T > &S_pjk, const vector_t< Scalar > &alpha_pk, const vector_t< T > &S_ppk, Scalar b)
Compute the difference in log_PS value computed using the given model variables.
Definition: online_EM_funcs.hpp:364

std::log
T log(T...args)

bnmf_algs::matrix_t
Eigen::Matrix< Scalar, Eigen::Dynamic, Eigen::Dynamic, Eigen::RowMajor > matrix_t
Matrix type used in the computations.
Definition: defs.hpp:41

std::make_tuple
T make_tuple(T...args)

bnmf_algs::bld::EMResult
Structure holding the results of EM procedures.
Definition: online_EM_defs.hpp:13

bnmf_algs::bld::EMResult::logH
matrix_t< double > logH
Matrix whose  entry contains .
Definition: online_EM_defs.hpp:41

bnmf_algs::details::online_EM::find_nonzero
std::tuple< std::vector< size_t >, std::vector< size_t >, std::vector< T > > find_nonzero(const matrix_t< T > &X)
Find nonzero entries and their indices in the given matrix and return indices and values as vectors...
Definition: online_EM_funcs.hpp:251

bnmf_algs::bld::EMResult::X_full
matrix_t< T > X_full
Completed version of the incomplete matrix given as input to an EM algorithm.
Definition: online_EM_defs.hpp:33

bnmf_algs::bld::EMResult::S_ipk
matrix_t< T > S_ipk
Sum of the hidden tensor  along its second dimension, i.e. .
Definition: online_EM_defs.hpp:24

std::vector::push_back
T push_back(T...args)

alloc_model_params.hpp

sampling.hpp

std::make_pair
T make_pair(T...args)

bnmf_algs::util::multinomial_mode
void multinomial_mode(Integer num_trials, const vector_t< Real > &prob, vector_t< Integer > &count, double eps=1e-50)
Find the mode of a multinomial distribution using Finucan&#39;s algorithm.
Definition: sampling.hpp:88

bnmf_algs::bld::EMResult::logW
matrix_t< double > logW
Matrix whose  entry contains .
Definition: online_EM_defs.hpp:37

defs.hpp

bnmf_algs::bld::EMResult::S_pjk
matrix_t< T > S_pjk
Sum of the hidden tensor  along its first dimension, i.e. .
Definition: online_EM_defs.hpp:19

std::tuple

std::pair

std::unique_ptr::get
T get(T...args)

bnmf_algs::details::online_EM::init_nan_values
size_t init_nan_values(matrix_t< T > &X)
Initialize all NaN values in the given matrix with the mean of the remaining values that are differen...
Definition: online_EM_funcs.hpp:28

std::vector::size
T size(T...args)

std::vector

std::unique_ptr< gsl_rng, decltype(&gsl_rng_free)>

std::isnan
T isnan(T...args)

bnmf_algs::details::online_EM::init_S_xx
std::tuple< matrix_t< T >, matrix_t< T >, vector_t< T > > init_S_xx(const matrix_t< T > &X_full, size_t z, const std::vector< size_t > &ii, const std::vector< size_t > &jj)
Initialize S_pjk, S_ipk matrices and S_ppk vector from a Dirichlet distribution with all parameters e...
Definition: online_EM_funcs.hpp:120

bnmf_algs::details::online_EM::init_alpha_beta
std::pair< matrix_t< Scalar >, matrix_t< Scalar > > init_alpha_beta(const std::vector< alloc_model::Params< Scalar >> &param_vec, size_t y)
Initialize each entry of alpha and beta matrices with the given model parameters. ...
Definition: online_EM_funcs.hpp:77

bnmf_algs::vector_t
Eigen::Matrix< Scalar, 1, Eigen::Dynamic, Eigen::RowMajor > vector_t
Vector type used in the computations.
Definition: defs.hpp:27

online_EM_defs.hpp

bnmf_algs
Main namespace for bnmf-algs library.
Definition: alloc_model_funcs.hpp:12

bnmf_algs::details::online_EM::update_allocation
double update_allocation(const std::vector< size_t > &ii, const std::vector< size_t > &jj, const std::vector< T > &xx, bld::EMResult< T > &res, vector_t< T > &S_ppk)
Update the current allocation by performing a maximization step for each nonzero entry of the origina...
Definition: online_EM_funcs.hpp:285

bnmf_algs::details::online_EM::update_logW
void update_logW(const matrix_t< Scalar > &alpha, const matrix_t< T > &S_ipk, const vector_t< Scalar > &alpha_pk, const vector_t< T > &S_ppk, const PsiFunction &psi_fn, matrix_t< double > &logW)
Perform an update on logW matrix.
Definition: online_EM_funcs.hpp:186

std::numeric_limits