Aakash-kaushik/mlpack/hmm__impl_8hpp_source.html

 #ifndef MLPACK_METHODS_HMM_HMM_IMPL_HPP
 #define MLPACK_METHODS_HMM_HMM_IMPL_HPP

 // Just in case...
 #include "hmm.hpp"
 #include <mlpack/core/math/log_add.hpp>

 namespace mlpack {
 namespace hmm {

 template<typename Distribution>
 HMM<Distribution>::HMM(const size_t states,
                        const Distribution emissions,
                        const double tolerance) :
     emission(states, /* default distribution */ emissions),
     transitionProxy(arma::randu<arma::mat>(states, states)),
     initialProxy(arma::randu<arma::vec>(states) / (double) states),
     dimensionality(emissions.Dimensionality()),
     tolerance(tolerance),
     recalculateInitial(false),
     recalculateTransition(false)
 {
   // Normalize the transition probabilities and initial state probabilities.
   initialProxy /= arma::accu(initialProxy);
   for (size_t i = 0; i < transitionProxy.n_cols; ++i)
     transitionProxy.col(i) /= arma::accu(transitionProxy.col(i));

   logTransition = log(transitionProxy);
   logInitial = log(initialProxy);
 }

 template<typename Distribution>
 HMM<Distribution>::HMM(const arma::vec& initial,
                        const arma::mat& transition,
                        const std::vector<Distribution>& emission,
                        const double tolerance) :
     emission(emission),
     transitionProxy(transition),
     logTransition(log(transition)),
     initialProxy(initial),
     logInitial(log(initial)),
     tolerance(tolerance),
     recalculateInitial(false),
     recalculateTransition(false)
 {
   // Set the dimensionality, if we can.
   if (emission.size() > 0)
     dimensionality = emission[0].Dimensionality();
   else
   {
     Log::Warn << "HMM::HMM(): no emission distributions given; assuming a "
         << "dimensionality of 0 and hoping it gets set right later."
         << std::endl;
     dimensionality = 0;
   }
 }

 template<typename Distribution>
 double HMM<Distribution>::Train(const std::vector<arma::mat>& dataSeq)
 {
   // We should allow a guess at the transition and emission matrices.
   double loglik = 0;
   double oldLoglik = 0;

   // Maximum iterations?
   size_t iterations = 1000;

   // Find length of all sequences and ensure they are the correct size.
   size_t totalLength = 0;
   for (size_t seq = 0; seq < dataSeq.size(); seq++)
   {
     totalLength += dataSeq[seq].n_cols;

     if (dataSeq[seq].n_rows != dimensionality)
       Log::Fatal << "HMM::Train(): data sequence " << seq << " has "
           << "dimensionality " << dataSeq[seq].n_rows << " (expected "
           << dimensionality << " dimensions)." << std::endl;
   }

   // These are used later for training of each distribution.  We initialize it
   // all now so we don't have to do any allocation later on.
   std::vector<arma::vec> emissionProb(logTransition.n_cols,
       arma::vec(totalLength));
   arma::mat emissionList(dimensionality, totalLength);

   // This should be the Baum-Welch algorithm (EM for HMM estimation). This
   // follows the procedure outlined in Elliot, Aggoun, and Moore's book "Hidden
   // Markov Models: Estimation and Control", pp. 36-40.
   for (size_t iter = 0; iter < iterations; iter++)
   {
     // Clear new transition matrix and emission probabilities.
     arma::vec newLogInitial(logTransition.n_rows);
     newLogInitial.fill(-std::numeric_limits<double>::infinity());
     arma::mat newLogTransition(logTransition.n_rows, logTransition.n_cols);
     newLogTransition.fill(-std::numeric_limits<double>::infinity());

     // Reset log likelihood.
     loglik = 0;

     // Sum over time.
     size_t sumTime = 0;

     // Loop over each sequence.
     for (size_t seq = 0; seq < dataSeq.size(); seq++)
     {
       arma::mat stateLogProb;
       arma::mat forwardLog;
       arma::mat backwardLog;
       arma::vec logScales;

       // Add the log-likelihood of this sequence.  This is the E-step.
       loglik += LogEstimate(dataSeq[seq], stateLogProb, forwardLog,
           backwardLog, logScales);

       // Add to estimate of initial probability for state j.
       math::LogSumExp<arma::vec, true>(stateLogProb.unsafe_col(0),
           newLogInitial);

       // Define a variable to store the value of log-probability for data.
       arma::mat logProbs(dataSeq[seq].n_cols, logTransition.n_rows);
       // Save the values of log-probability to logProbs.
       for (size_t i = 0; i < logTransition.n_rows; i++)
       {
         // Define alias of desired column.
         arma::vec alias(logProbs.colptr(i), logProbs.n_rows, false, true);
         // Use advanced constructor for using logProbs directly.
         emission[i].LogProbability(dataSeq[seq], alias);
       }

       // Now re-estimate the parameters.  This is the M-step.
       //   pi_i = sum_d ((1 / P(seq[d])) sum_t (f(i, 0) b(i, 0))
       //   T_ij = sum_d ((1 / P(seq[d])) sum_t (f(i, t) T_ij E_i(seq[d][t]) b(i,
       //           t + 1)))
       //   E_ij = sum_d ((1 / P(seq[d])) sum_{t | seq[d][t] = j} f(i, t) b(i, t)
       // We store the new estimates in a different matrix.
       for (size_t t = 0; t < dataSeq[seq].n_cols; ++t)
       {
         // Assemble temporary vector that's used in log-sum computation.
         if (t < dataSeq[seq].n_cols - 1)
         {
           // This term is the same across all states, so compute it once and
           // cache it.
           const arma::vec tmp = backwardLog.col(t + 1) +
               logProbs.row(t + 1).t() - logScales[t + 1];
           arma::vec output;
           math::LogSumExp(tmp, output);

           for (size_t j = 0; j < logTransition.n_cols; ++j)
           {
             // Compute the estimate of T_ij (probability of transition from
             // state j to state i).  We postpone multiplication of the old T_ij
             // until later.
             arma::vec tmp2 = output + forwardLog(j, t);
             arma::vec alias = newLogTransition.unsafe_col(j);
             math::LogSumExp<arma::vec, true>(tmp2, alias);
           }
         }

         // Add to list of emission observations, for Distribution::Train().
         for (size_t j = 0; j < logTransition.n_cols; ++j)
           emissionProb[j][sumTime] = exp(stateLogProb(j, t));
         emissionList.col(sumTime) = dataSeq[seq].col(t);
         sumTime++;
       }
     }

     if (std::abs(oldLoglik - loglik) < tolerance)
     {
       Log::Debug << "Converged after " << iter << " iterations." << std::endl;
       break;
     }

     oldLoglik = loglik;

     // Normalize the new initial probabilities.
     if (dataSeq.size() > 1)
       logInitial = newLogInitial - std::log(dataSeq.size());
     else
       logInitial = newLogInitial;

     // Assign the new transition matrix.  We use %= (element-wise
     // multiplication) because every element of the new transition matrix must
     // still be multiplied by the old elements (this is the multiplication we
     // earlier postponed).
     logTransition += newLogTransition;

     // Now we normalize the transition matrix.
     for (size_t i = 0; i < logTransition.n_cols; i++)
     {
       const double sum = math::AccuLog(logTransition.col(i));
       if (std::isfinite(sum))
         logTransition.col(i) -= sum;
       else
         logTransition.col(i).fill(-log((double) logTransition.n_rows));
     }

     initialProxy = exp(logInitial);
     transitionProxy = exp(logTransition);
     // Now estimate emission probabilities.
     for (size_t state = 0; state < logTransition.n_cols; state++)
       emission[state].Train(emissionList, emissionProb[state]);

     Log::Debug << "Iteration " << iter << ": log-likelihood " << loglik
         << "." << std::endl;
   }
   return loglik;
 }

 template<typename Distribution>
 void HMM<Distribution>::Train(const std::vector<arma::mat>& dataSeq,
                               const std::vector<arma::Row<size_t> >& stateSeq)
 {
   // Simple error checking.
   if (dataSeq.size() != stateSeq.size())
   {
     Log::Fatal << "HMM::Train(): number of data sequences (" << dataSeq.size()
         << ") not equal to number of state sequences (" << stateSeq.size()
         << ")." << std::endl;
   }

   arma::mat initial = arma::zeros(logInitial.n_elem);
   arma::mat transition = arma::zeros(logTransition.n_rows,
                                      logTransition.n_cols);

   // Estimate the transition and emission matrices directly from the
   // observations.  The emission list holds the time indices for observations
   // from each state.
   std::vector<std::vector<std::pair<size_t, size_t> > >
       emissionList(transition.n_cols);
   for (size_t seq = 0; seq < dataSeq.size(); seq++)
   {
     // Simple error checking.
     if (dataSeq[seq].n_cols != stateSeq[seq].n_elem)
     {
       Log::Fatal << "HMM::Train(): number of observations ("
           << dataSeq[seq].n_cols << ") in sequence " << seq
           << " not equal to number of states (" << stateSeq[seq].n_cols
           << ") in sequence " << seq << "." << std::endl;
     }

     if (dataSeq[seq].n_rows != dimensionality)
     {
       Log::Fatal << "HMM::Train(): data sequence " << seq << " has "
           << "dimensionality " << dataSeq[seq].n_rows << " (expected "
           << dimensionality << " dimensions)." << std::endl;
     }

     // Loop over each observation in the sequence.  For estimation of the
     // transition matrix, we must ignore the last observation.
     initial[stateSeq[seq][0]]++;
     for (size_t t = 0; t < dataSeq[seq].n_cols - 1; t++)
     {
       transition(stateSeq[seq][t + 1], stateSeq[seq][t])++;
       emissionList[stateSeq[seq][t]].push_back(std::make_pair(seq, t));
     }

     // Last observation.
     emissionList[stateSeq[seq][stateSeq[seq].n_elem - 1]].push_back(
         std::make_pair(seq, stateSeq[seq].n_elem - 1));
   }

   // Normalize initial weights.
   initial /= accu(initial);

   // Normalize transition matrix.
   for (size_t col = 0; col < transition.n_cols; col++)
   {
     // If the transition probability sum is greater than 0 in this column, the
     // emission probability sum will also be greater than 0.  We want to avoid
     // division by 0.
     double sum = accu(transition.col(col));
     if (sum > 0)
       transition.col(col) /= sum;
   }

   initialProxy = initial;
   transitionProxy = transition;
   logTransition = log(transition);
   logInitial = log(initial);

   // Estimate emission matrix.
   for (size_t state = 0; state < transition.n_cols; state++)
   {
     // Generate full sequence of observations for this state from the list of
     // emissions that are from this state.
     if (emissionList[state].size() > 0)
     {
       arma::mat emissions(dimensionality, emissionList[state].size());
       for (size_t i = 0; i < emissions.n_cols; i++)
       {
         emissions.col(i) = dataSeq[emissionList[state][i].first].col(
             emissionList[state][i].second);
       }

       emission[state].Train(emissions);
     }
     else
     {
       Log::Warn << "There are no observations in training data with hidden "
           << "state " << state << "!  The corresponding emission distribution "
           << "is likely to be meaningless." << std::endl;
     }
   }
 }

 template<typename Distribution>
 double HMM<Distribution>::LogEstimate(const arma::mat& dataSeq,
                                       arma::mat& stateLogProb,
                                       arma::mat& forwardLogProb,
                                       arma::mat& backwardLogProb,
                                       arma::vec& logScales) const
 {
   arma::mat logProbs(dataSeq.n_cols, logTransition.n_rows);

   // Save the values of log-probability to logProbs.
   for (size_t i = 0; i < logTransition.n_rows; i++)
   {
     // Define alias of desired column.
     arma::vec alias(logProbs.colptr(i), logProbs.n_rows, false, true);
     // Use advanced constructor for using logProbs directly.
     emission[i].LogProbability(dataSeq, alias);
   }

   // First run the forward-backward algorithm.
   Forward(dataSeq, logScales, forwardLogProb, logProbs);
   Backward(dataSeq, logScales, backwardLogProb, logProbs);

   // Now assemble the state probability matrix based on the forward and backward
   // probabilities.
   stateLogProb = forwardLogProb + backwardLogProb;

   // Finally assemble the log-likelihood and return it.
   return accu(logScales);
 }

 template<typename Distribution>
 double HMM<Distribution>::Estimate(const arma::mat& dataSeq,
                                    arma::mat& stateProb,
                                    arma::mat& forwardProb,
                                    arma::mat& backwardProb,
                                    arma::vec& scales) const
 {
   arma::mat stateLogProb;
   arma::mat forwardLogProb;
   arma::mat backwardLogProb;
   arma::vec logScales;

   const double loglikelihood = LogEstimate(dataSeq, stateLogProb,
       forwardLogProb, backwardLogProb, logScales);

   stateProb = exp(stateLogProb);
   forwardProb = exp(forwardLogProb);
   backwardProb = exp(backwardLogProb);
   scales = exp(logScales);

   return loglikelihood;
 }

 template<typename Distribution>
 double HMM<Distribution>::Estimate(const arma::mat& dataSeq,
                                    arma::mat& stateProb) const
 {
   // We don't need to save these.
   arma::mat stateLogProb;
   arma::mat forwardLogProb;
   arma::mat backwardLogProb;
   arma::vec logScales;

   const double loglikelihood = LogEstimate(dataSeq, stateLogProb,
       forwardLogProb, backwardLogProb, logScales);

   stateProb = exp(stateLogProb);

   return loglikelihood;
 }

 template<typename Distribution>
 void HMM<Distribution>::Generate(const size_t length,
                                  arma::mat& dataSequence,
                                  arma::Row<size_t>& stateSequence,
                                  const size_t startState) const
 {
   // Set vectors to the right size.
   stateSequence.set_size(length);
   dataSequence.set_size(dimensionality, length);

   // Set start state (default is 0).
   stateSequence[0] = startState;

   // Choose first emission state.
   double randValue = math::Random();

   // We just have to find where our random value sits in the probability
   // distribution of emissions for our starting state.
   dataSequence.col(0) = emission[startState].Random();

   ConvertToLogSpace();

   // Now choose the states and emissions for the rest of the sequence.
   for (size_t t = 1; t < length; t++)
   {
     // First choose the hidden state.
     randValue = math::Random();

     // Now find where our random value sits in the probability distribution of
     // state changes.
     double probSum = 0;
     for (size_t st = 0; st < logTransition.n_rows; st++)
     {
       probSum += exp(logTransition(st, stateSequence[t - 1]));
       if (randValue <= probSum)
       {
         stateSequence[t] = st;
         break;
       }
     }

     // Now choose the emission.
     dataSequence.col(t) = emission[stateSequence[t]].Random();
   }
 }

 template<typename Distribution>
 double HMM<Distribution>::Predict(const arma::mat& dataSeq,
                                   arma::Row<size_t>& stateSeq) const
 {
   // This is an implementation of the Viterbi algorithm for finding the most
   // probable sequence of states to produce the observed data sequence.  We
   // don't use log-likelihoods to save that little bit of time, but we'll
   // calculate the log-likelihood at the end of it all.
   stateSeq.set_size(dataSeq.n_cols);
   arma::mat logStateProb(logTransition.n_rows, dataSeq.n_cols);
   arma::mat stateSeqBack(logTransition.n_rows, dataSeq.n_cols);

   ConvertToLogSpace();

   // The calculation of the first state is slightly different; the probability
   // of the first state being state j is the maximum probability that the state
   // came to be j from another state.
   logStateProb.col(0).zeros();
   for (size_t state = 0; state < logTransition.n_rows; state++)
   {
     logStateProb(state, 0) = logInitial[state] +
         emission[state].LogProbability(dataSeq.unsafe_col(0));
     stateSeqBack(state, 0) = state;
   }

   // Store the best first state.
   arma::uword index;

   // Define a variable to store the value of log-probability for dataSeq.
   arma::mat logProbs(dataSeq.n_cols, logTransition.n_rows);

   // Save the values of log-probability to logProbs.
   for (size_t i = 0; i < logTransition.n_rows; i++)
   {
     // Define alias of desired column.
     arma::vec alias(logProbs.colptr(i), logProbs.n_rows, false, true);
     // Use advanced constructor for using logProbs directly.
     emission[i].LogProbability(dataSeq, alias);
   }

   for (size_t t = 1; t < dataSeq.n_cols; t++)
   {
     // Assemble the state probability for this element.
     // Given that we are in state j, we use state with the highest probability
     // of being the previous state.
     for (size_t j = 0; j < logTransition.n_rows; j++)
     {
       arma::vec prob = logStateProb.col(t - 1) + logTransition.row(j).t();
       logStateProb(j, t) = prob.max(index) + logProbs(t, j);
       stateSeqBack(j, t) = index;
     }
   }

   // Backtrack to find the most probable state sequence.
   logStateProb.unsafe_col(dataSeq.n_cols - 1).max(index);
   stateSeq[dataSeq.n_cols - 1] = index;
   for (size_t t = 2; t <= dataSeq.n_cols; t++)
   {
     stateSeq[dataSeq.n_cols - t] =
         stateSeqBack(stateSeq[dataSeq.n_cols - t + 1], dataSeq.n_cols - t + 1);
   }

   return logStateProb(stateSeq(dataSeq.n_cols - 1), dataSeq.n_cols - 1);
 }

 template<typename Distribution>
 double HMM<Distribution>::LogLikelihood(const arma::mat& dataSeq) const
 {
   arma::mat forwardLog;
   arma::vec logScales;

   // This is needed here.
   arma::mat logProbs(dataSeq.n_cols, logTransition.n_rows);

   // Save the values of log-probability to logProbs.
   for (size_t i = 0; i < logTransition.n_rows; i++)
   {
     // Define alias of desired column.
     arma::vec alias(logProbs.colptr(i), logProbs.n_rows, false, true);
     // Use advanced constructor for using logProbs directly.
     emission[i].LogProbability(dataSeq, alias);
   }

   Forward(dataSeq, logScales, forwardLog, logProbs);

   // The log-likelihood is the log of the scales for each time step.
   return accu(logScales);
 }

 template<typename Distribution>
 double HMM<Distribution>::EmissionLogScaleFactor(
     const arma::vec& emissionLogProb,
     arma::vec& forwardLogProb) const
 {
   double curLogScale;
   if (forwardLogProb.empty())
   {
     // We are at the start of the sequence (i.e. time t=0).
     forwardLogProb = ForwardAtT0(emissionLogProb, curLogScale);
   }
   else
   {
     forwardLogProb = ForwardAtTn(emissionLogProb, curLogScale,
         forwardLogProb);
   }

   return curLogScale;
 }

 template<typename Distribution>
 double HMM<Distribution>::EmissionLogLikelihood(
     const arma::vec& emissionLogProb,
     double& logLikelihood,
     arma::vec& forwardLogProb) const
 {
   bool isStartOfSeq = forwardLogProb.empty();
   double curLogScale = EmissionLogScaleFactor(emissionLogProb, forwardLogProb);
   logLikelihood = isStartOfSeq ? curLogScale : curLogScale + logLikelihood;
   return logLikelihood;
 }

 template<typename Distribution>
 double HMM<Distribution>::LogScaleFactor(const arma::vec &data,
                                          arma::vec& forwardLogProb) const
 {
   arma::vec emissionLogProb(logTransition.n_rows);

   for (size_t state = 0; state < logTransition.n_rows; state++)
   {
     emissionLogProb(state) = emission[state].LogProbability(data);
   }

   return EmissionLogScaleFactor(emissionLogProb, forwardLogProb);
 }

 template<typename Distribution>
 double HMM<Distribution>::LogLikelihood(const arma::vec& data,
                                         double& logLikelihood,
                                         arma::vec& forwardLogProb) const
 {
   bool isStartOfSeq = forwardLogProb.empty();
   double curLogScale = LogScaleFactor(data, forwardLogProb);
   logLikelihood = isStartOfSeq ? curLogScale : curLogScale + logLikelihood;
   return logLikelihood;
 }

 template<typename Distribution>
 void HMM<Distribution>::Filter(const arma::mat& dataSeq,
                                arma::mat& filterSeq,
                                size_t ahead) const
 {
   // First run the forward algorithm.
   arma::mat forwardLogProb;
   arma::vec logScales;
   // This is needed here.
   arma::mat logProbs(dataSeq.n_cols, logTransition.n_rows);

   // Save the values of log-probability to logProbs.
   for (size_t i = 0; i < logTransition.n_rows; i++)
   {
     // Define alias of desired column.
     arma::vec alias(logProbs.colptr(i), logProbs.n_rows, false, true);
     // Use advanced constructor for using logProbs directly.
     emission[i].LogProbability(dataSeq, alias);
   }

   Forward(dataSeq, logScales, forwardLogProb, logProbs);

   // Propagate state ahead.
   if (ahead != 0)
     forwardLogProb += ahead * logTransition;

   arma::mat forwardProb = exp(forwardLogProb);

   // Compute expected emissions.
   // Will not work for distributions without a Mean() function.
   filterSeq.zeros(dimensionality, dataSeq.n_cols);
   for (size_t i = 0; i < emission.size(); i++)
     filterSeq += emission[i].Mean() * forwardProb.row(i);
 }

 template<typename Distribution>
 void HMM<Distribution>::Smooth(const arma::mat& dataSeq,
                                arma::mat& smoothSeq) const
 {
   // First run the forward algorithm.
   arma::mat stateLogProb;
   arma::mat forwardLogProb;
   arma::mat backwardLogProb;
   arma::mat logScales;
   LogEstimate(dataSeq, stateLogProb, forwardLogProb, backwardLogProb,
       logScales);

   // Compute expected emissions.
   // Will not work for distributions without a Mean() function.
   smoothSeq.zeros(dimensionality, dataSeq.n_cols);
   for (size_t i = 0; i < emission.size(); i++)
     smoothSeq += emission[i].Mean() * exp(stateLogProb.row(i));
 }

 template<typename Distribution>
 arma::vec HMM<Distribution>::ForwardAtT0(const arma::vec& emissionLogProb,
                                          double& logScales) const
 {
   // Our goal is to calculate the forward probabilities:
   //  P(X_k | o_{1:k}) for all possible states X_k, for each time point k.
   ConvertToLogSpace();

   // The first entry in the forward algorithm uses the initial state
   // probabilities.  Note that MATLAB assumes that the starting state (at
   // t = -1) is state 0; this is not our assumption here.  To force that
   // behavior, you could append a single starting state to every single data
   // sequence and that should produce results in line with MATLAB.
   arma::vec forwardLogProb = logInitial + emissionLogProb;

   // Normalize probability.
   logScales = math::AccuLog(forwardLogProb);
   if (std::isfinite(logScales))
     forwardLogProb -= logScales;

   return forwardLogProb;
 }

 template<typename Distribution>
 arma::vec HMM<Distribution>::ForwardAtTn(const arma::vec& emissionLogProb,
                                          double& logScales,
                                          const arma::vec& prevForwardLogProb)
     const
 {
   // Our goal is to calculate the forward probabilities:
   //  P(X_k | o_{1:k}) for all possible states X_k, for each time point k.

   // The forward probability of state j at time t is the sum over all states of
   // the probability of the previous state transitioning to the current state
   // and emitting the given observation.  To do this computation in log-space,
   // we can use LogSumExp().
   arma::vec forwardLogProb;
   arma::mat tmp = logTransition + repmat(prevForwardLogProb.t(),
       logTransition.n_rows, 1);
   math::LogSumExp(tmp, forwardLogProb);
   forwardLogProb += emissionLogProb;

   // Normalize probability.
   logScales = math::AccuLog(forwardLogProb);
   if (std::isfinite(logScales))
     forwardLogProb -= logScales;

   return forwardLogProb;
 }

 template<typename Distribution>
 void HMM<Distribution>::Forward(const arma::mat& dataSeq,
                                 arma::vec& logScales,
                                 arma::mat& forwardLogProb,
                                 arma::mat& logProbs) const
 {
   // Our goal is to calculate the forward probabilities:
   //  P(X_k | o_{1:k}) for all possible states X_k, for each time point k.
   forwardLogProb.resize(logTransition.n_rows, dataSeq.n_cols);
   forwardLogProb.fill(-std::numeric_limits<double>::infinity());
   logScales.resize(dataSeq.n_cols);
   logScales.fill(-std::numeric_limits<double>::infinity());

   // The first entry in the forward algorithm uses the initial state
   // probabilities.  Note that MATLAB assumes that the starting state (at
   // t = -1) is state 0; this is not our assumption here.  To force that
   // behavior, you could append a single starting state to every single data
   // sequence and that should produce results in line with MATLAB.

   forwardLogProb.col(0) = ForwardAtT0(logProbs.row(0).t(), logScales(0));

   // Now compute the probabilities for each successive observation.
   for (size_t t = 1; t < dataSeq.n_cols; t++)
   {
     forwardLogProb.col(t) = ForwardAtTn(logProbs.row(t).t(), logScales(t),
         forwardLogProb.col(t - 1));
   }
 }

 template<typename Distribution>
 void HMM<Distribution>::Backward(const arma::mat& dataSeq,
                                  const arma::vec& logScales,
                                  arma::mat& backwardLogProb,
                                  arma::mat& logProbs) const
 {
   // Our goal is to calculate the backward probabilities:
   //  P(X_k | o_{k + 1:T}) for all possible states X_k, for each time point k.
   backwardLogProb.resize(logTransition.n_rows, dataSeq.n_cols);
   backwardLogProb.fill(-std::numeric_limits<double>::infinity());

   // The last element probability is 1.
   backwardLogProb.col(dataSeq.n_cols - 1).fill(0);

   // Now step backwards through all other observations.
   for (size_t t = dataSeq.n_cols - 2; t + 1 > 0; t--)
   {
     // The backward probability of state j at time t is the sum over all
     // states of the probability of the next state having been a transition
     // from the current state multiplied by the probability of each of those
     // states emitting the given observation.  To compute this in log-space, we
     // can use LogSumExpT().
     const arma::mat tmp = logTransition +
         repmat(backwardLogProb.col(t + 1), 1, logTransition.n_cols) +
         repmat(logProbs.row(t + 1).t(), 1, logTransition.n_cols);
     arma::vec alias = backwardLogProb.unsafe_col(t);
     math::LogSumExpT<arma::mat, true>(tmp, alias);

     // Normalize by the weights from the forward algorithm.
     if (std::isfinite(logScales[t + 1]))
       backwardLogProb.col(t) -= logScales[t + 1];
   }
 }

 template<typename Distribution>
 void HMM<Distribution>::ConvertToLogSpace() const
 {
   if (recalculateInitial)
   {
     logInitial = log(initialProxy);
     recalculateInitial = false;
   }

   if (recalculateTransition)
   {
     logTransition = log(transitionProxy);
     recalculateTransition = false;
   }
 }

 template<typename Distribution>
 template<typename Archive>
 void HMM<Distribution>::load(Archive& ar, const uint32_t /* version */)
 {
   arma::mat transition;
   arma::vec initial;
   ar(CEREAL_NVP(dimensionality));
   ar(CEREAL_NVP(tolerance));
   ar(CEREAL_NVP(transition));
   ar(CEREAL_NVP(initial));

   // Now serialize each emission.  If we are loading, we must resize the vector
   // of emissions correctly.
   emission.resize(transition.n_rows);
   // Load the emissions; generate the correct name for each one.
   ar(CEREAL_NVP(emission));

   logTransition = log(transition);
   logInitial = log(initial);
   initialProxy = std::move(initial);
   transitionProxy = std::move(transition);
 }

 template<typename Distribution>
 template<typename Archive>
 void HMM<Distribution>::save(Archive& ar,
                              const uint32_t /* version */) const
 {
   arma::mat transition = exp(logTransition);
   arma::vec initial = exp(logInitial);
   ar(CEREAL_NVP(dimensionality));
   ar(CEREAL_NVP(tolerance));
   ar(CEREAL_NVP(transition));
   ar(CEREAL_NVP(initial));
   ar(CEREAL_NVP(emission));
 }

 } // namespace hmm
 } // namespace mlpack

 #endif
mlpack::math::LogSumExp
void LogSumExp(const T &x, arma::Col< typename T::elem_type > &y)
Compute the sum of exponentials of each element in each column, then compute the log of that...
Definition: log_add_impl.hpp:78

data

mlpack
Linear algebra utility functions, generally performed on matrices or vectors.
Definition: cv.hpp:1

arma

log_add.hpp

Train
Definition: hmm_train_main.cpp:300

mlpack::hmm::HMM
A class that represents a Hidden Markov Model with an arbitrary type of emission distribution.
Definition: hmm.hpp:85

mlpack::math::AccuLog
T::elem_type AccuLog(const T &x)
Log-sum a vector of log values.
Definition: log_add_impl.hpp:63

mlpack::math::Random
double Random()
Generates a uniform random number between 0 and 1.
Definition: random.hpp:83

hmm.hpp

mlpack::hmm::HMM::HMM
HMM(const size_t states=0, const Distribution emissions=Distribution(), const double tolerance=1e-5)
Create the Hidden Markov Model with the given number of hidden states and the given default distribut...
Definition: hmm_impl.hpp:29