Aakash-kaushik/mlpack/rbm__impl_8hpp_source.html

 #ifndef MLPACK_METHODS_ANN_RBM_RBM_IMPL_HPP
 #define MLPACK_METHODS_ANN_RBM_RBM_IMPL_HPP

 // In case it hasn't been included yet.
 #include "rbm.hpp"

 #include <mlpack/methods/ann/activation_functions/logistic_function.hpp>

 namespace mlpack {
 namespace ann  {

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 RBM<InitializationRuleType, DataType, PolicyType>::RBM(
     arma::Mat<ElemType> predictors,
     InitializationRuleType initializeRule,
     const size_t visibleSize,
     const size_t hiddenSize,
     const size_t batchSize,
     const size_t numSteps,
     const size_t negSteps,
     const size_t poolSize,
     const ElemType slabPenalty,
     const ElemType radius,
     const bool persistence) :
     predictors(std::move(predictors)),
     initializeRule(initializeRule),
     visibleSize(visibleSize),
     hiddenSize(hiddenSize),
     batchSize(batchSize),
     numSteps(numSteps),
     negSteps(negSteps),
     poolSize(poolSize),
     steps(0),
     slabPenalty(slabPenalty),
     radius(2 * radius),
     persistence(persistence),
     reset(false)
 {
   numFunctions = this->predictors.n_cols;
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 template<typename Policy, typename InputType>
 typename std::enable_if<std::is_same<Policy, BinaryRBM>::value, void>::type
 RBM<InitializationRuleType, DataType, PolicyType>::Reset()
 {
   size_t shape = (visibleSize * hiddenSize) + visibleSize + hiddenSize;

   parameter.set_size(shape, 1);
   positiveGradient.set_size(shape, 1);
   negativeGradient.set_size(shape, 1);
   tempNegativeGradient.set_size(shape, 1);
   negativeSamples.set_size(visibleSize, batchSize);

   weight = arma::Cube<ElemType>(parameter.memptr(), hiddenSize, visibleSize, 1,
       false, false);
   hiddenBias = DataType(parameter.memptr() + weight.n_elem,
       hiddenSize, 1, false, false);
   visibleBias = DataType(parameter.memptr() + weight.n_elem +
       hiddenBias.n_elem, visibleSize, 1, false, false);

   parameter.zeros();
   positiveGradient.zeros();
   negativeGradient.zeros();
   tempNegativeGradient.zeros();
   initializeRule.Initialize(parameter, parameter.n_elem, 1);

   reset = true;
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 template<typename OptimizerType, typename... CallbackType>
 double RBM<InitializationRuleType, DataType, PolicyType>::Train(
     OptimizerType& optimizer, CallbackType&&... callbacks)
 {
   if (!reset)
   {
     Reset();
   }

   return optimizer.Optimize(*this, parameter, callbacks...);
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 template<typename Policy, typename InputType>
 typename std::enable_if<std::is_same<Policy, BinaryRBM>::value, double>::type
 RBM<InitializationRuleType, DataType, PolicyType>::FreeEnergy(
     const arma::Mat<ElemType>& input)
 {
   preActivation = (weight.slice(0) * input);
   preActivation.each_col() += hiddenBias;
   return -(arma::accu(arma::log(1 + arma::trunc_exp(preActivation))) +
       arma::dot(input, arma::repmat(visibleBias, 1, input.n_cols)));
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 template<typename Policy, typename InputType>
 typename std::enable_if<std::is_same<Policy, BinaryRBM>::value, void>::type
 RBM<InitializationRuleType, DataType, PolicyType>::Phase(
     const InputType& input,
     DataType& gradient)
 {
   arma::Cube<ElemType> weightGrad = arma::Cube<ElemType>(gradient.memptr(),
       hiddenSize, visibleSize, 1, false, false);

   DataType hiddenBiasGrad = DataType(gradient.memptr() + weightGrad.n_elem,
       hiddenSize, 1, false, false);

   HiddenMean(input, hiddenBiasGrad);
   weightGrad.slice(0) = hiddenBiasGrad * input.t();
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 double RBM<InitializationRuleType, DataType, PolicyType>::Evaluate(
     const arma::Mat<ElemType>& /* parameters*/,
     const size_t i,
     const size_t batchSize)
 {
   Gibbs(predictors.cols(i, i + batchSize - 1),
       negativeSamples);
   return std::fabs(FreeEnergy(predictors.cols(i,
       i + batchSize - 1)) - FreeEnergy(negativeSamples));
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 template<typename Policy, typename InputType>
 typename std::enable_if<std::is_same<Policy, BinaryRBM>::value, void>::type
 RBM<InitializationRuleType, DataType, PolicyType>::SampleHidden(
     const arma::Mat<ElemType>& input,
     arma::Mat<ElemType>& output)
 {
   HiddenMean(input, output);

   for (size_t i = 0; i < output.n_elem; ++i)
   {
     output(i) = math::RandBernoulli(output(i));
   }
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 template<typename Policy, typename InputType>
 typename std::enable_if<std::is_same<Policy, BinaryRBM>::value, void>::type
 RBM<InitializationRuleType, DataType, PolicyType>::SampleVisible(
     arma::Mat<ElemType>& input,
     arma::Mat<ElemType>& output)
 {
   VisibleMean(input, output);

   for (size_t i = 0; i < output.n_elem; ++i)
   {
     output(i) = math::RandBernoulli(output(i));
   }
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 template<typename Policy, typename InputType>
 typename std::enable_if<std::is_same<Policy, BinaryRBM>::value, void>::type
 RBM<InitializationRuleType, DataType, PolicyType>::VisibleMean(
     InputType& input,
     DataType& output)
 {
   output = weight.slice(0).t() * input;
   output.each_col() += visibleBias;
   LogisticFunction::Fn(output, output);
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 template<typename Policy, typename InputType>
 typename std::enable_if<std::is_same<Policy, BinaryRBM>::value, void>::type
 RBM<InitializationRuleType, DataType, PolicyType>::HiddenMean(
     const InputType& input,
     DataType& output)
 {
   output = weight.slice(0) * input;
   output.each_col() += hiddenBias;
   LogisticFunction::Fn(output, output);
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 void RBM<InitializationRuleType, DataType, PolicyType>::Gibbs(
     const arma::Mat<ElemType>& input,
     arma::Mat<ElemType>& output,
     const size_t steps)
 {
   this->steps = (steps == SIZE_MAX) ? this->numSteps : steps;

   if (persistence && !state.is_empty())
   {
     SampleHidden(state, gibbsTemporary);
     SampleVisible(gibbsTemporary, output);
   }
   else
   {
     SampleHidden(input, gibbsTemporary);
     SampleVisible(gibbsTemporary, output);
   }

   for (size_t j = 1; j < this->steps; ++j)
   {
     SampleHidden(output, gibbsTemporary);
     SampleVisible(gibbsTemporary, output);
   }
   if (persistence)
   {
     state = output;
   }
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 void RBM<InitializationRuleType, DataType, PolicyType>::Gradient(
     const arma::Mat<ElemType>& /*parameters*/,
     const size_t i,
     arma::Mat<ElemType>& gradient,
     const size_t batchSize)
 {
   positiveGradient.zeros();
   negativeGradient.zeros();

   Phase(predictors.cols(i, i + batchSize - 1),
       positiveGradient);

   for (size_t i = 0; i < negSteps; ++i)
   {
     Gibbs(predictors.cols(i, i + batchSize - 1),
         negativeSamples);
     Phase(negativeSamples, tempNegativeGradient);

     negativeGradient += tempNegativeGradient;
   }

   gradient = ((negativeGradient / negSteps) - positiveGradient);
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 void RBM<InitializationRuleType, DataType, PolicyType>::Shuffle()
 {
   predictors = predictors.cols(arma::shuffle(arma::linspace<arma::uvec>(0,
       predictors.n_cols - 1, predictors.n_cols)));
 }

 template<
   typename InitializationRuleType,
   typename DataType,
   typename PolicyType
 >
 template<typename Archive>
 void RBM<InitializationRuleType, DataType, PolicyType>::serialize(
     Archive& ar, const uint32_t /* version */)
 {
   ar(CEREAL_NVP(parameter));
   ar(CEREAL_NVP(visibleSize));
   ar(CEREAL_NVP(hiddenSize));
   ar(CEREAL_NVP(state));
   ar(CEREAL_NVP(numFunctions));
   ar(CEREAL_NVP(numSteps));
   ar(CEREAL_NVP(negSteps));
   ar(CEREAL_NVP(persistence));
   ar(CEREAL_NVP(poolSize));
   ar(CEREAL_NVP(visibleBias));
   ar(CEREAL_NVP(hiddenBias));
   ar(CEREAL_NVP(weight));
   ar(CEREAL_NVP(spikeBias));
   ar(CEREAL_NVP(slabPenalty));
   ar(CEREAL_NVP(radius));
   ar(CEREAL_NVP(visiblePenalty));

   // If we are loading, we need to initialize the weights.
   if (cereal::is_loading<Archive>())
   {
     size_t shape = parameter.n_elem;
     positiveGradient.set_size(shape, 1);
     negativeGradient.set_size(shape, 1);
     negativeSamples.set_size(visibleSize, batchSize);
     tempNegativeGradient.set_size(shape, 1);
     spikeMean.set_size(hiddenSize, 1);
     spikeSamples.set_size(hiddenSize, 1);
     slabMean.set_size(poolSize, hiddenSize);
     positiveGradient.zeros();
     negativeGradient.zeros();
     tempNegativeGradient.zeros();
     reset = true;
   }
 }

 } // namespace ann
 } // namespace mlpack
 #endif
mlpack::ann::RBM::SampleHidden
std::enable_if< std::is_same< Policy, BinaryRBM >::value, void >::type SampleHidden(const arma::Mat< ElemType > &input, arma::Mat< ElemType > &output)
This function samples the hidden layer given the visible layer using Bernoulli function.
Definition: rbm_impl.hpp:166

mlpack::math::RandBernoulli
double RandBernoulli(const double input)
Generates a 0/1 specified by the input.
Definition: random.hpp:99

mlpack::ann::RBM::FreeEnergy
std::enable_if< std::is_same< Policy, BinaryRBM >::value, double >::type FreeEnergy(const arma::Mat< ElemType > &input)
This function calculates the free energy of the BinaryRBM.
Definition: rbm_impl.hpp:113

mlpack::ann::RBM::RBM
RBM(arma::Mat< ElemType > predictors, InitializationRuleType initializeRule, const size_t visibleSize, const size_t hiddenSize, const size_t batchSize=1, const size_t numSteps=1, const size_t negSteps=1, const size_t poolSize=2, const ElemType slabPenalty=8, const ElemType radius=1, const bool persistence=false)
Initialize all the parameters of the network using initializeRule.
Definition: rbm_impl.hpp:27

mlpack
Linear algebra utility functions, generally performed on matrices or vectors.
Definition: cv.hpp:1

logistic_function.hpp

mlpack::ann::RBM::Gibbs
void Gibbs(const arma::Mat< ElemType > &input, arma::Mat< ElemType > &output, const size_t steps=SIZE_MAX)
This function does the k-step Gibbs Sampling.
Definition: rbm_impl.hpp:234

rbm.hpp

std
Definition: pointer_wrapper.hpp:23

mlpack::ann::RBM::HiddenMean
std::enable_if< std::is_same< Policy, BinaryRBM >::value, void >::type HiddenMean(const InputType &input, DataType &output)
The function calculates the mean for the hidden layer.
Definition: rbm_impl.hpp:220

mlpack::ann::RBM
The implementation of the RBM module.
Definition: rbm.hpp:38

mlpack::ann::RBM::Gradient
void Gradient(const arma::Mat< ElemType > &parameters, const size_t i, arma::Mat< ElemType > &gradient, const size_t batchSize)
Calculates the gradients for the RBM network.
Definition: rbm_impl.hpp:268

mlpack::ann::RBM::Train
double Train(OptimizerType &optimizer, CallbackType &&... callbacks)
Train the RBM on the given input data.
Definition: rbm_impl.hpp:95

mlpack::ann::RBM::Phase
std::enable_if< std::is_same< Policy, BinaryRBM >::value, void >::type Phase(const InputType &input, DataType &gradient)
Calculates the gradient of the RBM network on the provided input.
Definition: rbm_impl.hpp:129

mlpack::ann::RBM::serialize
void serialize(Archive &ar, const uint32_t version)
Serialize the model.
Definition: rbm_impl.hpp:309

mlpack::ann::LogisticFunction::Fn
static double Fn(const eT x)
Computes the logistic function.
Definition: logistic_function.hpp:39

mlpack::ann::RBM::Evaluate
double Evaluate(const arma::Mat< ElemType > &parameters, const size_t i, const size_t batchSize)
Evaluate the RBM network with the given parameters.
Definition: rbm_impl.hpp:148

mlpack::ann::RBM::Shuffle
void Shuffle()
Shuffle the order of function visitation.
Definition: rbm_impl.hpp:297

mlpack::ann::RBM::VisibleMean
std::enable_if< std::is_same< Policy, BinaryRBM >::value, void >::type VisibleMean(InputType &input, DataType &output)
The function calculates the mean for the visible layer.
Definition: rbm_impl.hpp:204

mlpack::ann::RBM::SampleVisible
std::enable_if< std::is_same< Policy, BinaryRBM >::value, void >::type SampleVisible(arma::Mat< ElemType > &input, arma::Mat< ElemType > &output)
This function samples the visible layer given the hidden layer using Bernoulli function.
Definition: rbm_impl.hpp:185