Aakash-kaushik/mlpack/recurrent__attention__impl_8hpp_source.html

 #ifndef MLPACK_METHODS_ANN_LAYER_RECURRENT_ATTENTION_IMPL_HPP
 #define MLPACK_METHODS_ANN_LAYER_RECURRENT_ATTENTION_IMPL_HPP

 // In case it hasn't yet been included.
 #include "recurrent_attention.hpp"

 #include "../visitor/load_output_parameter_visitor.hpp"
 #include "../visitor/save_output_parameter_visitor.hpp"
 #include "../visitor/backward_visitor.hpp"
 #include "../visitor/forward_visitor.hpp"
 #include "../visitor/gradient_set_visitor.hpp"
 #include "../visitor/gradient_update_visitor.hpp"
 #include "../visitor/gradient_visitor.hpp"

 namespace mlpack {
 namespace ann  {

 template<typename InputDataType, typename OutputDataType>
 RecurrentAttention<InputDataType, OutputDataType>::RecurrentAttention() :
     outSize(0),
     rho(0),
     forwardStep(0),
     backwardStep(0),
     deterministic(false)
 {
   // Nothing to do.
 }

 template <typename InputDataType, typename OutputDataType>
 template<typename RNNModuleType, typename ActionModuleType>
 RecurrentAttention<InputDataType, OutputDataType>::RecurrentAttention(
     const size_t outSize,
     const RNNModuleType& rnn,
     const ActionModuleType& action,
     const size_t rho) :
     outSize(outSize),
     rnnModule(new RNNModuleType(rnn)),
     actionModule(new ActionModuleType(action)),
     rho(rho),
     forwardStep(0),
     backwardStep(0),
     deterministic(false)
 {
   network.push_back(rnnModule);
   network.push_back(actionModule);
 }

 template<typename InputDataType, typename OutputDataType>
 template<typename eT>
 void RecurrentAttention<InputDataType, OutputDataType>::Forward(
     const arma::Mat<eT>& input, arma::Mat<eT>& output)
 {
   // Initialize the action input.
   if (initialInput.is_empty())
   {
     initialInput = arma::zeros(outSize, input.n_cols);
   }

   // Propagate through the action and recurrent module.
   for (forwardStep = 0; forwardStep < rho; ++forwardStep)
   {
     if (forwardStep == 0)
     {
       boost::apply_visitor(ForwardVisitor(initialInput,
           boost::apply_visitor(outputParameterVisitor, actionModule)),
           actionModule);
     }
     else
     {
       boost::apply_visitor(ForwardVisitor(boost::apply_visitor(
           outputParameterVisitor, rnnModule), boost::apply_visitor(
           outputParameterVisitor, actionModule)), actionModule);
     }

     // Initialize the glimpse input.
     arma::mat glimpseInput = arma::zeros(input.n_elem, 2);
     glimpseInput.col(0) = input;
     glimpseInput.submat(0, 1, boost::apply_visitor(outputParameterVisitor,
         actionModule).n_elem - 1, 1) = boost::apply_visitor(
         outputParameterVisitor, actionModule);

     boost::apply_visitor(ForwardVisitor(glimpseInput,
         boost::apply_visitor(outputParameterVisitor, rnnModule)),
         rnnModule);

     // Save the output parameter when training the module.
     if (!deterministic)
     {
       for (size_t l = 0; l < network.size(); ++l)
       {
         boost::apply_visitor(SaveOutputParameterVisitor(
             moduleOutputParameter), network[l]);
       }
     }
   }

   output = boost::apply_visitor(outputParameterVisitor, rnnModule);

   forwardStep = 0;
   backwardStep = 0;
 }

 template<typename InputDataType, typename OutputDataType>
 template<typename eT>
 void RecurrentAttention<InputDataType, OutputDataType>::Backward(
     const arma::Mat<eT>& /* input */,
     const arma::Mat<eT>& gy,
     arma::Mat<eT>& g)
 {
   if (intermediateGradient.is_empty() && backwardStep == 0)
   {
     // Initialize the attention gradients.
     size_t weights = boost::apply_visitor(weightSizeVisitor, rnnModule) +
         boost::apply_visitor(weightSizeVisitor, actionModule);

     intermediateGradient = arma::zeros(weights, 1);
     attentionGradient = arma::zeros(weights, 1);

     // Initialize the action error.
     actionError = arma::zeros(
       boost::apply_visitor(outputParameterVisitor, actionModule).n_rows,
       boost::apply_visitor(outputParameterVisitor, actionModule).n_cols);
   }

   // Propagate the attention gradients.
   if (backwardStep == 0)
   {
     size_t offset = 0;
     offset += boost::apply_visitor(GradientSetVisitor(
         intermediateGradient, offset), rnnModule);
     boost::apply_visitor(GradientSetVisitor(
         intermediateGradient, offset), actionModule);

     attentionGradient.zeros();
   }

   // Back-propagate through time.
   for (; backwardStep < rho; backwardStep++)
   {
     if (backwardStep == 0)
     {
       recurrentError = gy;
     }
     else
     {
       recurrentError = actionDelta;
     }

     for (size_t l = 0; l < network.size(); ++l)
     {
       boost::apply_visitor(LoadOutputParameterVisitor(
          moduleOutputParameter), network[network.size() - 1 - l]);
     }

     if (backwardStep == (rho - 1))
     {
       boost::apply_visitor(BackwardVisitor(boost::apply_visitor(
           outputParameterVisitor, actionModule), actionError,
           actionDelta), actionModule);
     }
     else
     {
       boost::apply_visitor(BackwardVisitor(initialInput, actionError,
           actionDelta), actionModule);
     }

     boost::apply_visitor(BackwardVisitor(boost::apply_visitor(
         outputParameterVisitor, rnnModule), recurrentError, rnnDelta),
         rnnModule);

     if (backwardStep == 0)
     {
       g = rnnDelta.col(1);
     }
     else
     {
       g += rnnDelta.col(1);
     }

     IntermediateGradient();
   }
 }

 template<typename InputDataType, typename OutputDataType>
 template<typename eT>
 void RecurrentAttention<InputDataType, OutputDataType>::Gradient(
     const arma::Mat<eT>& /* input */,
     const arma::Mat<eT>& /* error */,
     arma::Mat<eT>& /* gradient */)
 {
   size_t offset = 0;
   offset += boost::apply_visitor(GradientUpdateVisitor(
       attentionGradient, offset), rnnModule);
   boost::apply_visitor(GradientUpdateVisitor(
       attentionGradient, offset), actionModule);
 }

 template<typename InputDataType, typename OutputDataType>
 template<typename Archive>
 void RecurrentAttention<InputDataType, OutputDataType>::serialize(
     Archive& ar, const uint32_t /* version */)
 {
   ar(CEREAL_NVP(rho));
   ar(CEREAL_NVP(outSize));
   ar(CEREAL_NVP(forwardStep));
   ar(CEREAL_NVP(backwardStep));

   ar(CEREAL_VARIANT_POINTER(rnnModule));
   ar(CEREAL_VARIANT_POINTER(actionModule));
 }

 } // namespace ann
 } // namespace mlpack

 #endif
mlpack::ann::RecurrentAttention::RecurrentAttention
RecurrentAttention()
Default constructor: this will not give a usable RecurrentAttention object, so be sure to set all the...
Definition: recurrent_attention_impl.hpp:30

mlpack::ann::RecurrentAttention::serialize
void serialize(Archive &ar, const uint32_t)
Serialize the layer.
Definition: recurrent_attention_impl.hpp:211

mlpack::ann::BackwardVisitor
BackwardVisitor executes the Backward() function given the input, error and delta parameter...
Definition: backward_visitor.hpp:28

recurrent_attention.hpp

mlpack::ann::RecurrentAttention::Gradient
OutputDataType const  & Gradient() const
Get the gradient.
Definition: recurrent_attention.hpp:138

mlpack::ann::GradientUpdateVisitor
GradientUpdateVisitor update the gradient parameter given the gradient set.
Definition: gradient_update_visitor.hpp:26

mlpack
Linear algebra utility functions, generally performed on matrices or vectors.
Definition: cv.hpp:1

mlpack::ann::GradientSetVisitor
GradientSetVisitor update the gradient parameter given the gradient set.
Definition: gradient_set_visitor.hpp:26

mlpack::ann::SaveOutputParameterVisitor
SaveOutputParameterVisitor saves the output parameter into the given parameter set.
Definition: save_output_parameter_visitor.hpp:27

mlpack::ann::ForwardVisitor
ForwardVisitor executes the Forward() function given the input and output parameter.
Definition: forward_visitor.hpp:28

CEREAL_VARIANT_POINTER
#define CEREAL_VARIANT_POINTER(T)
Cereal does not support the serialization of raw pointer.
Definition: pointer_variant_wrapper.hpp:155

mlpack::ann::RecurrentAttention::Backward
void Backward(const arma::Mat< eT > &, const arma::Mat< eT > &gy, arma::Mat< eT > &g)
Ordinary feed backward pass of a neural network, calculating the function f(x) by propagating x backw...
Definition: recurrent_attention_impl.hpp:116

mlpack::ann::LoadOutputParameterVisitor
LoadOutputParameterVisitor restores the output parameter using the given parameter set...
Definition: load_output_parameter_visitor.hpp:28

mlpack::ann::RecurrentAttention::Forward
void Forward(const arma::Mat< eT > &input, arma::Mat< eT > &output)
Ordinary feed forward pass of a neural network, evaluating the function f(x) by propagating the activ...
Definition: recurrent_attention_impl.hpp:61