Aakash-kaushik/mlpack/transposed__convolution__impl_8hpp_source.html

 #ifndef MLPACK_METHODS_ANN_LAYER_TRANSPOSED_CONVOLUTION_IMPL_HPP
 #define MLPACK_METHODS_ANN_LAYER_TRANSPOSED_CONVOLUTION_IMPL_HPP

 // In case it hasn't yet been included.
 #include "transposed_convolution.hpp"

 namespace mlpack {
 namespace ann  {

 template<
     typename ForwardConvolutionRule,
     typename BackwardConvolutionRule,
     typename GradientConvolutionRule,
     typename InputDataType,
     typename OutputDataType
 >
 TransposedConvolution<
     ForwardConvolutionRule,
     BackwardConvolutionRule,
     GradientConvolutionRule,
     InputDataType,
     OutputDataType
 >::TransposedConvolution()
 {
   // Nothing to do here.
 }

 template<
     typename ForwardConvolutionRule,
     typename BackwardConvolutionRule,
     typename GradientConvolutionRule,
     typename InputDataType,
     typename OutputDataType
 >
 TransposedConvolution<
     ForwardConvolutionRule,
     BackwardConvolutionRule,
     GradientConvolutionRule,
     InputDataType,
     OutputDataType
 >::TransposedConvolution(
     const size_t inSize,
     const size_t outSize,
     const size_t kernelWidth,
     const size_t kernelHeight,
     const size_t strideWidth,
     const size_t strideHeight,
     const size_t padW,
     const size_t padH,
     const size_t inputWidth,
     const size_t inputHeight,
     const size_t outputWidth,
     const size_t outputHeight,
     const std::string& paddingType) :
     TransposedConvolution(
       inSize,
       outSize,
       kernelWidth,
       kernelHeight,
       strideWidth,
       strideHeight,
       std::tuple<size_t, size_t>(padW, padW),
       std::tuple<size_t, size_t>(padH, padH),
       inputWidth,
       inputHeight,
       outputWidth,
       outputHeight,
       paddingType)
 {
   // Nothing to do here.
 }

 template<
     typename ForwardConvolutionRule,
     typename BackwardConvolutionRule,
     typename GradientConvolutionRule,
     typename InputDataType,
     typename OutputDataType
 >
 TransposedConvolution<
     ForwardConvolutionRule,
     BackwardConvolutionRule,
     GradientConvolutionRule,
     InputDataType,
     OutputDataType
 >::TransposedConvolution(
     const size_t inSize,
     const size_t outSize,
     const size_t kernelWidth,
     const size_t kernelHeight,
     const size_t strideWidth,
     const size_t strideHeight,
     const std::tuple<size_t, size_t>& padW,
     const std::tuple<size_t, size_t>& padH,
     const size_t inputWidth,
     const size_t inputHeight,
     const size_t outputWidth,
     const size_t outputHeight,
     const std::string& paddingType) :
     inSize(inSize),
     outSize(outSize),
     kernelWidth(kernelWidth),
     kernelHeight(kernelHeight),
     strideWidth(strideWidth),
     strideHeight(strideHeight),
     padWLeft(std::get<0>(padW)),
     padWRight(std::get<1>(padW)),
     padHBottom(std::get<1>(padH)),
     padHTop(std::get<0>(padH)),
     inputWidth(inputWidth),
     inputHeight(inputHeight),
     outputWidth(outputWidth),
     outputHeight(outputHeight)
 {
   weights.set_size(WeightSize(), 1);
   // Transform paddingType to lowercase.
   const std::string paddingTypeLow = util::ToLower(paddingType);

   if (paddingTypeLow == "valid")
   {
     // Set Padding to 0.
     padWLeft = 0;
     padWRight = 0;
     padHTop = 0;
     padHBottom = 0;
   }
   else if (paddingTypeLow == "same")
   {
     InitializeSamePadding();
   }

   const size_t totalPadWidth = padWLeft + padWRight;
   const size_t totalPadHeight = padHTop + padHBottom;

   aW = (outputWidth + totalPadWidth - kernelWidth) % strideWidth;
   aH = (outputHeight + totalPadHeight - kernelHeight) % strideHeight;

   const size_t padWidthLeftForward = kernelWidth - padWLeft - 1;
   const size_t padHeightTopForward = kernelHeight - padHTop - 1;
   const size_t padWidthRightForward = kernelWidth - padWRight - 1;
   const size_t padHeightBottomtForward = kernelHeight - padHBottom - 1;

   paddingForward = ann::Padding<>(padWidthLeftForward,
       padWidthRightForward + aW, padHeightTopForward,
       padHeightBottomtForward + aH);
   paddingBackward = ann::Padding<>(padWLeft, padWRight, padHTop, padHBottom);

   // Check if the output height and width are possible given the other
   // parameters of the layer.
   if (outputWidth != 0 && outputHeight != 0 &&
       (outputWidth != strideWidth * (inputWidth - 1) +
       aW + kernelWidth - totalPadWidth ||
       outputHeight != strideHeight * (inputHeight - 1) +
       aH + kernelHeight - totalPadHeight))
   {
     Log::Fatal << "The output width / output height is not possible given "
                << "the other parameters of the layer." << std::endl;
   }
 }

 template<
     typename ForwardConvolutionRule,
     typename BackwardConvolutionRule,
     typename GradientConvolutionRule,
     typename InputDataType,
     typename OutputDataType
 >
 void TransposedConvolution<
     ForwardConvolutionRule,
     BackwardConvolutionRule,
     GradientConvolutionRule,
     InputDataType,
     OutputDataType
 >::Reset()
 {
     weight = arma::cube(weights.memptr(), kernelWidth, kernelHeight,
         outSize * inSize, false, false);
     bias = arma::mat(weights.memptr() + weight.n_elem,
         outSize, 1, false, false);
 }

 template<
     typename ForwardConvolutionRule,
     typename BackwardConvolutionRule,
     typename GradientConvolutionRule,
     typename InputDataType,
     typename OutputDataType
 >
 template<typename eT>
 void TransposedConvolution<
     ForwardConvolutionRule,
     BackwardConvolutionRule,
     GradientConvolutionRule,
     InputDataType,
     OutputDataType
 >::Forward(const arma::Mat<eT>& input, arma::Mat<eT>& output)
 {
   batchSize = input.n_cols;
   arma::cube inputTemp(const_cast<arma::Mat<eT>&>(input).memptr(),
       inputWidth, inputHeight, inSize * batchSize, false, false);

   if (strideWidth > 1 || strideHeight > 1)
   {
     InsertZeros(inputTemp, strideWidth, strideHeight, inputExpandedTemp);

     if (paddingForward.PadWLeft() != 0 || paddingForward.PadWRight() != 0 ||
         paddingForward.PadHTop() != 0 || paddingForward.PadHBottom() != 0)
     {
       inputPaddedTemp.set_size(inputExpandedTemp.n_rows +
           paddingForward.PadWLeft() + paddingForward.PadWRight(),
           inputExpandedTemp.n_cols + paddingForward.PadHTop() +
           paddingForward.PadHBottom(), inputExpandedTemp.n_slices);

       for (size_t i = 0; i < inputExpandedTemp.n_slices; ++i)
       {
         paddingForward.Forward(inputExpandedTemp.slice(i),
             inputPaddedTemp.slice(i));
       }
     }
     else
     {
       inputPaddedTemp = arma::Cube<eT>(inputExpandedTemp.memptr(),
           inputExpandedTemp.n_rows, inputExpandedTemp.n_cols,
           inputExpandedTemp.n_slices, false, false);;
     }
   }
   else if (paddingForward.PadWLeft() != 0 ||
            paddingForward.PadWRight() != 0 ||
            paddingForward.PadHTop() != 0 ||
            paddingForward.PadHBottom() != 0)
   {
     inputPaddedTemp.set_size(inputTemp.n_rows + paddingForward.PadWLeft() +
         paddingForward.PadWRight(), inputTemp.n_cols +
         paddingForward.PadHTop() + paddingForward.PadHBottom(),
         inputTemp.n_slices);

     for (size_t i = 0; i < inputTemp.n_slices; ++i)
     {
       paddingForward.Forward(inputTemp.slice(i), inputPaddedTemp.slice(i));
     }
   }

   output.set_size(outputWidth * outputHeight * outSize, batchSize);
   outputTemp = arma::Cube<eT>(output.memptr(), outputWidth, outputHeight,
       outSize * batchSize, false, false);
   outputTemp.zeros();

   for (size_t outMap = 0, outMapIdx = 0, batchCount = 0; outMap <
       outSize * batchSize; outMap++)
   {
     if (outMap != 0 && outMap % outSize == 0)
     {
       batchCount++;
       outMapIdx = 0;
     }

     for (size_t inMap = 0; inMap < inSize; inMap++, outMapIdx++)
     {
       arma::Mat<eT> convOutput, rotatedFilter;
       Rotate180(weight.slice(outMapIdx), rotatedFilter);

       if (strideWidth > 1 ||
           strideHeight > 1 ||
           paddingForward.PadWLeft() != 0 ||
           paddingForward.PadWRight() != 0 ||
           paddingForward.PadHTop() != 0 ||
           paddingForward.PadHBottom() != 0)
       {
         ForwardConvolutionRule::Convolution(inputPaddedTemp.slice(inMap +
             batchCount * inSize), rotatedFilter, convOutput, 1, 1);
       }
       else
       {
         ForwardConvolutionRule::Convolution(inputTemp.slice(inMap +
             batchCount * inSize), rotatedFilter, convOutput, 1, 1);
       }

       outputTemp.slice(outMap) += convOutput;
     }

     outputTemp.slice(outMap) += bias(outMap % outSize);
   }
 }

 template<
     typename ForwardConvolutionRule,
     typename BackwardConvolutionRule,
     typename GradientConvolutionRule,
     typename InputDataType,
     typename OutputDataType
 >
 template<typename eT>
 void TransposedConvolution<
     ForwardConvolutionRule,
     BackwardConvolutionRule,
     GradientConvolutionRule,
     InputDataType,
     OutputDataType
 >::Backward(
     const arma::Mat<eT>& /* input */, const arma::Mat<eT>& gy, arma::Mat<eT>& g)
 {
   arma::Cube<eT> mappedError(((arma::Mat<eT>&) gy).memptr(), outputWidth,
       outputHeight, outSize * batchSize, false, false);
   arma::Cube<eT> mappedErrorPadded;
   if (paddingBackward.PadWLeft() != 0 || paddingBackward.PadWRight() != 0 ||
       paddingBackward.PadHTop() != 0 || paddingBackward.PadHBottom() != 0)
   {
     mappedErrorPadded.set_size(mappedError.n_rows +
         paddingBackward.PadWLeft() + paddingBackward.PadWRight(),
         mappedError.n_cols + paddingBackward.PadHTop() +
         paddingBackward.PadHBottom(), mappedError.n_slices);

     for (size_t i = 0; i < mappedError.n_slices; ++i)
     {
       paddingBackward.Forward(mappedError.slice(i),
           mappedErrorPadded.slice(i));
     }
   }
   g.set_size(inputWidth * inputHeight * inSize, batchSize);
   gTemp = arma::Cube<eT>(g.memptr(), inputWidth, inputHeight, inSize *
       batchSize, false, false);

   gTemp.zeros();

   for (size_t outMap = 0, outMapIdx = 0, batchCount = 0; outMap <
       outSize * batchSize; outMap++)
   {
     if (outMap != 0 && outMap % outSize == 0)
     {
       batchCount++;
       outMapIdx = 0;
     }

     for (size_t inMap = 0; inMap < inSize; inMap++, outMapIdx++)
     {
       arma::Mat<eT> output;

       if (paddingBackward.PadWLeft() != 0 || paddingBackward.PadWRight() != 0 ||
           paddingBackward.PadHTop() != 0 || paddingBackward.PadHBottom() != 0)
       {
         BackwardConvolutionRule::Convolution(mappedErrorPadded.slice(outMap),
             weight.slice(outMapIdx), output, strideWidth, strideHeight);
       }
       else
       {
         BackwardConvolutionRule::Convolution(mappedError.slice(outMap),
             weight.slice(outMapIdx), output, strideWidth, strideHeight);
       }

       gTemp.slice(inMap + batchCount * inSize) += output;
     }
   }
 }

 template<
     typename ForwardConvolutionRule,
     typename BackwardConvolutionRule,
     typename GradientConvolutionRule,
     typename InputDataType,
     typename OutputDataType
 >
 template<typename eT>
 void TransposedConvolution<
     ForwardConvolutionRule,
     BackwardConvolutionRule,
     GradientConvolutionRule,
     InputDataType,
     OutputDataType
 >::Gradient(
     const arma::Mat<eT>& input,
     const arma::Mat<eT>& error,
     arma::Mat<eT>& gradient)
 {
   arma::Cube<eT> mappedError(((arma::Mat<eT>&) error).memptr(), outputWidth,
       outputHeight, outSize * batchSize, false, false);
   arma::cube inputTemp(const_cast<arma::Mat<eT>&>(input).memptr(),
       inputWidth, inputHeight, inSize * batchSize, false, false);

   gradient.set_size(weights.n_elem, 1);
   gradientTemp = arma::Cube<eT>(gradient.memptr(), weight.n_rows,
       weight.n_cols, weight.n_slices, false, false);
   gradientTemp.zeros();

   arma::Mat<eT> inputSlice, output, deltaSlice, rotatedOutput;

   for (size_t outMap = 0, outMapIdx = 0, batchCount = 0; outMap <
       outSize * batchSize; outMap++)
   {
     if (outMap != 0 && outMap % outSize == 0)
     {
       batchCount++;
       outMapIdx = 0;
     }

     deltaSlice = mappedError.slice(outMap);

     for (size_t inMap = 0; inMap < inSize; inMap++, outMapIdx++)
     {
       if (strideWidth > 1 ||
           strideHeight > 1 ||
           paddingForward.PadWLeft() != 0 ||
           paddingForward.PadWRight() != 0 ||
           paddingForward.PadHTop() != 0 ||
           paddingForward.PadHBottom() != 0)
       {
         inputSlice = inputPaddedTemp.slice(inMap + batchCount * inSize);
       }
       else
       {
         inputSlice = inputTemp.slice(inMap + batchCount * inSize);
       }

       GradientConvolutionRule::Convolution(inputSlice, deltaSlice,
           output, 1, 1);
       Rotate180(output, rotatedOutput);
       gradientTemp.slice(outMapIdx) += rotatedOutput;
     }

     gradient.submat(weight.n_elem + (outMap % outSize), 0, weight.n_elem +
         (outMap % outSize), 0) = arma::accu(mappedError.slices(outMap, outMap));
   }
 }

 template<
     typename ForwardConvolutionRule,
     typename BackwardConvolutionRule,
     typename GradientConvolutionRule,
     typename InputDataType,
     typename OutputDataType
 >
 template<typename Archive>
 void TransposedConvolution<
     ForwardConvolutionRule,
     BackwardConvolutionRule,
     GradientConvolutionRule,
     InputDataType,
     OutputDataType
 >::serialize(Archive& ar, const uint32_t /* version */)
 {
   ar(CEREAL_NVP(inSize));
   ar(CEREAL_NVP(outSize));
   ar(CEREAL_NVP(batchSize));
   ar(CEREAL_NVP(kernelWidth));
   ar(CEREAL_NVP(kernelHeight));
   ar(CEREAL_NVP(strideWidth));
   ar(CEREAL_NVP(strideHeight));
   ar(CEREAL_NVP(padWLeft));
   ar(CEREAL_NVP(padWRight));
   ar(CEREAL_NVP(padHBottom));
   ar(CEREAL_NVP(padHTop));
   ar(CEREAL_NVP(inputWidth));
   ar(CEREAL_NVP(inputHeight));
   ar(CEREAL_NVP(outputWidth));
   ar(CEREAL_NVP(outputHeight));
   ar(CEREAL_NVP(paddingForward));
   ar(CEREAL_NVP(paddingBackward));

   if (cereal::is_loading<Archive>())
   {
     weights.set_size((outSize * inSize * kernelWidth * kernelHeight) + outSize,
         1);
     size_t totalPadWidth = padWLeft + padWRight;
     size_t totalPadHeight = padHTop + padHBottom;
     aW = (outputWidth + kernelWidth - totalPadWidth - 2) % strideWidth;
     aH = (outputHeight + kernelHeight - totalPadHeight - 2) % strideHeight;
   }
 }

 template<
     typename ForwardConvolutionRule,
     typename BackwardConvolutionRule,
     typename GradientConvolutionRule,
     typename InputDataType,
     typename OutputDataType
 >
 void TransposedConvolution<
     ForwardConvolutionRule,
     BackwardConvolutionRule,
     GradientConvolutionRule,
     InputDataType,
     OutputDataType
 >::InitializeSamePadding(){
   const size_t totalHorizontalPadding  = (strideWidth - 1) * inputWidth +
       kernelWidth - strideWidth;
   const size_t totalVerticalPadding = (strideHeight - 1) * inputHeight +
       kernelHeight - strideHeight;

   padWLeft = totalVerticalPadding / 2;
   padWRight = totalVerticalPadding - totalVerticalPadding / 2;
   padHTop = totalHorizontalPadding / 2;
   padHBottom = totalHorizontalPadding - totalHorizontalPadding / 2;
 }

 } // namespace ann
 } // namespace mlpack

 #endif
mlpack::ann::TransposedConvolution::serialize
void serialize(Archive &ar, const uint32_t)
Serialize the layer.
Definition: transposed_convolution_impl.hpp:450

mlpack::Log::Fatal
static MLPACK_EXPORT util::PrefixedOutStream Fatal
Prints fatal messages prefixed with [FATAL], then terminates the program.
Definition: log.hpp:90

mlpack
Linear algebra utility functions, generally performed on matrices or vectors.
Definition: cv.hpp:1

mlpack::ann::Padding
Implementation of the Padding module class.
Definition: layer_types.hpp:87

mlpack::ann::TransposedConvolution
Implementation of the Transposed Convolution class.
Definition: layer_types.hpp:188

mlpack::ann::TransposedConvolution::Gradient
OutputDataType const  & Gradient() const
Get the gradient.
Definition: transposed_convolution.hpp:207

std
Definition: pointer_wrapper.hpp:23

mlpack::ann::Padding::PadWLeft
size_t PadWLeft() const
Get the left padding width.
Definition: padding.hpp:89

mlpack::ann::Padding::PadWRight
size_t PadWRight() const
Get the right padding width.
Definition: padding.hpp:94

mlpack::ann::TransposedConvolution::Backward
void Backward(const arma::Mat< eT > &, const arma::Mat< eT > &gy, arma::Mat< eT > &g)
Ordinary feed backward pass of a neural network, calculating the function f(x) by propagating x backw...
Definition: transposed_convolution_impl.hpp:311

mlpack::ann::TransposedConvolution::TransposedConvolution
TransposedConvolution()
Create the Transposed Convolution object.
Definition: transposed_convolution_impl.hpp:35

transposed_convolution.hpp

mlpack::ann::Padding::Forward
void Forward(const arma::Mat< eT > &input, arma::Mat< eT > &output)
Ordinary feed forward pass of a neural network, evaluating the function f(x) by propagating the activ...
Definition: padding_impl.hpp:44

mlpack::ann::TransposedConvolution::WeightSize
size_t WeightSize() const
Get the size of the weight matrix.
Definition: transposed_convolution.hpp:284

mlpack::ann::Padding::PadHTop
size_t PadHTop() const
Get the top padding width.
Definition: padding.hpp:99

mlpack::ann::Padding::PadHBottom
size_t PadHBottom() const
Get the bottom padding width.
Definition: padding.hpp:104

mlpack::ann::TransposedConvolution::Forward
void Forward(const arma::Mat< eT > &input, arma::Mat< eT > &output)
Ordinary feed forward pass of a neural network, evaluating the function f(x) by propagating the activ...
Definition: transposed_convolution_impl.hpp:208