wichtounet/etl/prob__pooling_8hpp_source.html

 //=======================================================================
 // Copyright (c) 2014-2023 Baptiste Wicht
 // Distributed under the terms of the MIT License.
 // (See accompanying file LICENSE or copy at
 //  http://opensource.org/licenses/MIT)
 //=======================================================================

 #pragma once

 namespace etl::impl::standard {

 template <typename T>
 inline void pmp_h_kernel_2x2(etl::dyn_matrix<T, 2>& exp_sub, etl::dyn_matrix<T, 2>& base) {
     const size_t M = etl::dim<0>(exp_sub);
     const size_t N = etl::dim<1>(exp_sub);

     for (size_t m = 0; m < M; ++m) {
         const auto start_mm = (m >> 1) << 1;

         for (size_t n = 0; n < N; ++n) {
             const auto start_nn = (n >> 1) << 1;

             base(m, n) = exp_sub(start_mm + 0, start_nn + 0) + exp_sub(start_mm + 0, start_nn + 1) + exp_sub(start_mm + 1, start_nn + 0)
                          + exp_sub(start_mm + 1, start_nn + 1);
         }
     }
 }

 template <size_t C1, size_t C2, typename T>
 inline void pmp_h_kernel(etl::dyn_matrix<T, 2>& exp_sub, etl::dyn_matrix<T, 2>& base) {
     const size_t M = etl::dim<0>(exp_sub);
     const size_t N = etl::dim<1>(exp_sub);

     for (size_t m = 0; m < M; ++m) {
         const auto start_mm = (m / C1) * C1;

         for (size_t n = 0; n < N; ++n) {
             const auto start_nn = (n / C2) * C2;

             auto p = T(0);

             for (size_t mm = start_mm; mm < start_mm + C1; ++mm) {
                 for (size_t nn = start_nn; nn < start_nn + C2; ++nn) {
                     p += exp_sub(mm, nn);
                 }
             }

             base(m, n) = p;
         }
     }
 }

 template <typename T>
 inline void pmp_h_kernel(etl::dyn_matrix<T, 2>& exp_sub, etl::dyn_matrix<T, 2>& base, size_t c1, size_t c2) {
     const size_t M = etl::dim<0>(exp_sub);
     const size_t N = etl::dim<1>(exp_sub);

     for (size_t m = 0; m < M; ++m) {
         const auto start_mm = (m / c1) * c1;

         for (size_t n = 0; n < N; ++n) {
             const auto start_nn = (n / c2) * c2;

             auto p = T(0);

             for (size_t mm = start_mm; mm < start_mm + c1; ++mm) {
                 for (size_t nn = start_nn; nn < start_nn + c2; ++nn) {
                     p += exp_sub(mm, nn);
                 }
             }

             base(m, n) = p;
         }
     }
 }

 struct pmp_h_impl {
     template <typename A>
     static constexpr bool gpu_computable = false;

     template <size_t C1, size_t C2, size_t S1, size_t S2, size_t P1, size_t P2, etl_2d A, typename C>
     static void apply(A&& a, C&& c) {
         static_assert(S1 == C1, "pmp_h does not support strides");
         static_assert(S2 == C2, "pmp_h does not support strides");
         static_assert(P1 == 0, "pmp_h does not support padding");
         static_assert(P2 == 0, "pmp_h does not support padding");

         using T = value_t<A>;

         const size_t M = etl::dim<0>(a);
         const size_t N = etl::dim<1>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M, N);

         CPU_SECTION {
             exp_sub = exp(a);

             if (C1 == 2 && C2 == 2) {
                 pmp_h_kernel_2x2(exp_sub, base);
             } else {
                 pmp_h_kernel<C1, C2>(exp_sub, base);
             }

             c = exp_sub / (1.0 + base);
         }
     }

     template <size_t C1, size_t C2, size_t S1, size_t S2, size_t P1, size_t P2, etl_3d A, typename C>
     static void apply(A&& a, C&& c) {
         static_assert(S1 == C1, "pmp_h does not support strides");
         static_assert(S2 == C2, "pmp_h does not support strides");
         static_assert(P1 == 0, "pmp_h does not support padding");
         static_assert(P2 == 0, "pmp_h does not support padding");

         using T = value_t<A>;

         const size_t L = etl::dim<0>(a);
         const size_t M = etl::dim<1>(a);
         const size_t N = etl::dim<2>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M, N);

         CPU_SECTION {
             if (C1 == 2 && C2 == 2) {
                 for (size_t l = 0; l < L; ++l) {
                     exp_sub = exp(a(l));

                     pmp_h_kernel_2x2(exp_sub, base);

                     c(l) = exp_sub / (1.0 + base);
                 }
             } else {
                 for (size_t l = 0; l < L; ++l) {
                     exp_sub = exp(a(l));

                     pmp_h_kernel<C1, C2>(exp_sub, base);

                     c(l) = exp_sub / (1.0 + base);
                 }
             }
         }
     }

     template <size_t C1, size_t C2, size_t S1, size_t S2, size_t P1, size_t P2, etl_4d A, typename C>
     static void apply(A&& a, C&& c) {
         static_assert(S1 == C1, "pmp_h does not support strides");
         static_assert(S2 == C2, "pmp_h does not support strides");
         static_assert(P1 == 0, "pmp_h does not support padding");
         static_assert(P2 == 0, "pmp_h does not support padding");

         using T = value_t<A>;

         const size_t K = etl::dim<0>(a);
         const size_t L = etl::dim<1>(a);
         const size_t M = etl::dim<2>(a);
         const size_t N = etl::dim<3>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M, N);

         CPU_SECTION {
             if (C1 == 2 && C2 == 2) {
                 for (size_t k = 0; k < K; ++k) {
                     for (size_t l = 0; l < L; ++l) {
                         exp_sub = exp(a(k)(l));

                         pmp_h_kernel_2x2(exp_sub, base);

                         c(k)(l) = exp_sub / (1.0 + base);
                     }
                 }
             } else {
                 for (size_t k = 0; k < K; ++k) {
                     for (size_t l = 0; l < L; ++l) {
                         exp_sub = exp(a(k)(l));

                         pmp_h_kernel<C1, C2>(exp_sub, base);

                         c(k)(l) = exp_sub / (1.0 + base);
                     }
                 }
             }
         }
     }
 };

 struct dyn_pmp_h_impl {
     template <typename A>
     static constexpr bool gpu_computable = false;

     template <etl_2d A, typename C>
     static void apply(A&& a, C&& c, size_t c1, size_t c2, [[maybe_unused]] size_t s1, [[maybe_unused]] size_t s2, [[maybe_unused]] size_t p1, [[maybe_unused]] size_t p2) {
         cpp_assert(s1 == c1, "pmp_p does not support strides");
         cpp_assert(s2 == c2, "pmp_p does not support strides");
         cpp_assert(p1 == 0, "pmp_p does not support pooling");
         cpp_assert(p2 == 0, "pmp_p does not support pooling");

         using T = value_t<A>;

         const size_t M = etl::dim<0>(a);
         const size_t N = etl::dim<1>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M, N);

         CPU_SECTION {
             exp_sub = exp(a);

             if (c1 == 2 && c2 == 2) {
                 pmp_h_kernel_2x2(exp_sub, base);
             } else {
                 pmp_h_kernel(exp_sub, base, c1, c2);
             }

             c = exp_sub / (1.0 + base);
         }
     }

     template <etl_3d A, typename C>
     static void apply(A&& a, C&& c, size_t c1, size_t c2, [[maybe_unused]] size_t s1, [[maybe_unused]] size_t s2, [[maybe_unused]] size_t p1, [[maybe_unused]] size_t p2) {
         cpp_assert(s1 == c1, "pmp_p does not support strides");
         cpp_assert(s2 == c2, "pmp_p does not support strides");
         cpp_assert(p1 == 0, "pmp_p does not support pooling");
         cpp_assert(p2 == 0, "pmp_p does not support pooling");

         using T = value_t<A>;

         const size_t L = etl::dim<0>(a);
         const size_t M = etl::dim<1>(a);
         const size_t N = etl::dim<2>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M, N);

         CPU_SECTION {
             if (c1 == 2 && c2 == 2) {
                 for (size_t l = 0; l < L; ++l) {
                     exp_sub = exp(a(l));

                     pmp_h_kernel_2x2(exp_sub, base);

                     c(l) = exp_sub / (1.0 + base);
                 }
             } else {
                 for (size_t l = 0; l < L; ++l) {
                     exp_sub = exp(a(l));

                     pmp_h_kernel(exp_sub, base, c1, c2);

                     c(l) = exp_sub / (1.0 + base);
                 }
             }
         }
     }

     template <etl_4d A, typename C>
     static void apply(A&& a, C&& c, size_t c1, size_t c2, [[maybe_unused]] size_t s1, [[maybe_unused]] size_t s2, [[maybe_unused]] size_t p1, [[maybe_unused]] size_t p2) {
         cpp_assert(s1 == c1, "pmp_p does not support strides");
         cpp_assert(s2 == c2, "pmp_p does not support strides");
         cpp_assert(p1 == 0, "pmp_p does not support pooling");
         cpp_assert(p2 == 0, "pmp_p does not support pooling");

         using T = value_t<A>;

         const size_t K = etl::dim<0>(a);
         const size_t L = etl::dim<1>(a);
         const size_t M = etl::dim<2>(a);
         const size_t N = etl::dim<3>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M, N);

         CPU_SECTION {
             if (c1 == 2 && c2 == 2) {
                 for (size_t k = 0; k < K; ++k) {
                     for (size_t l = 0; l < L; ++l) {
                         exp_sub = exp(a(k)(l));

                         pmp_h_kernel_2x2(exp_sub, base);

                         c(k)(l) = exp_sub / (1.0 + base);
                     }
                 }
             } else {
                 for (size_t k = 0; k < K; ++k) {
                     for (size_t l = 0; l < L; ++l) {
                         exp_sub = exp(a(k)(l));

                         pmp_h_kernel(exp_sub, base, c1, c2);

                         c(k)(l) = exp_sub / (1.0 + base);
                     }
                 }
             }
         }
     }
 };

 template <typename T>
 inline void pmp_p_kernel_2x2(etl::dyn_matrix<T, 2>& exp_sub, etl::dyn_matrix<T, 2>& base) {
     const size_t M = etl::dim<0>(exp_sub);
     const size_t N = etl::dim<1>(exp_sub);

     for (size_t m = 0; m < M / 2; ++m) {
         const auto start_mm = m * 2;

         for (size_t n = 0; n < N / 2; ++n) {
             const auto start_nn = n * 2;

             base(m, n) = exp_sub(start_mm + 0, start_nn + 0) + exp_sub(start_mm + 0, start_nn + 1) + exp_sub(start_mm + 1, start_nn + 0)
                          + exp_sub(start_mm + 1, start_nn + 1);
         }
     }
 }

 template <size_t C1, size_t C2, typename T>
 inline void pmp_p_kernel(etl::dyn_matrix<T, 2>& exp_sub, etl::dyn_matrix<T, 2>& base) {
     const size_t M = etl::dim<0>(exp_sub);
     const size_t N = etl::dim<1>(exp_sub);

     for (size_t m = 0; m < M / C1; ++m) {
         const auto start_mm = m * C1;

         for (size_t n = 0; n < N / C2; ++n) {
             const auto start_nn = n * C2;

             auto p = T(0);

             for (size_t mm = start_mm; mm < start_mm + C1; ++mm) {
                 for (size_t nn = start_nn; nn < start_nn + C2; ++nn) {
                     p += exp_sub(mm, nn);
                 }
             }

             base(m, n) = p;
         }
     }
 }

 template <typename T>
 inline void pmp_p_kernel(etl::dyn_matrix<T, 2>& exp_sub, etl::dyn_matrix<T, 2>& base, size_t c1, size_t c2) {
     const size_t M = etl::dim<0>(exp_sub);
     const size_t N = etl::dim<1>(exp_sub);

     for (size_t m = 0; m < M / c1; ++m) {
         const auto start_mm = m * c1;

         for (size_t n = 0; n < N / c2; ++n) {
             const auto start_nn = n * c2;

             auto p = T(0);

             for (size_t mm = start_mm; mm < start_mm + c1; ++mm) {
                 for (size_t nn = start_nn; nn < start_nn + c2; ++nn) {
                     p += exp_sub(mm, nn);
                 }
             }

             base(m, n) = p;
         }
     }
 }

 struct pmp_p_impl {
     template <typename A>
     static constexpr bool gpu_computable = false;

     template <size_t C1, size_t C2, size_t S1, size_t S2, size_t P1, size_t P2, etl_2d A, typename C>
     static void apply(A&& a, C&& c) {
         static_assert(S1 == C1, "pmp_p does not support strides");
         static_assert(S2 == C2, "pmp_p does not support strides");
         static_assert(P1 == 0, "pmp_p does not support padding");
         static_assert(P2 == 0, "pmp_p does not support padding");

         using T = value_t<A>;

         const size_t M = etl::dim<0>(a);
         const size_t N = etl::dim<1>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M / C1, N / C2);

         exp_sub = exp(a);

         if (C1 == 2 && C2 == 2) {
             pmp_p_kernel_2x2(exp_sub, base);
         } else {
             pmp_p_kernel<C1, C2>(exp_sub, base);
         }

         c = 1.0 / (1.0 + base);
     }

     template <size_t C1, size_t C2, size_t S1, size_t S2, size_t P1, size_t P2, etl_3d A, typename C>
     static void apply(A&& a, C&& c) {
         static_assert(S1 == C1, "pmp_p does not support strides");
         static_assert(S2 == C2, "pmp_p does not support strides");
         static_assert(P1 == 0, "pmp_p does not support padding");
         static_assert(P2 == 0, "pmp_p does not support padding");

         using T = value_t<A>;

         const size_t L = etl::dim<0>(a);
         const size_t M = etl::dim<1>(a);
         const size_t N = etl::dim<2>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M / C1, N / C2);

         if (C1 == 2 && C2 == 2) {
             for (size_t l = 0; l < L; ++l) {
                 exp_sub = exp(a(l));

                 pmp_p_kernel_2x2(exp_sub, base);

                 c(l) = 1.0 / (1.0 + base);
             }
         } else {
             for (size_t l = 0; l < L; ++l) {
                 exp_sub = exp(a(l));

                 pmp_p_kernel<C1, C2>(exp_sub, base);

                 c(l) = 1.0 / (1.0 + base);
             }
         }
     }

     template <size_t C1, size_t C2, size_t S1, size_t S2, size_t P1, size_t P2, etl_4d A, typename C>
     static void apply(A&& a, C&& c) {
         static_assert(S1 == C1, "pmp_p does not support strides");
         static_assert(S2 == C2, "pmp_p does not support strides");
         static_assert(P1 == 0, "pmp_p does not support padding");
         static_assert(P2 == 0, "pmp_p does not support padding");

         using T = value_t<A>;

         const size_t K = etl::dim<0>(a);
         const size_t L = etl::dim<1>(a);
         const size_t M = etl::dim<2>(a);
         const size_t N = etl::dim<3>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M / C1, N / C2);

         if (C1 == 2 && C2 == 2) {
             for (size_t k = 0; k < K; ++k) {
                 for (size_t l = 0; l < L; ++l) {
                     exp_sub = exp(a(k)(l));

                     pmp_p_kernel_2x2(exp_sub, base);

                     c(k)(l) = 1.0 / (1.0 + base);
                 }
             }
         } else {
             for (size_t k = 0; k < K; ++k) {
                 for (size_t l = 0; l < L; ++l) {
                     exp_sub = exp(a(k)(l));

                     pmp_p_kernel<C1, C2>(exp_sub, base);

                     c(k)(l) = 1.0 / (1.0 + base);
                 }
             }
         }
     }
 };

 struct dyn_pmp_p_impl {
     template <typename A>
     static constexpr bool gpu_computable = false;

     template <etl_2d A, typename C>
     static void apply(A&& a, C&& c, size_t c1, size_t c2, [[maybe_unused]] size_t s1, [[maybe_unused]] size_t s2, [[maybe_unused]] size_t p1, [[maybe_unused]] size_t p2) {
         cpp_assert(s1 == c1, "pmp_p does not support strides");
         cpp_assert(s2 == c2, "pmp_p does not support strides");
         cpp_assert(p1 == 0, "pmp_p does not support pooling");
         cpp_assert(p2 == 0, "pmp_p does not support pooling");

         using T = value_t<A>;

         const size_t M = etl::dim<0>(a);
         const size_t N = etl::dim<1>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M / c1, N / c2);

         exp_sub = exp(a);

         if (c1 == 2 && c2 == 2) {
             pmp_p_kernel_2x2(exp_sub, base);
         } else {
             pmp_p_kernel(exp_sub, base, c1, c2);
         }

         c = 1.0 / (1.0 + base);
     }

     template <etl_3d A, typename C>
     static void apply(A&& a, C&& c, size_t c1, size_t c2, [[maybe_unused]] size_t s1, [[maybe_unused]] size_t s2, [[maybe_unused]] size_t p1, [[maybe_unused]] size_t p2) {
         cpp_assert(s1 == c1, "pmp_p does not support strides");
         cpp_assert(s2 == c2, "pmp_p does not support strides");
         cpp_assert(p1 == 0, "pmp_p does not support pooling");
         cpp_assert(p2 == 0, "pmp_p does not support pooling");

         using T = value_t<A>;

         const size_t L = etl::dim<0>(a);
         const size_t M = etl::dim<1>(a);
         const size_t N = etl::dim<2>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M / c1, N / c2);

         if (c1 == 2 && c2 == 2) {
             for (size_t l = 0; l < L; ++l) {
                 exp_sub = exp(a(l));

                 pmp_p_kernel_2x2(exp_sub, base);

                 c(l) = 1.0 / (1.0 + base);
             }
         } else {
             for (size_t l = 0; l < L; ++l) {
                 exp_sub = exp(a(l));

                 pmp_p_kernel(exp_sub, base, c1, c2);

                 c(l) = 1.0 / (1.0 + base);
             }
         }
     }

     template <etl_4d A, typename C>
     static void apply(A&& a, C&& c, size_t c1, size_t c2, [[maybe_unused]] size_t s1, [[maybe_unused]] size_t s2, [[maybe_unused]] size_t p1, [[maybe_unused]] size_t p2) {
         cpp_assert(s1 == c1, "pmp_p does not support strides");
         cpp_assert(s2 == c2, "pmp_p does not support strides");
         cpp_assert(p1 == 0, "pmp_p does not support pooling");
         cpp_assert(p2 == 0, "pmp_p does not support pooling");

         using T = value_t<A>;

         const size_t K = etl::dim<0>(a);
         const size_t L = etl::dim<1>(a);
         const size_t M = etl::dim<2>(a);
         const size_t N = etl::dim<3>(a);

         etl::dyn_matrix<T, 2> exp_sub(M, N);
         etl::dyn_matrix<T, 2> base(M / c1, N / c2);

         if (c1 == 2 && c2 == 2) {
             for (size_t k = 0; k < K; ++k) {
                 for (size_t l = 0; l < L; ++l) {
                     exp_sub = exp(a(k)(l));

                     pmp_p_kernel_2x2(exp_sub, base);

                     c(k)(l) = 1.0 / (1.0 + base);
                 }
             }
         } else {
             for (size_t k = 0; k < K; ++k) {
                 for (size_t l = 0; l < L; ++l) {
                     exp_sub = exp(a(k)(l));

                     pmp_p_kernel(exp_sub, base, c1, c2);

                     c(k)(l) = 1.0 / (1.0 + base);
                 }
             }
         }
     }
 };

 } //end of namespace etl::impl::standard
etl::impl::standard
Definition: prob_pooling.hpp:10

etl::impl::standard::dyn_pmp_p_impl::apply
static void apply(A &&a, C &&c, size_t c1, size_t c2, [[maybe_unused]] size_t s1, [[maybe_unused]] size_t s2, [[maybe_unused]] size_t p1, [[maybe_unused]] size_t p2)
Apply the functor.
Definition: prob_pooling.hpp:603

etl::impl::standard::pmp_h_impl::apply
static void apply(A &&a, C &&c)
Apply the functor.
Definition: prob_pooling.hpp:118

etl::impl::standard::pmp_h_impl::gpu_computable
static constexpr bool gpu_computable
Indicates if the temporary expression can be directly evaluated using only GPU.
Definition: prob_pooling.hpp:110

etl::dyn_matrix_impl
Matrix with run-time fixed dimensions.
Definition: dyn.hpp:26

etl::impl::standard::pmp_p_impl::apply
static void apply(A &&a, C &&c)
Apply the functor.
Definition: prob_pooling.hpp:475

etl::exp
auto exp(E &&value) -> detail::unary_helper< E, exp_unary_op >
Apply exponential on each value of the given expression.
Definition: function_expression_builder.hpp:154

etl::impl::standard::pmp_h_impl
2D Implemenetation of Probabilistic Max Pooling for hidden units
Definition: prob_pooling.hpp:104

etl::impl::standard::dyn_pmp_h_impl
Dynamic Implemenetation of Probabilistic Max Pooling for hidden units.
Definition: prob_pooling.hpp:238

etl::value_t
typename decay_traits< E >::value_type value_t
Traits to extract the value type out of an ETL type.
Definition: tmp.hpp:81

etl::impl::standard::pmp_p_impl
Implemenetation of Probabilistic Max Pooling for pooling units.
Definition: prob_pooling.hpp:461

etl::impl::standard::dyn_pmp_h_impl::apply
static void apply(A &&a, C &&c, size_t c1, size_t c2, [[maybe_unused]] size_t s1, [[maybe_unused]] size_t s2, [[maybe_unused]] size_t p1, [[maybe_unused]] size_t p2)
Apply the functor.
Definition: prob_pooling.hpp:252

etl::impl::standard::dyn_pmp_p_impl
Dynamic 4D Implemenetation of Probabilistic Max Pooling for pooling units.
Definition: prob_pooling.hpp:589