rakytap/sequential-quantum-gate-decomposer/optimization__engines_2_adam_8cpp_source.html

 /*
 Created on Fri Jun 26 14:13:26 2020
 Copyright 2020 Peter Rakyta, Ph.D.

 Licensed under the Apache License, Version 2.0 (the "License");
 you may not use this file except in compliance with the License.
 You may obtain a copy of the License at

     http://www.apache.org/licenses/LICENSE-2.0

 Unless required by applicable law or agreed to in writing, software
 distributed under the License is distributed on an "AS IS" BASIS,
 WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 See the License for the specific language governing permissions and
 limitations under the License.

 @author: Peter Rakyta, Ph.D.
 */
 #include "Optimization_Interface.h"
 #include "N_Qubit_Decomposition_Cost_Function.h"
 #include "Adam.h"


 #include <fstream>


 #ifdef __DFE__
 #include "common_DFE.h"
 #endif


 void Optimization_Interface::solve_layer_optimization_problem_ADAM( int num_of_parameters, Matrix_real& solution_guess) {

 #ifdef __DFE__
         if ( qbit_num >= 2 && get_accelerator_num() > 0 ) {
             upload_Umtx_to_DFE();
         }
 #endif


         if (gates.size() == 0 ) {
             return;
         }


         if (solution_guess.size() == 0 ) {
             solution_guess = Matrix_real(num_of_parameters,1);
         }


         if (optimized_parameters_mtx.size() == 0) {
             optimized_parameters_mtx = Matrix_real(1, num_of_parameters);
             memcpy(optimized_parameters_mtx.get_data(), solution_guess.get_data(), num_of_parameters*sizeof(double) );
         }

         int random_shift_count = 0;
         long long sub_iter_idx = 0;
         double current_minimum_hold = current_minimum;


         tbb::tick_count adam_start = tbb::tick_count::now();
         CPU_time = 0.0;

         Adam optimizer;
         optimizer.initialize_moment_and_variance( num_of_parameters );


         // the array storing the optimized parameters
         Matrix_real solution_guess_tmp = Matrix_real( num_of_parameters, 1 );
         memcpy(solution_guess_tmp.get_data(), solution_guess.get_data(), num_of_parameters*sizeof(double) );

         Matrix_real grad_mtx = Matrix_real( num_of_parameters, 1 );


         int ADAM_status = 0;

         int randomization_successful = 0;


         long long max_inner_iterations_loc;
         if ( config.count("max_inner_iterations_adam") > 0 ) {
             config["max_inner_iterations_adam"].get_property( max_inner_iterations_loc );
         }
         else if ( config.count("max_inner_iterations") > 0 ) {
             config["max_inner_iterations"].get_property( max_inner_iterations_loc );
         }
         else {
             max_inner_iterations_loc =max_inner_iterations;
         }

         long long iteration_threshold_of_randomization_loc;
         if ( config.count("randomization_threshold_adam") > 0 ) {
             config["randomization_threshold_adam"].get_property( iteration_threshold_of_randomization_loc );
         }
         else if ( config.count("randomization_threshold") > 0 ) {
             config["randomization_threshold"].get_property( iteration_threshold_of_randomization_loc );
         }
         else {
             iteration_threshold_of_randomization_loc = 2500000;
         }

         long long export_circuit_2_binary_loc;
         if ( config.count("export_circuit_2_binary_adam") > 0 ) {
              config["export_circuit_2_binary_adam"].get_property( export_circuit_2_binary_loc );
         }
         else if ( config.count("export_circuit_2_binary") > 0 ) {
              config["export_circuit_2_binary"].get_property( export_circuit_2_binary_loc );
         }
         else {
             export_circuit_2_binary_loc = 0;
         }


         double optimization_tolerance_loc;
         if ( config.count("optimization_tolerance_adam") > 0 ) {
              config["optimization_tolerance_adam"].get_property( optimization_tolerance_loc );
         }
         else if ( config.count("optimization_tolerance") > 0 ) {
              config["optimization_tolerance"].get_property( optimization_tolerance_loc );
         }
         else {
             optimization_tolerance_loc = optimization_tolerance;
         }


         bool adaptive_eta_loc;
         if ( config.count("adaptive_eta_adam") > 0 ) {
              long long tmp;
              config["adaptive_eta_adam"].get_property( tmp );
              adaptive_eta_loc = (bool)tmp;
         }
         if ( config.count("adaptive_eta") > 0 ) {
              long long tmp;
              config["adaptive_eta"].get_property( tmp );
              adaptive_eta_loc = (bool)tmp;
         }
         else {
             adaptive_eta_loc = adaptive_eta;
         }


        double eta_loc;
         if ( config.count("eta_adam") > 0 ) {
              config["eta_adam"].get_property( eta_loc );
         }
         if ( config.count("eta") > 0 ) {
              config["eta"].get_property( eta_loc );
         }
         else {
             eta_loc = 1e-3;
         }
         optimizer.eta = eta_loc;


         // The number if iterations after which the current results are displed/exported
         int output_periodicity;
         if ( config.count("output_periodicity_cosine") > 0 ) {
              long long value = 1;
              config["output_periodicity_cosine"].get_property( value );
              output_periodicity = (int) value;
         }
         if ( config.count("output_periodicity") > 0 ) {
              long long value = 1;
              config["output_periodicity"].get_property( value );
              output_periodicity = (int) value;
         }
         else {
             output_periodicity = 0;
         }


         double f0 = DBL_MAX;
         std::stringstream sstream;
         sstream << "max_inner_iterations: " << max_inner_iterations_loc << ", randomization threshold: " << iteration_threshold_of_randomization_loc  << std::endl;
         print(sstream, 2);


         for ( long long iter_idx=0; iter_idx<max_inner_iterations_loc; iter_idx++ ) {


             optimization_problem_combined( solution_guess_tmp, &f0, grad_mtx );

             prev_cost_fnv_val = f0;

             if (sub_iter_idx == 1 ) {
                 current_minimum_hold = f0;

                 if ( adaptive_eta_loc )  {
                     optimizer.eta = optimizer.eta > 1e-3 ? optimizer.eta : 1e-3;
                     //std::cout << "reset learning rate to " << optimizer.eta << std::endl;
                 }

             }


             if ((cost_fnc != VQE) && (current_minimum_hold*0.95 > f0 || (current_minimum_hold*0.97 > f0 && f0 < 1e-3) ||  (current_minimum_hold*0.99 > f0 && f0 < 1e-4) )) {
                 sub_iter_idx = 0;
                 current_minimum_hold = f0;
             }

             if (current_minimum > f0 ) {
                 current_minimum = f0;
                 memcpy( optimized_parameters_mtx.get_data(),  solution_guess_tmp.get_data(), num_of_parameters*sizeof(double) );
                 //double new_eta = 1e-3 * f0 * f0;

                 if ( adaptive_eta_loc )  {
                     double new_eta = 1e-3 * f0;
                     optimizer.eta = new_eta > 1e-6 ? new_eta : 1e-6;
                     optimizer.eta = new_eta < 1e-1 ? new_eta : 1e-1;
                 }

                 randomization_successful = 1;
             }

             if ( output_periodicity>0 && iter_idx % output_periodicity == 0 ) {
                 export_current_cost_fnc(current_minimum);
             }

             if ( iter_idx % 5000 == 0 ) {
                 if (cost_fnc != VQE){

                     std::stringstream sstream;
                     sstream << "ADAM: processed iterations " << (double)iter_idx/max_inner_iterations_loc*100 << "\%, current minimum:" << current_minimum << ", current cost function:" << optimization_problem(solution_guess_tmp) << ", sub_iter_idx:" << sub_iter_idx <<std::endl;
                     print(sstream, 0);
                 }
                 else{
                     std::stringstream sstream;
                     sstream << "ADAM: processed iterations " << (double)iter_idx/max_inner_iterations_loc*100 << "\%, current minimum:" << current_minimum <<", sub_iter_idx:" << sub_iter_idx <<std::endl;
                     print(sstream, 0);
                 }
                 if ( export_circuit_2_binary_loc > 0 ) {
                     std::string filename("initial_circuit_iteration.binary");
                     if (project_name != "") {
                         filename=project_name+ "_"  +filename;
                     }
                     export_gate_list_to_binary(optimized_parameters_mtx, this, filename, verbose);
                 }
             }

 //std::cout << grad_norm  << std::endl;
             if (f0 < optimization_tolerance_loc || random_shift_count > random_shift_count_max ) {
                 break;
             }


                 // calculate the gradient norm
                 double norm = 0.0;
                 for ( int grad_idx=0; grad_idx<num_of_parameters; grad_idx++ ) {
                     norm += grad_mtx[grad_idx]*grad_mtx[grad_idx];
                 }
                 norm = std::sqrt(norm);

 //grad_mtx.print_matrix();
 /*
             if ( ADAM_status == 0 && norm > 0.01 && optimizer.eta < 1e-4) {

                 std::uniform_real_distribution<> distrib_prob(0.0, 1.0);
                 if ( distrib_prob(gen) < 0.05 ) {
                     optimizer.eta = optimizer.eta*10;
                     std::cout << "Increasing learning rate at " << f0 << " to " << optimizer.eta << std::endl;
                 }

             }
 */
 /*

             if ( ADAM_status == 1 && norm > 0.01 ) {
                 optimizer.eta = optimizer.eta > 1e-5 ? optimizer.eta/10 : 1e-6;
                 std::cout << "Decreasing learning rate at " << f0 << " to " << optimizer.eta << std::endl;
                 ADAM_status = 0;
             }

   */

             if ( sub_iter_idx> iteration_threshold_of_randomization_loc || ADAM_status != 0 ) {

                 //random_shift_count++;
                 sub_iter_idx = 0;
                 random_shift_count++;
                 current_minimum_hold = current_minimum;


                 std::stringstream sstream;
                 if ( ADAM_status == 0 ) {
                     sstream << "ADAM: initiate randomization at " << f0 << ", gradient norm " << norm << std::endl;
                 }
                 else {
                     sstream << "ADAM: leaving local minimum " << f0 << ", gradient norm " << norm << " eta: " << optimizer.eta << std::endl;
                 }
                 print(sstream, 0);

                 randomize_parameters(optimized_parameters_mtx, solution_guess_tmp, f0 );
                 randomization_successful = 0;

                 optimizer.reset();
                 optimizer.initialize_moment_and_variance( num_of_parameters );

                 ADAM_status = 0;

                 //optimizer.eta = 1e-3;

             }

             else {
                 ADAM_status = optimizer.update(solution_guess_tmp, grad_mtx, f0);
             }

             sub_iter_idx++;

         }
         sstream.str("");
         sstream << "obtained minimum: " << current_minimum << std::endl;


         tbb::tick_count adam_end = tbb::tick_count::now();
         CPU_time  = CPU_time + (adam_end-adam_start).seconds();
         sstream << "adam time: " << CPU_time << " " << f0 << std::endl;

         print(sstream, 0);

 }


Adam::update
int update(Matrix_real &parameters, Matrix_real &grad, const double &f0)
Call to set the number of gate blocks to be optimized in one shot.
Definition: common/Adam.cpp:138

Optimization_Interface::adaptive_eta
bool adaptive_eta
logical variable indicating whether adaptive learning reate is used in the ADAM algorithm ...
Definition: Optimization_Interface.h:120

Adam.h
Header file for a class containing basic methods for the decomposition process.

Optimization_Interface::export_current_cost_fnc
void export_current_cost_fnc(double current_minimum)
Call to print out into a file the current cost function and the second RÃ©nyi entropy on the subsyste...
Definition: Optimization_Interface.cpp:195

logging::print
void print(const std::stringstream &sstream, int verbose_level=1) const
Call to print output messages in the function of the verbosity level.
Definition: logging.cpp:55

example_CH_general_unitary.filename
filename
Definition: example_CH_general_unitary.py:120

Decomposition_Base::current_minimum
double current_minimum
The current minimum of the optimization problem.
Definition: Decomposition_Base.h:141

Optimization_Interface::cost_fnc
cost_function_type cost_fnc
The chosen variant of the cost function.
Definition: Optimization_Interface.h:107

Optimization_Interface::get_accelerator_num
int get_accelerator_num()
Get the number of accelerators to be reserved on DFEs on users demand.
Definition: Optimization_Interface.cpp:1538

Optimization_Interface::optimization_problem
double optimization_problem(double *parameters)
Evaluate the optimization problem of the optimization.
Definition: Optimization_Interface.cpp:509

Optimization_Interface::prev_cost_fnv_val
double prev_cost_fnv_val
the previous value of the cost funtion to be used to evaluate bitflip errors in the cost funtion (see...
Definition: Optimization_Interface.h:109

example_get_circuit_unitary.num_of_parameters
num_of_parameters
Definition: example_get_circuit_unitary.py:99

matrix_base::get_data
scalar * get_data() const
Call to get the pointer to the stored data.
Definition: matrix_base.hpp:304

Adam::initialize_moment_and_variance
void initialize_moment_and_variance(int parameter_num)
?????????????
Definition: common/Adam.cpp:123

Gates_block::gates
std::vector< Gate * > gates
The list of stored gates.
Definition: Gates_block.h:46

Decomposition_Base::project_name
std::string project_name
the name of the project
Definition: Decomposition_Base.h:105

Decomposition_Base::optimization_tolerance
double optimization_tolerance
The maximal allowed error of the optimization problem (The error of the decomposition would scale wit...
Definition: Decomposition_Base.h:99

Adam::reset
void reset()
?????????????
Definition: common/Adam.cpp:90

VQE
Definition: Optimization_Interface.h:43

Adam::eta
double eta
Definition: Adam.h:42

Optimization_Interface::CPU_time
double CPU_time
time spent on optimization
Definition: Optimization_Interface.h:135

logging::verbose
int verbose
Set the verbosity level of the output messages.
Definition: logging.h:50

Optimization_Interface.h

matrix_base::size
int size() const
Call to get the number of the allocated elements.
Definition: matrix_base.hpp:470

Optimization_Interface::optimization_problem_combined
static void optimization_problem_combined(Matrix_real parameters, void *void_instance, double *f0, Matrix_real &grad)
Call to calculate both the cost function and the its gradient components.
Definition: Optimization_Interface.cpp:1186

Decomposition_Base::config
std::map< std::string, Config_Element > config
config metadata utilized during the optimization
Definition: Decomposition_Base.h:108

Optimization_Interface::solve_layer_optimization_problem_ADAM
void solve_layer_optimization_problem_ADAM(int num_of_parameters, Matrix_real &solution_guess)
Call to solve layer by layer the optimization problem via ADAM algorithm.
Definition: optimization_engines/Adam.cpp:44

Adam
A class for Adam optimization according to https://towardsdatascience.com/how-to-implement-an-adam-op...
Definition: Adam.h:36

bool

N_Qubit_Decomposition_Cost_Function.h
Header file for the paralleized calculation of the cost function of the final optimization problem (s...

export_gate_list_to_binary
void export_gate_list_to_binary(Matrix_real &parameters, Gates_block *gates_block, const std::string &filename, int verbosity)
?????????
Definition: Gates_block.cpp:3878

Gate::qbit_num
int qbit_num
number of qubits spanning the matrix of the operation
Definition: Gate.h:82

common_DFE.h
Header file for DFE support in unitary simulation.

Optimization_Interface::randomize_parameters
void randomize_parameters(Matrix_real &input, Matrix_real &output, const double &f0)
Call to randomize the parameter.
Definition: Optimization_Interface.cpp:468

Optimization_Interface::max_inner_iterations
int max_inner_iterations
the maximal number of iterations for which an optimization engine tries to solve the optimization pro...
Definition: Optimization_Interface.h:91

Optimization_Interface::random_shift_count_max
int random_shift_count_max
the maximal number of parameter randomization tries to escape a local minimum.
Definition: Optimization_Interface.h:93

Decomposition_Base::optimized_parameters_mtx
Matrix_real optimized_parameters_mtx
The optimized parameters for the gates.
Definition: Decomposition_Base.h:123

int

Matrix_real
Class to store data of complex arrays and its properties.
Definition: matrix_real.h:39