serialize keras format instead of Eigen format

2025-12-16 04:48:23 +01:00 · 2025-03-05 23:48:34 +01:00 · 2025-03-05 23:48:34 +01:00 · 538642cc17
commit 538642cc17
parent 7c1f08bcad
1 changed files with 99 additions and 58 deletions
--- a/src/Chemistry/SurrogateModels/AI_functions.cpp
+++ b/src/Chemistry/SurrogateModels/AI_functions.cpp
@ -735,22 +735,28 @@ void naa_training(EigenModel *Eigen_model, EigenModel *Eigen_model_reactive,
  // initialize models with weights from pretrained keras model
  // declare memory regions for model weights, training and target data
  Eigen_model_mutex->lock();
  std::vector<std::vector<std::vector<double>>> modelWeight =
      Python_Keras_get_weights("model");
  std::vector<std::vector<std::vector<double>>> modelWeightReactive;
  update_weights(Eigen_model, modelWeight);
-  if(params.use_clustering == true){
+  checkSumCppWeights(modelWeight, "model");
    modelWeightReactive = Python_Keras_get_weights("model_reactive"); // ? correct
    update_weights(Eigen_model_reactive, modelWeightReactive);
-      const auto start_t = std::chrono::high_resolution_clock::now();
+  // ------- old serialization --------
  // Eigen_model_mutex->lock();
-      }
+  // std::vector<std::vector<std::vector<double>>> modelWeight =
  //     Python_Keras_get_weights("model");
  // std::vector<std::vector<std::vector<double>>> modelWeightReactive;
  // update_weights(Eigen_model, modelWeight);
-  Eigen_model_mutex->unlock();
+  // if(params.use_clustering == true){
  //   modelWeightReactive = Python_Keras_get_weights("model_reactive"); // ? correct
  //   update_weights(Eigen_model_reactive, modelWeightReactive);
  //     const auto start_t = std::chrono::high_resolution_clock::now();
  //     }
  // Eigen_model_mutex->unlock();
    // Initialize training data input and targets
@ -762,10 +768,14 @@ void naa_training(EigenModel *Eigen_model, EigenModel *Eigen_model_reactive,
      std::vector<double>(params.training_data_size));
  // determine size for required memory regions
-  size_t modelSize = calculateStructSize(Eigen_model, 'E');
+  // size_t modelSize = calculateStructSize(Eigen_model, 'E');
-  size_t modelSizeReactive = calculateStructSize(Eigen_model_reactive, 'E');
+  // size_t modelSizeReactive = calculateStructSize(Eigen_model_reactive, 'E');
-  modelSize = modelSize > modelSizeReactive ? modelSize : modelSizeReactive;
+  // TODO: reactive/non-reactive model
  size_t modelSize = calculateStructSize(&modelWeight, 'C');
  // size_t modelSizeReactive = calculateStructSize(&modelWeightReactive, 'C');
  // modelSize = modelSize > modelSizeReactive ? modelSize : modelSizeReactive;
  size_t trainingDataSize = calculateStructSize(&inputs, 'T');
  size_t targetDataSize = calculateStructSize(&targets, 'T');
@ -794,7 +804,7 @@ void naa_training(EigenModel *Eigen_model, EigenModel *Eigen_model_reactive,
  // create memory regions
  struct naa_param_t input_regions[] = {
-      {(void *)serializedModel, modelSize},
+      {(void *)serializedModel, modelSize, false},
      {(void *)serializedTrainingData, trainingDataSize},
      {(void *)serializedTargetData, targetDataSize}};
@ -893,25 +903,42 @@ void naa_training(EigenModel *Eigen_model, EigenModel *Eigen_model_reactive,
    // three memory regions: model weights, predicted data, true data
    // model weight region is an input and output memory region
    // ------ old serialization ------
    // auto start_serialization_weights_t = std::chrono::high_resolution_clock::now();
    // if(train_cluster == 1){
    //   int res = serializeModelWeights(Eigen_model_reactive, serializedModel);
    // } else {
    //   int res = serializeModelWeights(Eigen_model, serializedModel);
    // }
    // auto end_serialization_weights_t = std::chrono::high_resolution_clock::now();
    // std::chrono::nanoseconds difference_serialization_weights = end_serialization_weights_t - start_serialization_weights_t;
    auto start_serialization_weights_t = std::chrono::high_resolution_clock::now();
-    if(train_cluster == 1){
+    // TODO: reactive/non-reactive model
-      int res = serializeModelWeights(Eigen_model_reactive, serializedModel);
+    // if(train_cluster == 1){
-    } else {
+    //   int res = serializeCPPWeights(modelWeight, serializedModel);
-      int res = serializeModelWeights(Eigen_model, serializedModel);
+    // }
-    }
+    // else {
    //   int res = serializeCPPWeights(modelWeightReactive, serializedModel);
    // }
    int res = serializeCPPWeights(modelWeight, serializedModel);
    auto end_serialization_weights_t = std::chrono::high_resolution_clock::now();
    std::chrono::nanoseconds difference_serialization_weights = end_serialization_weights_t - start_serialization_weights_t;
    // checksum serializeModel
    double checksum_model = 0;
    for(size_t i = 0; i < Eigen_model->weight_matrices.size(); i++){
        checksum_model += Eigen_model->weight_matrices[i].sum();
    }
    for(size_t j=0; j<Eigen_model->biases.size(); j++){
      checksum_model += Eigen_model->biases[j].sum();
    }
-    fprintf(stdout, "Checksum model: %f\n", checksum_model);
+    // checksum serializeModel
    // ------- old serialization -------
    // double checksum_model = 0;
    // for(size_t i = 0; i < Eigen_model->weight_matrices.size(); i++){
    //     checksum_model += Eigen_model->weight_matrices[i].sum();
    // }
    // for(size_t j=0; j<Eigen_model->biases.size(); j++){
    //   checksum_model += Eigen_model->biases[j].sum();
    // }
    // fprintf(stdout, "Checksum model: %f\n", checksum_model);
    auto start_serialization_data_t = std::chrono::high_resolution_clock::now();
    int res1 = serializeTrainingData(&inputs, serializedTrainingData);
@ -936,47 +963,61 @@ void naa_training(EigenModel *Eigen_model, EigenModel *Eigen_model_reactive,
           status.bytes_received, status.naa_error);
     // update model weights with received weights
-     auto start_deserialization_t = std::chrono::high_resolution_clock::now();
+    // -------- old serialization ---------
-     EigenModel deserializedModel =
+    //  auto start_deserialization_t = std::chrono::high_resolution_clock::now();
-         deserializeModelWeights(serializedModel, modelSize);
+    //  EigenModel deserializedModel =
    //      deserializeModelWeights(serializedModel, modelSize);
-      Eigen_model_mutex->lock();
+    //   Eigen_model_mutex->lock();
-      Eigen_model->weight_matrices = deserializedModel.weight_matrices; 
+    //   Eigen_model->weight_matrices = deserializedModel.weight_matrices; 
-      Eigen_model->biases = deserializedModel.biases;
+    //   Eigen_model->biases = deserializedModel.biases;
-      Eigen_model_mutex->unlock();
+    //   Eigen_model_mutex->unlock();
-      auto end_deserialization_t = std::chrono::high_resolution_clock::now();
+    //   auto end_deserialization_t = std::chrono::high_resolution_clock::now();
-      std::chrono::nanoseconds difference_deserialization_t = end_deserialization_t - start_deserialization_t;
+    //   std::chrono::nanoseconds difference_deserialization_t = end_deserialization_t - start_deserialization_t;
-      std::vector<std::vector<std::vector<double>>> cpp_weights =
+      std::vector<std::vector<std::vector<double>>> modelWeightsDeserialized =
-          Python_Keras_get_weights("model");
+        deserializeCPPWeights(serializedModel);
      checkSumCppWeights(cpp_weights, "before");
-      auto start_deserialization2_t = std::chrono::high_resolution_clock::now();
+    checkSumCppWeights(modelWeightsDeserialized, "model after");
-      size_t size_cpp_weights = calculateStructSize(&cpp_weights, 'C');
+
-      char *serializedCPPData = (char *)calloc(size_cpp_weights, sizeof(char));
+      // -------- old serialization ----------
-      int res = serializeCPPWeights(cpp_weights, serializedCPPData);
+      // std::vector<std::vector<std::vector<double>>> cpp_weights =
-      std::vector<std::vector<std::vector<double>>> cpp_weights_deserialized =
+      //     Python_Keras_get_weights("model");
-          deserializeCPPWeights(serializedCPPData);
+      // checkSumCppWeights(cpp_weights, "before");
      // auto start_deserialization2_t = std::chrono::high_resolution_clock::now();
      // size_t size_cpp_weights = calculateStructSize(&cpp_weights, 'C');
      // char *serializedCPPData = (char *)calloc(size_cpp_weights, sizeof(char));
      // int res = serializeCPPWeights(cpp_weights, serializedCPPData);
      // std::vector<std::vector<std::vector<double>>> cpp_weights_deserialized =
      //     deserializeCPPWeights(serializedCPPData);
      // checkSumCppWeights(cpp_weights_deserialized, "after");
-      Python_keras_set_weights(model_name, cpp_weights_deserialized);
+      // auto end_deserialization2_t = std::chrono::high_resolution_clock::now();
-      auto end_deserialization2_t = std::chrono::high_resolution_clock::now();
+      // std::chrono::nanoseconds update_keras_model = end_deserialization2_t - start_deserialization2_t;
-      std::chrono::nanoseconds update_keras_model = end_deserialization2_t - start_deserialization2_t;
+      
      Python_keras_set_weights(model_name, modelWeightsDeserialized);
      // TODO reactive/non-reactive
      Eigen_model_mutex->lock();
      update_weights(Eigen_model, modelWeightsDeserialized);
      Eigen_model_mutex->unlock();
      #ifdef NAA_MEASUREMENT
-      std::chrono::nanoseconds difference_serialization =
+      // std::chrono::nanoseconds difference_serialization =
-          difference_calloc + difference_serialization_weights +
+      //     difference_calloc + difference_serialization_weights +
-          difference_serialization_data + difference_deserialization_t +
+      //     difference_serialization_data + difference_deserialization_t +
-          update_keras_model;
+      //     update_keras_model;
-      fprintf(logfile, "%d, %zu, %zu, %zu, %ld\n", training_data_buffer->n_training_runs, modelSize, trainingDataSize, targetDataSize, difference_serialization.count());
+      // fprintf(logfile, "%d, %zu, %zu, %zu, %ld\n", training_data_buffer->n_training_runs, modelSize, trainingDataSize, targetDataSize, difference_serialization.count());
-      if(training_data_buffer->n_training_runs == 10){
+      // if(training_data_buffer->n_training_runs == 10){
-        fclose(logfile);
+      //   fclose(logfile);
-        exit(0);
+      //   exit(0);
-      }
+      // }
      #endif
  }