make neural prophet parallel mdoel training

codeloop · codeloop · commit 5242f1d904aa · 2024-01-05T06:38:20.000Z
diff --git a/ads/opctl/operator/lowcode/forecast/model/neuralprophet.py b/ads/opctl/operator/lowcode/forecast/model/neuralprophet.py
@@ -7,6 +7,7 @@
 import numpy as np
 import optuna
 import pandas as pd
+from joblib import Parallel, delayed
 from torch import Tensor
 from torchmetrics.regression import (
     MeanAbsoluteError,
@@ -71,33 +72,31 @@ def __init__(self, config: ForecastOperatorConfig, datasets: ForecastDatasets):
         self.train_metrics = True
         self.forecast_col_name = "yhat1"
 
-    def _build_model(self) -> pd.DataFrame:
-        from neuralprophet import NeuralProphet
 
-        full_data_dict = self.datasets.full_data_dict
-        models = []
-        outputs = dict()
-        outputs_legacy = []
-
-        # Extract the Confidence Interval Width and
-        # convert to neural prophets equivalent - quantiles
-        model_kwargs = self.spec.model_kwargs
-
-        if self.spec.confidence_interval_width is None:
-            quantiles = model_kwargs.get("quantiles", [0.05, 0.95])
-            self.spec.confidence_interval_width = float(quantiles[1]) - float(
-                quantiles[0]
-            )
-        else:
-            boundaries = round((1 - self.spec.confidence_interval_width) / 2, 2)
-            quantiles = [boundaries, self.spec.confidence_interval_width + boundaries]
+    def _train_model(self, i, target, df):
 
-        model_kwargs["quantiles"] = quantiles
-        self.forecast_output = ForecastOutput(
-            confidence_interval_width=self.spec.confidence_interval_width
-        )
+        try:
+            from neuralprophet import NeuralProphet
+
+            # Extract the Confidence Interval Width and
+            # convert to neural prophets equivalent - quantiles
+            model_kwargs = self.spec.model_kwargs
+
+            if self.spec.confidence_interval_width is None:
+                self.quantiles = model_kwargs.get("quantiles", [0.05, 0.95])
+                self.spec.confidence_interval_width = float(self.quantiles[1]) - float(
+                    self.quantiles[0]
+                )
+            else:
+                boundaries = round((1 - self.spec.confidence_interval_width) / 2, 2)
+                self.quantiles = [boundaries, self.spec.confidence_interval_width + boundaries]
+
+            model_kwargs["quantiles"] = self.quantiles
+            self.forecast_output = ForecastOutput(
+                confidence_interval_width=self.spec.confidence_interval_width
+            )
 
-        for i, (target, df) in enumerate(full_data_dict.items()):
+            # for i, (target, df) in enumerate(full_data_dict.items()):
             le, df_encoded = utils._label_encode_dataframe(
                 df, no_encode={self.spec.datetime_column.name, target}
             )
@@ -212,14 +211,176 @@ def objective(trial):
             forecast = model.predict(future)
             logger.debug(f"-----------------Model {i}----------------------")
             logger.debug(forecast.tail())
-            models.append(model)
-            outputs[target] = forecast
-            outputs_legacy.append(forecast)
+            # models.append(model)
+            self.outputs_dict[target] = forecast
+            self.outputs_legacy.append(forecast)
+
+            self.models_dict[target] = model
+            self.outputs = self.outputs_legacy
+
+            logger.debug("===========Done===========")
+        except Exception as e:
+            self.errors_dict[target] = {"model_name": self.spec.model, "error": str(e)}
+
+    def _build_model(self) -> pd.DataFrame:
+        # from neuralprophet import NeuralProphet
 
-        self.models = models
-        self.outputs = outputs_legacy
+        full_data_dict = self.datasets.full_data_dict
+        self.models_dict = dict()
+        self.outputs_dict = dict()
+        self.outputs_legacy = []
+        self.errors_dict = dict()
+
+        Parallel(n_jobs=-1, require="sharedmem")(
+            delayed(NeuralProphetOperatorModel._train_model)(self, i, target, df)
+            for self, (i, (target, df)) in zip(
+                [self] * len(full_data_dict), enumerate(full_data_dict.items())
+            )
+        )
 
-        logger.debug("===========Done===========")
+        self.models = [self.models_dict[target] for target in self.target_columns]
+
+        # # Extract the Confidence Interval Width and
+        # # convert to neural prophets equivalent - quantiles
+        # model_kwargs = self.spec.model_kwargs
+
+        # if self.spec.confidence_interval_width is None:
+        #     quantiles = model_kwargs.get("quantiles", [0.05, 0.95])
+        #     self.spec.confidence_interval_width = float(quantiles[1]) - float(
+        #         quantiles[0]
+        #     )
+        # else:
+        #     boundaries = round((1 - self.spec.confidence_interval_width) / 2, 2)
+        #     quantiles = [boundaries, self.spec.confidence_interval_width + boundaries]
+
+        # model_kwargs["quantiles"] = quantiles
+        # self.forecast_output = ForecastOutput(
+        #     confidence_interval_width=self.spec.confidence_interval_width
+        # )
+
+        # for i, (target, df) in enumerate(full_data_dict.items()):
+        #     le, df_encoded = utils._label_encode_dataframe(
+        #         df, no_encode={self.spec.datetime_column.name, target}
+        #     )
+        #     model_kwargs_i = model_kwargs.copy()
+
+        #     # format the dataframe for this target. Dropping NA on target[df] will remove all future data
+        #     df_clean = self._preprocess(
+        #         df_encoded,
+        #         self.spec.datetime_column.name,
+        #         self.spec.datetime_column.format,
+        #     )
+        #     data_i = df_clean[df_clean[target].notna()]
+        #     data_i.rename({target: "y"}, axis=1, inplace=True)
+
+        #     # Assume that all columns passed in should be used as additional data
+        #     additional_regressors = set(data_i.columns) - {"y", "ds"}
+        #     training_data = data_i[["y", "ds"] + list(additional_regressors)]
+
+        #     if self.perform_tuning:
+
+        #         def objective(trial):
+        #             params = {
+        #                 # 'seasonality_mode': trial.suggest_categorical('seasonality_mode', ['additive', 'multiplicative']),
+        #                 # 'seasonality_reg': trial.suggest_float('seasonality_reg', 0.1, 500, log=True),
+        #                 # 'learning_rate': trial.suggest_float('learning_rate',  0.0001, 0.1, log=True),
+        #                 "newer_samples_start": trial.suggest_float(
+        #                     "newer_samples_start", 0.001, 0.999
+        #                 ),
+        #                 "newer_samples_weight": trial.suggest_float(
+        #                     "newer_samples_weight", 0, 100
+        #                 ),
+        #                 "changepoints_range": trial.suggest_float(
+        #                     "changepoints_range", 0.8, 0.95
+        #                 ),
+        #             }
+        #             # trend_reg, trend_reg_threshold, ar_reg, impute_rolling/impute_linear,
+        #             params.update(model_kwargs_i)
+
+        #             folds = NeuralProphet(**params).crossvalidation_split_df(
+        #                 data_i, k=3
+        #             )
+        #             test_metrics_total_i = []
+        #             for df_train, df_test in folds:
+        #                 m, accepted_regressors = _fit_model(
+        #                     data=df_train,
+        #                     params=params,
+        #                     additional_regressors=additional_regressors,
+        #                     select_metric=self.spec.metric,
+        #                 )
+        #                 df_test = df_test[["y", "ds"] + accepted_regressors]
+
+        #                 test_forecast_i = m.predict(df=df_test)
+        #                 fold_metric_i = (
+        #                     m.metrics[self.spec.metric]
+        #                     .forward(
+        #                         Tensor(test_forecast_i["yhat1"]),
+        #                         Tensor(test_forecast_i["y"]),
+        #                     )
+        #                     .item()
+        #                 )
+        #                 test_metrics_total_i.append(fold_metric_i)
+        #             logger.debug(
+        #                 f"----------------------{np.asarray(test_metrics_total_i).mean()}----------------------"
+        #             )
+        #             return np.asarray(test_metrics_total_i).mean()
+
+        #         study = optuna.create_study(direction="minimize")
+        #         m_params = NeuralProphet().parameters()
+        #         study.enqueue_trial(
+        #             {
+        #                 # 'seasonality_mode': m_params['seasonality_mode'],
+        #                 # 'seasonality_reg': m_params['seasonality_reg'],
+        #                 # 'learning_rate': m_params['learning_rate'],
+        #                 "newer_samples_start": m_params["newer_samples_start"],
+        #                 "newer_samples_weight": m_params["newer_samples_weight"],
+        #                 "changepoints_range": m_params["changepoints_range"],
+        #             }
+        #         )
+        #         study.optimize(
+        #             objective,
+        #             n_trials=self.spec.tuning.n_trials
+        #             if self.spec.tuning
+        #             else DEFAULT_TRIALS,
+        #             n_jobs=-1,
+        #         )
+
+        #         selected_params = study.best_params
+        #         selected_params.update(model_kwargs_i)
+        #         model_kwargs_i = selected_params
+
+        #     # Build and fit model
+        #     model, accepted_regressors = _fit_model(
+        #         data=training_data,
+        #         params=model_kwargs_i,
+        #         additional_regressors=additional_regressors,
+        #         select_metric=self.spec.metric,
+        #     )
+        #     logger.debug(
+        #         f"Found the following additional data columns: {additional_regressors}"
+        #     )
+        #     logger.debug(
+        #         f"While fitting the model, some additional data may have been "
+        #         f"discarded. Only using the columns: {accepted_regressors}"
+        #     )
+
+        #     # Build future dataframe
+        #     future = df_clean.reset_index(drop=True)
+        #     future["y"] = None
+        #     future = future[["y", "ds"] + list(accepted_regressors)]
+
+        #     # Forecast model and collect outputs
+        #     forecast = model.predict(future)
+        #     logger.debug(f"-----------------Model {i}----------------------")
+        #     logger.debug(forecast.tail())
+        #     models.append(model)
+        #     outputs[target] = forecast
+        #     outputs_legacy.append(forecast)
+
+        # self.models = models
+        # self.outputs = outputs_legacy
+
+        # logger.debug("===========Done===========")
 
         # Merge the outputs from each model into 1 df with all outputs by target and category
         col = self.original_target_column
@@ -229,7 +390,7 @@ def objective(trial):
         for cat in self.categories:
             output_i = pd.DataFrame()
 
-            output_i["Date"] = outputs[f"{col}_{cat}"]["ds"]
+            output_i["Date"] = self.outputs_dict[f"{col}_{cat}"]["ds"]
             output_i["Series"] = cat
             output_i[f"input_value"] = full_data_dict[f"{col}_{cat}"][f"{col}_{cat}"]
 
@@ -240,26 +401,26 @@ def objective(trial):
 
             output_i.iloc[
                 : -self.spec.horizon, output_i.columns.get_loc(f"fitted_value")
-            ] = (outputs[f"{col}_{cat}"]["yhat1"].iloc[: -self.spec.horizon].values)
+            ] = (self.outputs_dict[f"{col}_{cat}"]["yhat1"].iloc[: -self.spec.horizon].values)
             output_i.iloc[
                 -self.spec.horizon :,
                 output_i.columns.get_loc(f"forecast_value"),
             ] = (
-                outputs[f"{col}_{cat}"]["yhat1"].iloc[-self.spec.horizon :].values
+                self.outputs_dict[f"{col}_{cat}"]["yhat1"].iloc[-self.spec.horizon :].values
             )
             output_i.iloc[
                 -self.spec.horizon :,
                 output_i.columns.get_loc(yhat_upper_name),
             ] = (
-                outputs[f"{col}_{cat}"][f"yhat1 {quantiles[1]*100}%"]
+                self.outputs_dict[f"{col}_{cat}"][f"yhat1 {self.quantiles[1]*100}%"]
                 .iloc[-self.spec.horizon :]
                 .values
             )
             output_i.iloc[
                 -self.spec.horizon :,
                 output_i.columns.get_loc(yhat_lower_name),
             ] = (
-                outputs[f"{col}_{cat}"][f"yhat1 {quantiles[0]*100}%"]
+                self.outputs_dict[f"{col}_{cat}"][f"yhat1 {self.quantiles[0]*100}%"]
                 .iloc[-self.spec.horizon :]
                 .values
             )