changed target in outputs such that original target column is not present

govarsha · govarsha · commit 75c0f05b8fae · 2024-01-19T00:53:20.000+05:30
diff --git a/ads/opctl/operator/lowcode/forecast/model/arima.py b/ads/opctl/operator/lowcode/forecast/model/arima.py
@@ -128,7 +128,7 @@ def _train_model(self, i, target, df):
             for param in ['arima_res_', 'endog_index_']:
                 if param in params:
                     params.pop(param)
-            self.model_parameters[target] = {
+            self.model_parameters[utils.convert_target(target, self.original_target_column)] = {
                 "framework": SupportedModels.Arima,
                 **params,
             }
@@ -197,7 +197,7 @@ def _generate_report(self):
 
         sec5_text = dp.Text(f"## ARIMA Model Parameters")
         blocks = [
-            dp.HTML(m.summary().as_html(), label=target)
+            dp.HTML(m.summary().as_html(), label=utils.convert_target(target, self.original_target_column))
             for i, (target, m) in enumerate(self.models.items())
         ]
         sec5 = dp.Select(blocks=blocks) if len(blocks) > 1 else blocks[0]
@@ -242,7 +242,7 @@ def _generate_report(self):
                 blocks = [
                     dp.DataTable(
                         local_ex_df.div(local_ex_df.abs().sum(axis=1), axis=0) * 100,
-                        label=s_id,
+                        label=utils.convert_target(s_id, self.original_target_column),
                     )
                     for s_id, local_ex_df in self.local_explanation.items()
                 ]
diff --git a/ads/opctl/operator/lowcode/forecast/model/automlx.py b/ads/opctl/operator/lowcode/forecast/model/automlx.py
@@ -164,7 +164,7 @@ def _build_model(self) -> pd.DataFrame:
                 outputs[target] = summary_frame
                 # outputs_legacy[target] = summary_frame
 
-                self.model_parameters[target] = {
+                self.model_parameters[utils.convert_target(target, self.original_target_column)] = {
                     "framework": SupportedModels.AutoMLX,
                     "score_metric": model.score_metric,
                     "random_state": model.random_state,
@@ -304,7 +304,7 @@ def _generate_report(self):
                 blocks = [
                     dp.DataTable(
                         local_ex_df.div(local_ex_df.abs().sum(axis=1), axis=0) * 100,
-                        label=s_id,
+                        label=utils.convert_target(s_id, self.original_target_column),
                         )
                     for s_id, local_ex_df in self.local_explanation.items()
                 ]
diff --git a/ads/opctl/operator/lowcode/forecast/model/autots.py b/ads/opctl/operator/lowcode/forecast/model/autots.py
@@ -78,7 +78,7 @@ def _build_model(self) -> pd.DataFrame:
                 drop_data_older_than_periods=self.spec.model_kwargs.get(
                     "drop_data_older_than_periods", None
                 ),
-            model_list=self.spec.model_kwargs.get("model_list", "fast_parallel"),
+                model_list=self.spec.model_kwargs.get("model_list", "fast_parallel"),
                 transformer_list=self.spec.model_kwargs.get("transformer_list", "auto"),
                 transformer_max_depth=self.spec.model_kwargs.get(
                     "transformer_max_depth", 6
@@ -225,7 +225,7 @@ def _build_model(self) -> pd.DataFrame:
                 category=cat, target_category_column=cat_target, forecast=output_i
             )
 
-            self.model_parameters[cat_target] = {
+            self.model_parameters[utils.convert_target(cat_target, self.original_target_column)] = {
                 "framework": SupportedModels.AutoTS,
                 **params,
             }
@@ -266,6 +266,7 @@ def _generate_report(self) -> tuple:
                 ].min(),
             ),
             target_columns=self.target_columns,
+            original_target_column=self.original_target_column
         )
 
         # Section 2: AutoTS Model Parameters
@@ -323,7 +324,7 @@ def _generate_report(self) -> tuple:
                 blocks = [
                     dp.DataTable(
                         local_ex_df.div(local_ex_df.abs().sum(axis=1), axis=0) * 100,
-                        label=s_id,
+                        label=utils.convert_target(s_id, self.original_target_column),
                         )
                     for s_id, local_ex_df in self.local_explanation.items()
                 ]
diff --git a/ads/opctl/operator/lowcode/forecast/model/base_model.py b/ads/opctl/operator/lowcode/forecast/model/base_model.py
@@ -105,6 +105,7 @@ def generate_report(self):
                         self.datasets,
                         self.forecast_output,
                         self.spec.datetime_column.name,
+                        self.original_target_column,
                         target_col=self.forecast_col_name,
                     )
                 else:
@@ -125,6 +126,7 @@ def generate_report(self):
                             target_columns=self.target_columns,
                             test_filename=self.spec.test_data.url,
                             output=self.forecast_output,
+                            original_target_column=self.original_target_column,
                             target_col=self.forecast_col_name,
                             elapsed_time=elapsed_time,
                         )
@@ -144,12 +146,13 @@ def generate_report(self):
 
                 title_text = dp.Text("# Forecast Report")
 
-                md_columns = " * ".join([f"{x} \n" for x in self.target_columns])
+                md_columns = " * ".join([f"{utils.convert_target(x,self.original_target_column)} \n"
+                                         for x in self.target_columns])
                 first_10_rows_blocks = [
                     dp.DataTable(
                         df.head(10).rename({col: self.spec.target_column}, axis=1),
                         caption="Start",
-                        label=col,
+                        label=utils.convert_target(col, self.original_target_column),
                     )
                     for col, df in self.full_data_dict.items()
                 ]
@@ -158,7 +161,7 @@ def generate_report(self):
                     dp.DataTable(
                         df.tail(10).rename({col: self.spec.target_column}, axis=1),
                         caption="End",
-                        label=col,
+                        label=utils.convert_target(col, self.original_target_column),
                     )
                     for col, df in self.full_data_dict.items()
                 ]
@@ -167,7 +170,7 @@ def generate_report(self):
                     dp.DataTable(
                         df.rename({col: self.spec.target_column}, axis=1).describe(),
                         caption="Summary Statistics",
-                        label=col,
+                        label=utils.convert_target(col, self.original_target_column),
                     )
                     for col, df in self.full_data_dict.items()
                 ]
@@ -254,6 +257,7 @@ def generate_report(self):
                 forecast_sec = utils.get_forecast_plots(
                     self.forecast_output,
                     self.target_columns,
+                    self.original_target_column,
                     horizon=self.spec.horizon,
                     test_data=test_data,
                     ci_interval_width=self.spec.confidence_interval_width,
@@ -280,7 +284,7 @@ def generate_report(self):
             )
 
     def _test_evaluate_metrics(
-            self, target_columns, test_filename, output, target_col="yhat", elapsed_time=0
+            self, target_columns, test_filename, output, original_target_column, target_col="yhat", elapsed_time=0
     ):
         total_metrics = pd.DataFrame()
         summary_metrics = pd.DataFrame()
@@ -335,7 +339,7 @@ def _test_evaluate_metrics(
                 metrics_df = utils._build_metrics_df(
                     y_true=y_true[-self.spec.horizon:],
                     y_pred=y_pred[-self.spec.horizon:],
-                    column_name=target_column_i,
+                    column_name=utils.convert_target(target_column_i, original_target_column),
                 )
                 total_metrics = pd.concat([total_metrics, metrics_df], axis=1)
             else:
@@ -675,7 +679,7 @@ def explain_model(self, datetime_col_name, explain_predict_fn) -> dict:
                     f"No explanations generated. Ensure that additional data has been provided."
                 )
             else:
-                self.global_explanation[series_id] = dict(
+                self.global_explanation[utils.convert_target(series_id, self.original_target_column)] = dict(
                     zip(
                         data_trimmed.columns[1:],
                         np.average(np.absolute(kernel_explnr_vals[:, 1:]), axis=0),
@@ -724,4 +728,4 @@ def local_explainer(self, kernel_explainer, series_id, datetime_col_name) -> Non
                 ["series_id", self.spec.target_column], axis=1, inplace=True
             )
 
-        self.local_explanation[series_id] = local_kernel_explnr_df
+        self.local_explanation[utils.convert_target(series_id, self.original_target_column)] = local_kernel_explnr_df
diff --git a/ads/opctl/operator/lowcode/forecast/model/neuralprophet.py b/ads/opctl/operator/lowcode/forecast/model/neuralprophet.py
@@ -81,7 +81,6 @@ def _load_model(self):
         except:
             logger.info("model.pkl/trainer.pkl is not present")
 
-
     def _train_model(self, i, target, df):
 
         try:
@@ -236,7 +235,7 @@ def objective(trial):
                 self.models[target] = model
                 self.trainers[target] = model.trainer
 
-            self.model_parameters[target] = {
+            self.model_parameters[utils.convert_target(target, self.original_target_column)] = {
                 "framework": SupportedModels.NeuralProphet,
                 "config": model.config,
                 "config_trend": model.config_trend,
@@ -259,7 +258,7 @@ def objective(trial):
                 "highlight_forecast_step_n": model.highlight_forecast_step_n,
                 "true_ar_weights": model.true_ar_weights,
             }
-            
+
             logger.debug("===========Done===========")
         except Exception as e:
             self.errors_dict[target] = {"model_name": self.spec.model, "error": str(e)}
@@ -286,7 +285,6 @@ def _build_model(self) -> pd.DataFrame:
         if self.loaded_trainers is not None:
             self.trainers = self.loaded_trainers
 
-
         # Merge the outputs from each model into 1 df with all outputs by target and category
         col = self.original_target_column
         output_col = pd.DataFrame()
@@ -349,18 +347,21 @@ def _generate_report(self):
         sec1 = utils._select_plot_list(
             lambda idx, target, *args: self.models[target].plot(self.outputs[target]),
             target_columns=self.target_columns,
+            original_target_column=self.original_target_column
         )
 
         sec2_text = dp.Text(f"## Forecast Broken Down by Trend Component")
         sec2 = utils._select_plot_list(
             lambda idx, target, *args: self.models[target].plot_components(self.outputs[target]),
             target_columns=self.target_columns,
+            original_target_column=self.original_target_column
         )
 
         sec3_text = dp.Text(f"## Forecast Parameter Plots")
         sec3 = utils._select_plot_list(
             lambda idx, target, *args: self.models[target].plot_parameters(),
             target_columns=self.target_columns,
+            original_target_column=self.original_target_column
         )
 
         sec5_text = dp.Text(f"## Neural Prophet Model Parameters")
@@ -370,7 +371,7 @@ def _generate_report(self):
                 pd.Series(
                     m.state_dict(),
                     index=m.state_dict().keys(),
-                    name=target,
+                    name=utils.convert_target(target, self.original_target_column),
                 )
             )
         all_model_states = pd.concat(model_states, axis=1)
@@ -406,7 +407,7 @@ def _generate_report(self):
                 global_explanation_df = pd.DataFrame(self.global_explanation)
 
                 self.formatted_global_explanation = (
-                    global_explanation_df / global_explanation_df.sum(axis=0) * 100
+                        global_explanation_df / global_explanation_df.sum(axis=0) * 100
                 )
 
                 # Create a markdown section for the global explainability
@@ -428,7 +429,7 @@ def _generate_report(self):
                 blocks = [
                     dp.DataTable(
                         local_ex_df.div(local_ex_df.abs().sum(axis=1), axis=0) * 100,
-                        label=s_id,
+                        label=utils.convert_target(s_id, self.original_target_column),
                     )
                     for s_id, local_ex_df in self.local_explanation.items()
                 ]
diff --git a/ads/opctl/operator/lowcode/forecast/model/prophet.py b/ads/opctl/operator/lowcode/forecast/model/prophet.py
@@ -207,7 +207,7 @@ def objective(trial):
             for param in ["history", "history_dates", "stan_fit"]:
                 if param in params:
                     params.pop(param)
-            self.model_parameters[target] = {
+            self.model_parameters[utils.convert_target(target, self.original_target_column)] = {
                 "framework": SupportedModels.Prophet,
                 **params,
             }
@@ -293,12 +293,14 @@ def _generate_report(self):
                 self.outputs[target], include_legend=True
             ),
             target_columns=self.target_columns,
+            original_target_column=self.original_target_column
         )
 
         sec2_text = dp.Text(f"## Forecast Broken Down by Trend Component")
         sec2 = utils._select_plot_list(
             lambda idx, target, *args: self.models[target].plot_components(self.outputs[target]),
             target_columns=self.target_columns,
+            original_target_column=self.original_target_column
         )
 
         sec3_text = dp.Text(f"## Forecast Changepoints")
@@ -313,7 +315,9 @@ def _generate_report(self):
             for idx in range(len(self.target_columns))
         ]
         sec3 = utils._select_plot_list(
-            lambda idx, *args: sec3_figs[idx], target_columns=self.target_columns
+            lambda idx, *args: sec3_figs[idx],
+            target_columns=self.target_columns,
+            original_target_column=self.original_target_column
         )
 
         all_sections = [sec1_text, sec1, sec2_text, sec2, sec3_text, sec3]
@@ -374,7 +378,7 @@ def _generate_report(self):
                 blocks = [
                     dp.DataTable(
                         local_ex_df.div(local_ex_df.abs().sum(axis=1), axis=0) * 100,
-                        label=s_id,
+                        label=utils.convert_target(s_id,self.original_target_column),
                     )
                     for s_id, local_ex_df in self.local_explanation.items()
                 ]
diff --git a/ads/opctl/operator/lowcode/forecast/utils.py b/ads/opctl/operator/lowcode/forecast/utils.py
@@ -394,8 +394,7 @@ def _build_metrics_df(y_true, y_pred, column_name):
 
 
 def evaluate_train_metrics(
-    target_columns, datasets, output, datetime_col, target_col="yhat"
-):
+    target_columns, datasets, output, datetime_col, original_target_column, target_col="yhat"):
     """
     Training metrics
     """
@@ -408,7 +407,7 @@ def evaluate_train_metrics(
             y_true = forecast_by_col["input_value"].values
             y_pred = forecast_by_col["fitted_value"].values
             metrics_df = _build_metrics_df(
-                y_true=y_true, y_pred=y_pred, column_name=col
+                y_true=y_true, y_pred=y_pred, column_name=convert_target(col, original_target_column)
             )
             total_metrics = pd.concat([total_metrics, metrics_df], axis=1)
         except Exception as e:
@@ -417,10 +416,11 @@ def evaluate_train_metrics(
     return total_metrics
 
 
-def _select_plot_list(fn, target_columns):
+def _select_plot_list(fn, target_columns, original_target_column):
     import datapane as dp
 
-    blocks = [dp.Plot(fn(i, col), label=col) for i, col in enumerate(target_columns)]
+    blocks = [dp.Plot(fn(i, target), label=convert_target(target, original_target_column))
+              for i, target in enumerate(target_columns)]
     return dp.Select(blocks=blocks) if len(target_columns) > 1 else blocks[0]
 
 
@@ -431,6 +431,7 @@ def _add_unit(num, unit):
 def get_forecast_plots(
     forecast_output,
     target_columns,
+    original_target_column,
     horizon,
     test_data=None,
     ci_interval_width=0.95,
@@ -524,7 +525,7 @@ def plot_forecast_plotly(idx, col):
         )
         return fig
 
-    return _select_plot_list(plot_forecast_plotly, target_columns)
+    return _select_plot_list(plot_forecast_plotly, target_columns, original_target_column)
 
 
 def human_time_friendly(seconds):
@@ -627,6 +628,14 @@ def get_frequency_of_datetime(data: pd.DataFrame, dataset_info: ForecastOperator
     return freq
 
 
+def convert_target(target: str, target_col: str):
+    if target_col is not None and target_col!='':
+        temp = target_col + '_'
+        if temp in target:
+            target = target.replace(temp, '')
+    return target
+
+
 def default_signer(**kwargs):
     os.environ["EXTRA_USER_AGENT_INFO"] = "Forecast-Operator"
     from ads.common.auth import default_signer

Original file line number	Diff line number	Diff line change
`@@ -128,7 +128,7 @@ def _train_model(self, i, target, df):`
`128`	`128`	`for param in ['arima_res_', 'endog_index_']:`
`129`	`129`	`if param in params:`
`130`	`130`	`params.pop(param)`
`131`		`- self.model_parameters[target] = {`
	`131`	`+ self.model_parameters[utils.convert_target(target, self.original_target_column)] = {`
`132`	`132`	`"framework": SupportedModels.Arima,`
`133`	`133`	`**params,`
`134`	`134`	`}`
`@@ -197,7 +197,7 @@ def _generate_report(self):`
`197`	`197`
`198`	`198`	`sec5_text = dp.Text(f"## ARIMA Model Parameters")`
`199`	`199`	`blocks = [`
`200`		`- dp.HTML(m.summary().as_html(), label=target)`
	`200`	`+ dp.HTML(m.summary().as_html(), label=utils.convert_target(target, self.original_target_column))`
`201`	`201`	`for i, (target, m) in enumerate(self.models.items())`
`202`	`202`	`]`
`203`	`203`	`sec5 = dp.Select(blocks=blocks) if len(blocks) > 1 else blocks[0]`
`@@ -242,7 +242,7 @@ def _generate_report(self):`
`242`	`242`	`blocks = [`
`243`	`243`	`dp.DataTable(`
`244`	`244`	`local_ex_df.div(local_ex_df.abs().sum(axis=1), axis=0) * 100,`
`245`		`- label=s_id,`
	`245`	`+ label=utils.convert_target(s_id, self.original_target_column),`
`246`	`246`	`)`
`247`	`247`	`for s_id, local_ex_df in self.local_explanation.items()`
`248`	`248`	`]`
Original file line number	Diff line number	Diff line change
`@@ -207,7 +207,7 @@ def objective(trial):`
`207`	`207`	`for param in ["history", "history_dates", "stan_fit"]:`
`208`	`208`	`if param in params:`
`209`	`209`	`params.pop(param)`
`210`		`- self.model_parameters[target] = {`
	`210`	`+ self.model_parameters[utils.convert_target(target, self.original_target_column)] = {`
`211`	`211`	`"framework": SupportedModels.Prophet,`
`212`	`212`	`**params,`
`213`	`213`	`}`
`@@ -293,12 +293,14 @@ def _generate_report(self):`
`293`	`293`	`self.outputs[target], include_legend=True`
`294`	`294`	`),`
`295`	`295`	`target_columns=self.target_columns,`
	`296`	`+ original_target_column=self.original_target_column`
`296`	`297`	`)`
`297`	`298`
`298`	`299`	`sec2_text = dp.Text(f"## Forecast Broken Down by Trend Component")`
`299`	`300`	`sec2 = utils._select_plot_list(`
`300`	`301`	`lambda idx, target, *args: self.models[target].plot_components(self.outputs[target]),`
`301`	`302`	`target_columns=self.target_columns,`
	`303`	`+ original_target_column=self.original_target_column`
`302`	`304`	`)`
`303`	`305`
`304`	`306`	`sec3_text = dp.Text(f"## Forecast Changepoints")`
`@@ -313,7 +315,9 @@ def _generate_report(self):`
`313`	`315`	`for idx in range(len(self.target_columns))`
`314`	`316`	`]`
`315`	`317`	`sec3 = utils._select_plot_list(`
`316`		`- lambda idx, *args: sec3_figs[idx], target_columns=self.target_columns`
	`318`	`+ lambda idx, *args: sec3_figs[idx],`
	`319`	`+ target_columns=self.target_columns,`
	`320`	`+ original_target_column=self.original_target_column`
`317`	`321`	`)`
`318`	`322`
`319`	`323`	`all_sections = [sec1_text, sec1, sec2_text, sec2, sec3_text, sec3]`
`@@ -374,7 +378,7 @@ def _generate_report(self):`
`374`	`378`	`blocks = [`
`375`	`379`	`dp.DataTable(`
`376`	`380`	`local_ex_df.div(local_ex_df.abs().sum(axis=1), axis=0) * 100,`
`377`		`- label=s_id,`
	`381`	`+ label=utils.convert_target(s_id,self.original_target_column),`
`378`	`382`	`)`
`379`	`383`	`for s_id, local_ex_df in self.local_explanation.items()`
`380`	`384`	`]`