Updated logging of the id field

pvaidyan · pvaidyan · commit 582e294c4204 · 2024-02-23T12:17:03.000-06:00
diff --git a/source/merge-s3-files/app.py b/source/merge-s3-files/app.py
@@ -14,7 +14,7 @@ def lambda_handler(event, context):
     bucket = event['bucket']
     key = event['key']
     to_process_folder = event['toProcessFolder']
-
+    data = []
     output_path = to_process_folder.replace("to_process", "output")
 
     output = []
@@ -63,6 +63,15 @@ def lambda_handler(event, context):
                                         Key=s3_target_key,
                                         Body=output_body)
 
+        line_num = 0
+        lines = output_body.splitlines();
+        for line in lines:
+            words = line.split(",")
+            if line_num > 0:
+                data.append(words[0])
+            line_num += 1
+
+        logger.info("Data", input_file=key, data=data)
         return {"response": response, "S3OutputFileName": s3_target_key, "originalFileName": key}
 
     except Exception as e:
diff --git a/source/split-ip-file/app.py b/source/split-ip-file/app.py
@@ -40,7 +40,11 @@ def lambda_handler(event, context):
     # Number of files to be created
     num_files = file_count(s3.open(input_file, 'r'), file_delimiter, file_row_limit)
     # Split the input file into several files, each with the number of records mentioned in the fileChunkSize parameter.
-    splitFileNames = split(s3.open(input_file, 'r'), file_delimiter, file_row_limit, output_file_template,
+    splitFileNames = split(input_file,
+                           s3.open(input_file, 'r'),
+                           file_delimiter,
+                           file_row_limit,
+                           output_file_template,
                            output_path, True,
                            num_files)
     # Archive the input file.
@@ -65,11 +69,11 @@ def file_count(file_handler, delimiter, row_limit):
 
 
 # Split the input into several smaller files.
-def split(filehandler, delimiter, row_limit, output_name_template, output_path, keep_headers, num_files):
+def split(input_file, filehandler, delimiter, row_limit, output_name_template, output_path, keep_headers, num_files):
     import csv
     reader = csv.reader(filehandler, delimiter=delimiter)
     split_file_path = []
-
+    data = []
     current_piece = 1
     current_out_path = os.path.join(
         output_path,
@@ -94,6 +98,8 @@ def split(filehandler, delimiter, row_limit, output_name_template, output_path,
             if keep_headers:
                 current_out_writer.writerow(headers)
         current_out_writer.writerow(row)
+        data.append(row[0])
+    logger.info("Data", input_file=input_file, data=data)
     return split_file_path