Spaces:

Xenova
/

sponsorblock-ml

Running

Joshua Lochner commited on Feb 17, 2022

Commit

e3d3d3f

1 Parent(s): cfbd4d5

Use correct logger per script

Files changed (3) hide show

src/evaluate.py CHANGED Viewed

@@ -128,6 +128,8 @@ def calculate_metrics(labelled_words, predictions):
 def main():
     hf_parser = HfArgumentParser((
         EvaluationArguments,
         DatasetArguments,

 def main():
+    logger.setLevel(logging.DEBUG)
     hf_parser = HfArgumentParser((
         EvaluationArguments,
         DatasetArguments,

src/predict.py CHANGED Viewed

@@ -393,7 +393,7 @@ def segments_to_predictions(segments, model, tokenizer):
 def main():
     # Test on unseen data
-    # logging.getLogger().setLevel(logging.DEBUG)
     hf_parser = HfArgumentParser((
         PredictArguments,

 def main():
     # Test on unseen data
+    logger.setLevel(logging.DEBUG)
     hf_parser = HfArgumentParser((
         PredictArguments,

src/preprocess.py CHANGED Viewed

@@ -529,8 +529,7 @@ class DatasetArguments:
 def main():
     # Responsible for getting transcrips using youtube_transcript_api,
     # then labelling it according to SponsorBlock's API
-    logging.getLogger().setLevel(logging.INFO)  # TODO make param
     # Generate final.json from sponsorTimes.csv
     hf_parser = HfArgumentParser((
@@ -561,7 +560,8 @@ def main():
     @lru_cache(maxsize=1)
     def read_db():
         if not preprocess_args.overwrite and os.path.exists(processed_db_path):
-            logger.info('Using cached processed database (use `--overwrite` to avoid this behaviour).')
             with open(processed_db_path) as fp:
                 return json.load(fp)
         logger.info('Processing raw database')
@@ -700,7 +700,8 @@ def main():
                         progress.update()
             except KeyboardInterrupt:
-                logger.info('Gracefully shutting down: Cancelling unscheduled tasks')
                 # only futures that are not done will prevent exiting
                 for future in to_process:
@@ -941,7 +942,8 @@ def main():
         else:
             logger.info(f'Skipping {dataset_args.excess_file}')
-        logger.info(f'Finished splitting: {len(sponsors)} sponsors, {len(non_sponsors)} non sponsors')
 def split(arr, ratios):

 def main():
     # Responsible for getting transcrips using youtube_transcript_api,
     # then labelling it according to SponsorBlock's API
+    logger.setLevel(logging.DEBUG)
     # Generate final.json from sponsorTimes.csv
     hf_parser = HfArgumentParser((
     @lru_cache(maxsize=1)
     def read_db():
         if not preprocess_args.overwrite and os.path.exists(processed_db_path):
+            logger.info(
+                'Using cached processed database (use `--overwrite` to avoid this behaviour).')
             with open(processed_db_path) as fp:
                 return json.load(fp)
         logger.info('Processing raw database')
                         progress.update()
             except KeyboardInterrupt:
+                logger.info(
+                    'Gracefully shutting down: Cancelling unscheduled tasks')
                 # only futures that are not done will prevent exiting
                 for future in to_process:
         else:
             logger.info(f'Skipping {dataset_args.excess_file}')
+        logger.info(
+            f'Finished splitting: {len(sponsors)} sponsors, {len(non_sponsors)} non sponsors')
 def split(arr, ratios):