Spaces:

ljw20180420
/

SX_ispymac_FOREcasT

Sleeping

App Files Files Community

ljw20180420 commited on Nov 25, 2024

Commit

32ba7fe

verified ·

1 Parent(s): 7227e45

Upload AI_models/FOREcasT/inference.py with huggingface_hub

Browse files

Files changed (1) hide show

AI_models/FOREcasT/inference.py +41 -0

AI_models/FOREcasT/inference.py ADDED Viewed

	@@ -0,0 +1,41 @@

+import torch
+from datasets import load_dataset, Features, Value
+from torch.utils.data import DataLoader
+from diffusers import DiffusionPipeline
+from tqdm import tqdm
+from ..config import get_config, get_logger
+from .load_data import data_collector
+args = get_config(config_file="config_FOREcasT.ini")
+logger = get_logger(args)
+@torch.no_grad()
+def data_collector_inference(examples):
+    for example in examples:
+        ref, cut = example["ref"], example["cut"]
+        assert len(ref) >= args.ref1len and len(ref) >= args.ref2len, f"ref of length {len(ref)} is too short, please decrease ref1len={args.ref1len} and/or ref2len={args.ref2len} in inference arguments"
+        assert cut <= args.ref1len and len(ref) - cut <= args.ref2len, f"ref1len={args.ref1len} and/or ref2len={args.ref2len} is too short, please increase them to cover cut site {cut}"
+        assert cut >= args.FOREcasT_MAX_DEL_SIZE, f"ref upstream to cut ({cut}) is less than FOREcasT_MAX_DEL_SIZE ({args.FOREcasT_MAX_DEL_SIZE}), extend ref to upstream"
+        assert len(ref) - cut >= args.FOREcasT_MAX_DEL_SIZE, f"ref downstream to cut ({len(ref) - cut}) is less than FOREcasT_MAX_DEL_SIZE ({args.FOREcasT_MAX_DEL_SIZE}), extend ref to downstream"
+    return data_collector(examples, output_count=False)
+@torch.no_grad()
+def inference(data_name=args.data_name, data_files="inference.json.gz"):
+    logger.info("load inference data")
+    ds = load_dataset('json', data_files=data_files, features=Features({
+        'ref': Value('string'),
+        'cut': Value('int16')
+    }))["train"]
+    inference_dataloader = DataLoader(
+        dataset=ds,
+        batch_size=args.batch_size,
+        collate_fn=data_collector_inference
+    )
+    logger.info("setup pipeline")
+    pipe = DiffusionPipeline.from_pretrained(f"{args.owner}/{data_name}_FOREcasT", trust_remote_code=True, custom_pipeline=f"{args.owner}/{data_name}_FOREcasT", MAX_DEL_SIZE=args.FOREcasT_MAX_DEL_SIZE)
+    pipe.FOREcasT_model.to(args.device)
+    for batch in tqdm(inference_dataloader):
+        yield pipe(batch)