Spaces:

schuler
/

experimental-kphi-3-micro-4k-instruct-gradio-autoloader

Sleeping

App Files Files Community

schuler commited on Dec 3, 2024

Commit

af862b7

•

1 Parent(s): d4d5ab3

Update app.py

Files changed (1) hide show

app.py +5 -5

app.py CHANGED Viewed

@@ -13,11 +13,11 @@ REPO_NAME = 'schuler/experimental-JP47D21-KPhi-3-micro-4k-instruct'
 # How to cache?
 @spaces.GPU()
-def load_model(repo_name):
-    # tokenizer = AutoTokenizer.from_pretrained(REPO_NAME, trust_remote_code=True)
-    tokenizer = LlamaTokenizer.from_pretrained(REPO_NAME, trust_remote_code=True)
-    generator_conf = GenerationConfig.from_pretrained(REPO_NAME)
-    model = AutoModelForCausalLM.from_pretrained(REPO_NAME, trust_remote_code=True, torch_dtype=torch.bfloat16, attn_implementation="eager")
     # model.to('cuda')
     return tokenizer, generator_conf, model

 # How to cache?
 @spaces.GPU()
+def load_model(local_repo_name):
+    # tokenizer = AutoTokenizer.from_pretrained(local_repo_name, trust_remote_code=True)
+    tokenizer = LlamaTokenizer.from_pretrained(local_repo_name, trust_remote_code=True)
+    generator_conf = GenerationConfig.from_pretrained(local_repo_name)
+    model = AutoModelForCausalLM.from_pretrained(local_repo_name, trust_remote_code=True, torch_dtype=torch.bfloat16, attn_implementation="eager")
     # model.to('cuda')
     return tokenizer, generator_conf, model