LIFineTuned

Paused

alexkueck commited on Jun 22, 2023

Commit

b596828

1 Parent(s): 4a09457

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -43,7 +43,6 @@ def group_texts(examples):
 xxx = os.getenv("TOKEN")
 login(token=xxx)
 #Modelle und Tokenizer
-model_name = "alexkueck/LIFineTuned"
 #Alternativ mit beliebigen Modellen:
 base_model = "project-baize/baize-v2-7b"  #load_8bit = False (in load_tokenizer_and_model)
@@ -63,7 +62,7 @@ dataset_neu = daten_laden("alexkueck/tis")
 tokenized_datasets = dataset_neu.map(tokenize_function, batched=True, num_proc=4, remove_columns=["id","text"])
 print (tokenized_datasets["train"][4])
-print(f"{model_name}/model/")
 #den Text nun zusammenführen (concatenieren) und anschließend in kleine Häppchen aufteilen (block_size=128), die verarbeitet werden können
 #das macht die map-Funktion und das Attribut batched = True
 #man könnte das weglassen, wenn jeder Satz einzeln gegeben wurde in den Texten...

 xxx = os.getenv("TOKEN")
 login(token=xxx)
 #Modelle und Tokenizer
 #Alternativ mit beliebigen Modellen:
 base_model = "project-baize/baize-v2-7b"  #load_8bit = False (in load_tokenizer_and_model)
 tokenized_datasets = dataset_neu.map(tokenize_function, batched=True, num_proc=4, remove_columns=["id","text"])
 print (tokenized_datasets["train"][4])
 #den Text nun zusammenführen (concatenieren) und anschließend in kleine Häppchen aufteilen (block_size=128), die verarbeitet werden können
 #das macht die map-Funktion und das Attribut batched = True
 #man könnte das weglassen, wenn jeder Satz einzeln gegeben wurde in den Texten...