import gradio as gr import torch from transformers import pipeline, set_seed, AutoTokenizer, AutoModelForCausalLM import random title = "מחולל תקצירים פיקטיביים לספרים - מבוסס ג׳פיטי-נאו פצפון" article = "מודל השפה אומן על ידי דורון אדלר" description = "
Fine tuned Norod78/hebrew-gpt_neo-tiny upon a book summary dataset
" examples = [ ['הארי פוטר'], ['החתול המכאני'], ['אם מתחשק לכם לפעמים'], ["מחוללי הטקסט / "], ['האדם האחרון עלי אדמות ישב לבד בחדרו כשלפתע נשמע דפיקה'], ] model_id = "./hebrew-gpt_neo-tiny-HebrewBookSummaries" device = torch.device("cuda" if torch.cuda.is_available() else "cpu") n_gpu = 0 if torch.cuda.is_available()==False else torch.cuda.device_count() tokenizer = AutoTokenizer.from_pretrained(model_id, bos_token='<|startoftext|>', eos_token='<|endoftext|>', pad_token='<|pad|>', unknown_token = '<|unknown|>') model = AutoModelForCausalLM.from_pretrained(model_id).to(device) model.resize_token_embeddings(len(tokenizer)) text_generator = pipeline('text-generation', model=model, tokenizer=tokenizer) max_length = 96 top_k = 40 top_p = 0.92 temperature = 0.8 max_seed = (2**32)-1 global_seed = random.randint(0, max_seed) def text_generation(input_text = ''): global global_seed global_seed = global_seed + 1 if global_seed >= max_seed: global_seed = 0 if input_text == None or len(input_text) == 0: input_text = "<|startoftext|>" set_seed(global_seed) generated_text = text_generator(input_text, max_length=max_length, top_k=top_k, top_p=top_p, temperature=temperature, do_sample=True, repetition_penalty=2.0, num_return_sequences=1) parsed_text = generated_text[0]["generated_text"].replace("<|startoftext|>", "").replace("\r","\n").replace("\n\n", "\n").replace("\t", " ").replace("<|pad|>", " * ").replace("\"\"", "\"").strip() print("parsed_text = \"" + parsed_text + "\" (seed = " + str(global_seed) + ")") return parsed_text gr.Interface( text_generation, inputs=gr.Textbox(lines=1, label=".הזינו פה את מילות הפתיחה של הטקסט, בחרו את אחת מן הדוגמאות המוכנות או השאירו ריק. מה שבא לכם. בכל לחיצה על סאבמיט, יווצר טקסט אחר", elem_id="input_text"), outputs=gr.Textbox(type="text", label="פה מופיע הטקסט שהמחולל יוצר", elem_id="output_text"), css="#output_text{direction: rtl} #input_text{direction: rtl}", title=title, description=description, article=article, examples=examples, cache_examples=False, allow_flagging='never', ).launch()