Spaces:

tanyuzhou
/

Ro-Play

Sleeping

tanyuzhou commited on Jun 11

Commit

2a86641

•

1 Parent(s): 179e18d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -38,12 +38,15 @@ def respond(
     inputs = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt")
     inputs = inputs.to("cuda")
     # Generate response
     generate_ids = model.generate(
         inputs,
         max_length=max_tokens,
         temperature=temperature,
-        top_p=top_p
     )
     # Decode the generated response

     inputs = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt")
     inputs = inputs.to("cuda")
+    print("eos_token_id: ", tokenizer.eos_token_id)
     # Generate response
     generate_ids = model.generate(
         inputs,
         max_length=max_tokens,
         temperature=temperature,
+        top_p=top_p,
+        eos_token_id=tokenizer.eos_token_id,
     )
     # Decode the generated response