ICEPVP8977
/

Uncensored_llama_3.2_3b_safetensors

Text Generation

Model card Files Files and versions Community

ICEPVP8977 commited on Sep 30

Commit

346beef

•

1 Parent(s): c8dd085

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -36,17 +36,17 @@ import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
-# Load the merged model and tokenizer
-merged_model = AutoModelForCausalLM.from_pretrained("./model", torch_dtype=torch.float16, device_map="auto")
 tokenizer = AutoTokenizer.from_pretrained("./model")
 ```
 ```python
 prompt = "Your_question_here"
-inputs = tokenizer(prompt, return_tensors="pt").to(merged_model.device)
 max_new_tokens = 2000  # Set the maximum number of tokens in the response
-outputs = merged_model.generate(**inputs, max_new_tokens=max_new_tokens)
 response = tokenizer.decode(outputs[0], skip_special_tokens=True)
 print(response)
 ```

 from transformers import AutoModelForCausalLM, AutoTokenizer
+model = AutoModelForCausalLM.from_pretrained("./model", torch_dtype=torch.float16, device_map="auto")
 tokenizer = AutoTokenizer.from_pretrained("./model")
 ```
 ```python
 prompt = "Your_question_here"
+inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
 max_new_tokens = 2000  # Set the maximum number of tokens in the response
+outputs = model.generate(**inputs, max_new_tokens=max_new_tokens)
 response = tokenizer.decode(outputs[0], skip_special_tokens=True)
 print(response)
 ```