codesage
/

codesage-base

Inference Endpoints

Model card Files Files and versions Community

codesage commited on Jun 26

Commit

37adc26

•

1 Parent(s): e9eb555

Update README.md

Files changed (1) hide show

README.md +3 -1

README.md CHANGED Viewed

@@ -30,7 +30,9 @@ from transformers import AutoModel, AutoTokenizer
 checkpoint = "codesage/codesage-base"
 device = "cuda"  # for GPU usage or "cpu" for CPU usage
-tokenizer = AutoTokenizer.from_pretrained(checkpoint, trust_remote_code=True)
 model = AutoModel.from_pretrained(checkpoint, trust_remote_code=True).to(device)
 inputs = tokenizer.encode("def print_hello_world():\tprint('Hello World!')", return_tensors="pt").to(device)

 checkpoint = "codesage/codesage-base"
 device = "cuda"  # for GPU usage or "cpu" for CPU usage
+# CodeSage requires adding eos token at the end of each tokenized sequence to ensure good performance
+tokenizer = AutoTokenizer.from_pretrained(checkpoint, trust_remote_code=True, add_eos_token=True)
 model = AutoModel.from_pretrained(checkpoint, trust_remote_code=True).to(device)
 inputs = tokenizer.encode("def print_hello_world():\tprint('Hello World!')", return_tensors="pt").to(device)