Fix issues in sample code: Invalid reward_tokenizer and issue in returning scores

Currently, when running the code, following errors occur. I fixed the two.

![image.png](https://cdn-uploads.huggingface.co/production/uploads/5f2e7dad7e58354338620780/zpJXicZV8Sr34HwXXQDd3.png)

![image.png](https://cdn-uploads.huggingface.co/production/uploads/5f2e7dad7e58354338620780/X3S1IrFyOYo-kThEg9gJ7.png)

![image.png](https://cdn-uploads.huggingface.co/production/uploads/5f2e7dad7e58354338620780/1TpnamB20jOiLPexXoPxg.png)

Files changed (1) hide show

README.md +1 -2

README.md CHANGED Viewed

@@ -92,11 +92,10 @@ class GPTRewardModel(nn.Module):
             c_ind = c_inds[0].item() if len(c_inds) > 0 else input_ids.shape[1]
             scores.append(rewards[i, c_ind - 1])
         return scores
-            return scores
 ## Load the model and tokenizer
-reward_model = GPTRewardModel("meta-llama/Llama-2-7b-chat-hf", reward_tokenizer.eos_token_id)
 reward_tokenizer = reward_model.tokenizer
 reward_tokenizer.truncation_side = "left"

             c_ind = c_inds[0].item() if len(c_inds) > 0 else input_ids.shape[1]
             scores.append(rewards[i, c_ind - 1])
         return scores
 ## Load the model and tokenizer
+reward_model = GPTRewardModel("meta-llama/Llama-2-7b-chat-hf")
 reward_tokenizer = reward_model.tokenizer
 reward_tokenizer.truncation_side = "left"