ryota39
/

bilingual-gpt-neox-4b-instruction-sft-en-ja-84k

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

ryota39 commited on Mar 17, 2024

Commit

a5d9c97

·

verified ·

1 Parent(s): a41ea31

Update README.md

Files changed (1) hide show

README.md +44 -1

README.md CHANGED Viewed

@@ -1,3 +1,46 @@
 ---
-license: mit
 ---

 ---
+license: cc-by-sa-4.0
+datasets:
+- izumi-lab/llm-japanese-dataset
+library_name: transformers
 ---
+# モデル
+- rinna/bilingual-gpt-neox-4b-instruction-sftに、84,300件の和訳データセットをフルパラメータファインチューニングしたモデルです。
+- ファインチューニングに使用したデータセットは`izumi-lab/llm-japanese-dataset`から和訳タスクのデータセットのみ抽出し、学習に使用しました。
+# コード
+```python
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("rinna/bilingual-gpt-neox-4b-instruction-sft", use_fast=False)
+model = AutoModelForCausalLM.from_pretrained("ryota39/bilingual-gpt-neox-4b-instruction-sft-en-ja-84k")
+if torch.cuda.is_available():
+    model = model.to("cuda")
+prompt = list()
+prompt.append("指示: 以下の英語を日本語に翻訳してください。")
+prompt.append("ユーザー: Do you deliver on Sundays?")
+prompt.append("システム: ")
+prompt = '\n'.join(prompt)
+print(prompt)
+token_ids = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt")
+with torch.no_grad():
+    output_ids = model.generate(
+        token_ids.to(model.device),
+        max_new_tokens=512,
+        do_sample=False,
+        temperature=0.7,
+        top_p=0.85,
+        pad_token_id=tokenizer.pad_token_id,
+        bos_token_id=tokenizer.bos_token_id,
+        eos_token_id=tokenizer.eos_token_id
+    )
+output = tokenizer.decode(output_ids.tolist()[0][token_ids.size(1):])
+print(output)
+```