aixsatoshi
/

Mixtral-8x7B-ja-Lora-sft-ChatbotArenaJAcalm2

huggingfaceのモデルカード上にデータセットを記載する

by ddyuudd - opened Feb 7

←

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,5 +1,7 @@
 ---
 license: cc-by-4.0
 ---
 Mixtral8X7B Instructの日本語生成を安定させるためのLoraです。
@@ -73,4 +75,4 @@ num_fewshot: 2, batch_size: 1
 Lora学習時のcontext長は4096tokenまでですが、4k token以上の出力も可能です。
 注：bf16での使用を想定しています。
-量子化推論する場合は、bf16でモデルを読み込んだ状態でLora適応またはマージ、その後に量子化してください。

 ---
 license: cc-by-4.0
+datasets:
+- cyberagent/chatbot-arena-ja-calm2-7b-chat-experimental
 ---
 Mixtral8X7B Instructの日本語生成を安定させるためのLoraです。
 Lora学習時のcontext長は4096tokenまでですが、4k token以上の出力も可能です。
 注：bf16での使用を想定しています。
+量子化推論する場合は、bf16でモデルを読み込んだ状態でLora適応またはマージ、その後に量子化してください。