qingy2024
/

UwU-14B-Math-v0.2

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qingy2024 commited on 13 days ago

Commit

44c844c

•

1 Parent(s): 65c9b18

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -36,7 +36,8 @@ This model is a fine-tuned version of **Qwen 2.5-14B**, trained on QwQ 32B Previ
   - Gradient Accumulation Steps: 2 (Effective Batch Size: 16)
   - Warm-Up Steps: 5
   - Weight Decay: 0.01
-- **Training Steps**: 500 steps
 ---

   - Gradient Accumulation Steps: 2 (Effective Batch Size: 16)
   - Warm-Up Steps: 5
   - Weight Decay: 0.01
+- **Training Steps**: 500 steps
+- **Hardware Information**: A100-80GB
 ---