lunahr
/

thea-rp-3b-25r

@@ -13,7 +13,7 @@ tags:
 base_model: SicariusSicariiStuff/Impish_LLAMA_3B
 datasets:
 - KingNish/reasoning-base-20k
-- piotr25691/thea-name-overrides
 model-index:
 - name: thea-rp-3b-25r
   results:
@@ -30,7 +30,7 @@ model-index:
       value: 65.78
       name: strict accuracy
     source:
-      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=piotr25691/thea-rp-3b-25r
       name: Open LLM Leaderboard
   - task:
       type: text-generation
@@ -45,7 +45,7 @@ model-index:
       value: 20.01
       name: normalized accuracy
     source:
-      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=piotr25691/thea-rp-3b-25r
       name: Open LLM Leaderboard
   - task:
       type: text-generation
@@ -60,7 +60,7 @@ model-index:
       value: 11.71
       name: exact match
     source:
-      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=piotr25691/thea-rp-3b-25r
       name: Open LLM Leaderboard
   - task:
       type: text-generation
@@ -75,7 +75,7 @@ model-index:
       value: 3.24
       name: acc_norm
     source:
-      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=piotr25691/thea-rp-3b-25r
       name: Open LLM Leaderboard
   - task:
       type: text-generation
@@ -90,7 +90,7 @@ model-index:
       value: 5.93
       name: acc_norm
     source:
-      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=piotr25691/thea-rp-3b-25r
       name: Open LLM Leaderboard
   - task:
       type: text-generation
@@ -107,7 +107,7 @@ model-index:
       value: 22.89
       name: accuracy
     source:
-      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=piotr25691/thea-rp-3b-25r
       name: Open LLM Leaderboard
 ---
@@ -125,7 +125,7 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 MAX_REASONING_TOKENS = 1024
 MAX_RESPONSE_TOKENS = 512
-model_name = "piotr25691/thea-rp-3b-25r"
 model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype="auto", device_map="auto")
 tokenizer = AutoTokenizer.from_pretrained(model_name)
@@ -153,7 +153,7 @@ response_output = tokenizer.decode(response_ids[0, response_inputs.input_ids.sha
 print("ANSWER: " + response_output)
 ```
-- **Trained by:** [Piotr Zalewski](https://huggingface.co/piotr25691)
 - **License:** llama3.2
 - **Finetuned from model:** [SicariusSicariiStuff/Impish_LLAMA_3B](https://huggingface.co/SicariusSicariiStuff/Impish_LLAMA_3B)
 - **Dataset used:** [KingNish/reasoning-base-20k](https://huggingface.co/datasets/KingNish/reasoning-base-20k)

 base_model: SicariusSicariiStuff/Impish_LLAMA_3B
 datasets:
 - KingNish/reasoning-base-20k
+- lunahr/thea-name-overrides
 model-index:
 - name: thea-rp-3b-25r
   results:
       value: 65.78
       name: strict accuracy
     source:
+      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=lunahr/thea-rp-3b-25r
       name: Open LLM Leaderboard
   - task:
       type: text-generation
       value: 20.01
       name: normalized accuracy
     source:
+      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=lunahr/thea-rp-3b-25r
       name: Open LLM Leaderboard
   - task:
       type: text-generation
       value: 11.71
       name: exact match
     source:
+      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=lunahr/thea-rp-3b-25r
       name: Open LLM Leaderboard
   - task:
       type: text-generation
       value: 3.24
       name: acc_norm
     source:
+      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=lunahr/thea-rp-3b-25r
       name: Open LLM Leaderboard
   - task:
       type: text-generation
       value: 5.93
       name: acc_norm
     source:
+      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=lunahr/thea-rp-3b-25r
       name: Open LLM Leaderboard
   - task:
       type: text-generation
       value: 22.89
       name: accuracy
     source:
+      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=lunahr/thea-rp-3b-25r
       name: Open LLM Leaderboard
 ---
 MAX_REASONING_TOKENS = 1024
 MAX_RESPONSE_TOKENS = 512
+model_name = "lunahr/thea-rp-3b-25r"
 model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype="auto", device_map="auto")
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 print("ANSWER: " + response_output)
 ```
+- **Trained by:** [Piotr Zalewski](https://huggingface.co/lunahr)
 - **License:** llama3.2
 - **Finetuned from model:** [SicariusSicariiStuff/Impish_LLAMA_3B](https://huggingface.co/SicariusSicariiStuff/Impish_LLAMA_3B)
 - **Dataset used:** [KingNish/reasoning-base-20k](https://huggingface.co/datasets/KingNish/reasoning-base-20k)