PatrickHaller
/

xlstm_wikipedia_110M_500M

Model card Files Files and versions Community

PatrickHaller commited on Aug 30, 2024

Commit

d8e810f

·

verified ·

1 Parent(s): 3a67ab0

Update README.md

Files changed (1) hide show

README.md +10 -2

README.md CHANGED Viewed

@@ -1,7 +1,9 @@
 ---
-language:
 - en
 license: mit
 ---
 # An xLSTM Model
@@ -24,7 +26,7 @@ conda activate xlstm
 ```python
 from transformers import AutoModelForCasualLM, AutoTokenizer
-model_name_or_path = "PatrickHaller/xlstm_dummy"
 model = AutoModelForCasualLM.from_pretrained(model_name_or_path)
 tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
@@ -36,3 +38,9 @@ generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
 print(generated_text)
 ```

 ---
+language:
 - en
 license: mit
+datasets:
+- PatrickHaller/wiki-and-book-corpus-500M
 ---
 # An xLSTM Model
 ```python
 from transformers import AutoModelForCasualLM, AutoTokenizer
+model_name_or_path = "PatrickHaller/xlstm_wikipedia_110M_500M"
 model = AutoModelForCasualLM.from_pretrained(model_name_or_path)
 tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
 print(generated_text)
 ```
+## Evaluation
+We evaluated all xLSTM wikipedia models on common zero-shot LM benchmarks:
+![Evaluation](eval.png)