ClassCat
/

roberta-small-basque

Inference Endpoints

Model card Files Files and versions Community

ClassCat commited on Jul 19, 2022

Commit

3da5163

•

1 Parent(s): 6202d6e

Update README.md

Files changed (1) hide show

README.md +5 -3

README.md CHANGED Viewed

@@ -3,13 +3,14 @@ language: eu
 license: cc-by-sa-4.0
 datasets:
 - cc100
 widget:
 - text: "Euria egingo <mask> gaur ?"
 - text: "<mask> umeari liburua eman dio."
 - text: "Zein da zure <mask> ?"
 ---
-## RoBERTa Basque x-small model (Uncased)
 ### Prerequisites
@@ -17,7 +18,7 @@ transformers==4.19.2
 ### Model architecture
-This model uses half the size of RoBERTa base setttings.
 ### Tokenizer
@@ -26,12 +27,13 @@ Using BPE tokenizer with vocabulary size 50,000.
 ### Training Data
 * Subset of [CC-100/eu](https://data.statmt.org/cc-100/) : Monolingual Datasets from Web Crawl Data
 ### Usage
 ```python
 from transformers import pipeline
-unmasker = pipeline('fill-mask', model='ClassCat/roberta-xsmall-basque')
 unmasker("Zein da zure <mask> ?")
 ```

 license: cc-by-sa-4.0
 datasets:
 - cc100
+- oscar
 widget:
 - text: "Euria egingo <mask> gaur ?"
 - text: "<mask> umeari liburua eman dio."
 - text: "Zein da zure <mask> ?"
 ---
+## RoBERTa Basque small model (Uncased)
 ### Prerequisites
 ### Model architecture
+This model uses approximately half the size of RoBERTa base model parameters.
 ### Tokenizer
 ### Training Data
 * Subset of [CC-100/eu](https://data.statmt.org/cc-100/) : Monolingual Datasets from Web Crawl Data
+* Subset of [oscar](https://huggingface.co/datasets/oscar)
 ### Usage
 ```python
 from transformers import pipeline
+unmasker = pipeline('fill-mask', model='ClassCat/roberta-small-basque')
 unmasker("Zein da zure <mask> ?")
 ```