RichardErkhov
/

akhooli_-_gpt2-small-arabic-4bits

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

RichardErkhov commited on Apr 17, 2024

Commit

9d18674

·

verified ·

1 Parent(s): 28b7822

uploaded readme

Files changed (1) hide show

README.md +63 -0

README.md ADDED Viewed

	@@ -0,0 +1,63 @@

+Quantization made by Richard Erkhov.
+[Github](https://github.com/RichardErkhov)
+[Discord](https://discord.gg/pvy7H8DZMG)
+[Request more models](https://github.com/RichardErkhov/quant_request)
+gpt2-small-arabic - bnb 4bits
+- Model creator: https://huggingface.co/akhooli/
+- Original model: https://huggingface.co/akhooli/gpt2-small-arabic/
+Original model description:
+---
+language: "ar"
+datasets:
+- Arabic Wikipedia
+metrics:
+- none
+---
+# GPT2-Small-Arabic
+## Model description
+GPT2 model from Arabic Wikipedia dataset based on gpt2-small (using Fastai2).
+## Intended uses & limitations
+#### How to use
+An example is provided in this [colab notebook](https://colab.research.google.com/drive/1mRl7c-5v-Klx27EEAEOAbrfkustL4g7a?usp=sharing).
+Both text and poetry (fine-tuned model) generation are included.
+#### Limitations and bias
+GPT2-small-arabic (trained on Arabic Wikipedia) has several limitations in terms of coverage (Arabic Wikipeedia quality, no diacritics) and training performance.
+Use as demonstration or proof of concepts but not as production code.
+## Training data
+This pretrained model used the Arabic Wikipedia dump (around 900 MB).
+## Training procedure
+Training was done using [Fastai2](https://github.com/fastai/fastai2/) library on Kaggle, using free GPU.
+## Eval results
+Final perplexity reached was 72.19,  loss: 4.28, accuracy: 0.307
+### BibTeX entry and citation info
+```bibtex
+@inproceedings{Abed Khooli,
+  year={2020}
+}
+```