metadata
license: cc-by-sa-4.0
datasets:
- srwac
- jerteh/SrpWiki
- jerteh/SrpELTeC
- jerteh/cc100-sr-jerteh
language:
- sr
tags:
- srpski
- Serbian
- RoBERTa
- BERT
- MaskedLM
Mali enkoderski model za srpski jezik.
Pored navedenih, model je obučavan i na ostalim korpusima Društva za jezičke resurse i tehnologije, uključujući korpuse savremenog srpskog jezika: SrpKor2013 i SrpKor2021, kao i korpus PDRS 1.0 razvijen od strane Instituta za Srpski jezik SANU.
Autor: Mihailo Škorić (procesaur)