Mae'r model LLM yn seiliedig ar Mistral-7B, gyda estyniad yn y tocynnydd ar gyfer y Gymraeg drwy fod yn seiliedig ar BangorAI/mistral-7b-cy-tokenizer

Mae wedi cael hyfforddiant parhaus ar ddata Gymreig OSCAR-2301 am 1 Epoch.

Pwrpas y model yw fod yn gychwyn i hyfforddiant cywrain pellach i greu casgliad o LLMs cymreig penodol.

Downloads last month
16
Safetensors
Model size
7.35B params
Tensor type
F32
·
BF16
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Dataset used to train BangorAI/mistral-7b-cy-tokenizer-train-6