JJhooww's picture
Update README.md
3edb304 verified
|
raw
history blame
1.12 kB
metadata
license: apache-2.0
datasets:
  - nicholasKluge/Pt-Corpus
language:
  - pt

É um modelo base pré-treinado com cerca de 1b tokens em portugues iniciado com os pesos oficiais do modelo, deve ser utilizado para fine tuning.

Obs: Aguardando resultados oficiais

Mistral Base PTBR Mistral Base Melhoria
assin2_rte 90,2 87,74 2,46
assin2_sts 72,45 67,05 5,4
bluex 53,27 53,27 0
enem 64,66 62,42 2,24
faquad_nli 68,11 47,63 20,48
hatebr_offensive_binary 79,65 77,63 2,02
oab_exams 45,42 45,24 0,18
portuguese_hate_speech_binary 59,18 55,72 3,46