File size: 1,348 Bytes
ac9a78c |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 |
---
language:
- nl
tags:
- punctuation prediction
- punctuation
datasets: sonar
license: mit
widget:
- text: "hervatting van de zitting ik verklaar de zitting van het europees parlement die op vrijdag 17 december werd onderbroken te zijn hervat"
example_title: "Euro Parl Sample"
metrics:
- f1
---
## Model
Trained on Sonar corpus
## Performance
Evaluated on dutch Euro Parl
```
precision recall f1-score support
0 0.990421 0.994986 0.992698 9627605
. 0.942931 0.948408 0.945662 433554
, 0.813030 0.773804 0.792932 379759
? 0.806700 0.790499 0.798518 13494
- 0.606461 0.045317 0.084332 27341
: 0.599856 0.501284 0.546158 18305
accuracy 0.981467 10500058
macro avg 0.793233 0.675716 0.693383 10500058
weighted avg 0.980127 0.981467 0.980138 10500058
```
Usage:
```bash
pip install deepmultilingualpunctuation
```
```python
from deepmultilingualpunctuation import PunctuationModel
model = PunctuationModel(model="oliverguhr/fullstop-dutch-punctuation-prediction")
text = "hervatting van de zitting ik verklaar de zitting van het europees parlement die op vrijdag 17 december werd onderbroken te zijn hervat"
result = model.restore_punctuation(text)
print(result)
```
|