File size: 1,348 Bytes
ac9a78c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
---
language:
- nl
tags:
- punctuation prediction
- punctuation
datasets: sonar
license: mit
widget:
- text: "hervatting van de zitting ik verklaar de zitting van het europees parlement die op vrijdag 17 december werd onderbroken te zijn hervat"
  example_title: "Euro Parl Sample"
metrics:
- f1
---

## Model

Trained on Sonar corpus

## Performance

Evaluated on dutch Euro Parl
```
              precision    recall  f1-score   support

           0   0.990421  0.994986  0.992698   9627605
           .   0.942931  0.948408  0.945662    433554
           ,   0.813030  0.773804  0.792932    379759
           ?   0.806700  0.790499  0.798518     13494
           -   0.606461  0.045317  0.084332     27341
           :   0.599856  0.501284  0.546158     18305

    accuracy                       0.981467  10500058
   macro avg   0.793233  0.675716  0.693383  10500058
weighted avg   0.980127  0.981467  0.980138  10500058

```

Usage:

```bash
pip install deepmultilingualpunctuation
```

```python
from deepmultilingualpunctuation import PunctuationModel

model = PunctuationModel(model="oliverguhr/fullstop-dutch-punctuation-prediction")
text = "hervatting van de zitting ik verklaar de zitting van het europees parlement die op vrijdag 17 december werd onderbroken te zijn hervat"
result = model.restore_punctuation(text)
print(result)
```