emanuelaboros
commited on
Commit
•
beedfc5
1
Parent(s):
a76cf3f
Update README.md
Browse files
README.md
CHANGED
@@ -170,6 +170,28 @@ which outputs the following top-5 predictions (using constrained beam search)
|
|
170 |
['Agence France-Presse >> fr ', 'Agence France-Presse >> fr ', 'Agence France-Presse de la Presse écrite >> fr ', 'Agence France-Presse de la porte de Vincennes >> fr ', 'Agence France-Presse de la porte océanique >> fr ']
|
171 |
```
|
172 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
173 |
---
|
174 |
license: agpl-3.0
|
175 |
---
|
|
|
170 |
['Agence France-Presse >> fr ', 'Agence France-Presse >> fr ', 'Agence France-Presse de la Presse écrite >> fr ', 'Agence France-Presse de la porte de Vincennes >> fr ', 'Agence France-Presse de la porte océanique >> fr ']
|
171 |
```
|
172 |
|
173 |
+
Example with simulated OCR noise:
|
174 |
+
```
|
175 |
+
sentences = ["[START] Un1ted Press [END] - On the h0me fr0nt, the British p0pulace remains steadfast in the f4ce of 0ngoing air raids.",
|
176 |
+
"In [START] Lon6on [END], trotz d3r Zerstörung, ist der Geist der M3nschen ungeb4ochen, mit Freiwilligen und zivilen Verteidigungseinheiten, die unermüdlich arbeiten, um die Kriegsanstrengungen zu unterstützen.",
|
177 |
+
"Les rapports des correspondants de la [START] AFP [END] mettent en lumiére la poussée nationale pour augmenter la production dans les usines, essentielle pour fournir au front les matériaux nécessaires à la victoire."]
|
178 |
+
|
179 |
+
for sentence in sentences:
|
180 |
+
outputs = model.generate(
|
181 |
+
**tokenizer([sentence], return_tensors="pt"),
|
182 |
+
num_beams=5,
|
183 |
+
num_return_sequences=5
|
184 |
+
)
|
185 |
+
|
186 |
+
print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
|
187 |
+
```
|
188 |
+
|
189 |
+
```
|
190 |
+
['United Press International >> en ', 'Un1ted Press >> en ', 'Joseph Bradley Varnum >> en ', 'The Press >> en ', 'The Unused Press >> en ']
|
191 |
+
['London >> de ', 'Longbourne >> de ', 'Longbon >> de ', 'Longston >> de ', 'Lyon >> de ']
|
192 |
+
['Agence France-Presse >> fr ', 'Agence France-Presse >> fr ', 'Agence France-Presse de la Presse écrite >> fr ', 'Agence France-Presse de la porte de Vincennes >> fr ', 'Agence France-Presse de la porte océanique >> fr ']
|
193 |
+
```
|
194 |
+
|
195 |
---
|
196 |
license: agpl-3.0
|
197 |
---
|