emanuelaboros commited on
Commit
beedfc5
1 Parent(s): a76cf3f

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +22 -0
README.md CHANGED
@@ -170,6 +170,28 @@ which outputs the following top-5 predictions (using constrained beam search)
170
  ['Agence France-Presse >> fr ', 'Agence France-Presse >> fr ', 'Agence France-Presse de la Presse écrite >> fr ', 'Agence France-Presse de la porte de Vincennes >> fr ', 'Agence France-Presse de la porte océanique >> fr ']
171
  ```
172
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
173
  ---
174
  license: agpl-3.0
175
  ---
 
170
  ['Agence France-Presse >> fr ', 'Agence France-Presse >> fr ', 'Agence France-Presse de la Presse écrite >> fr ', 'Agence France-Presse de la porte de Vincennes >> fr ', 'Agence France-Presse de la porte océanique >> fr ']
171
  ```
172
 
173
+ Example with simulated OCR noise:
174
+ ```
175
+ sentences = ["[START] Un1ted Press [END] - On the h0me fr0nt, the British p0pulace remains steadfast in the f4ce of 0ngoing air raids.",
176
+ "In [START] Lon6on [END], trotz d3r Zerstörung, ist der Geist der M3nschen ungeb4ochen, mit Freiwilligen und zivilen Verteidigungseinheiten, die unermüdlich arbeiten, um die Kriegsanstrengungen zu unterstützen.",
177
+ "Les rapports des correspondants de la [START] AFP [END] mettent en lumiére la poussée nationale pour augmenter la production dans les usines, essentielle pour fournir au front les matériaux nécessaires à la victoire."]
178
+
179
+ for sentence in sentences:
180
+ outputs = model.generate(
181
+ **tokenizer([sentence], return_tensors="pt"),
182
+ num_beams=5,
183
+ num_return_sequences=5
184
+ )
185
+
186
+ print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
187
+ ```
188
+
189
+ ```
190
+ ['United Press International >> en ', 'Un1ted Press >> en ', 'Joseph Bradley Varnum >> en ', 'The Press >> en ', 'The Unused Press >> en ']
191
+ ['London >> de ', 'Longbourne >> de ', 'Longbon >> de ', 'Longston >> de ', 'Lyon >> de ']
192
+ ['Agence France-Presse >> fr ', 'Agence France-Presse >> fr ', 'Agence France-Presse de la Presse écrite >> fr ', 'Agence France-Presse de la porte de Vincennes >> fr ', 'Agence France-Presse de la porte océanique >> fr ']
193
+ ```
194
+
195
  ---
196
  license: agpl-3.0
197
  ---