impresso-project
/

nel-mgenre-multilingual

Text2Text Generation

entity-retrieval

named-entity-disambiguation

entity-disambiguation

named-entity-linking

Inference Endpoints

Model card Files Files and versions Community

emanuelaboros commited on Oct 17, 2024

Commit

19638c4

•

1 Parent(s): 964213b

Update README.md

Files changed (1) hide show

README.md +1 -29

README.md CHANGED Viewed

@@ -142,35 +142,7 @@ This model was finetuned on the [HIPE-2022 dataset](https://github.com/hipe-eval
 ## Usage
-Here is an example of generation for Wikipedia page disambiguation:
-```python
-from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
-tokenizer = AutoTokenizer.from_pretrained("impresso-project/nel-hipe-multilingual")
-model = AutoModelForSeq2SeqLM.from_pretrained("impresso-project/nel-hipe-multilingual").eval()
-sentences = ["[START] United Press [END] - On the home front, the British populace remains steadfast in the face of ongoing air raids.",
-             "In [START] London [END], trotz der Zerstörung, ist der Geist der Menschen ungebrochen, mit Freiwilligen und zivilen Verteidigungseinheiten, die unermüdlich arbeiten, um die Kriegsanstrengungen zu unterstützen.",
-             "Les rapports des correspondants de la [START] AFP [END] mettent en lumière la poussée nationale pour augmenter la production dans les usines, essentielle pour fournir au front les matériaux nécessaires à la victoire."]
-for sentence in sentences:
-    outputs = model.generate(
-        **tokenizer([sentence], return_tensors="pt"),
-        num_beams=5,
-        num_return_sequences=5
-    )
-    print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
-```
-which outputs the following top-5 predictions (using constrained beam search)
-```
-['United Press International >> en ', 'The United Press International >> en ', 'United Press International >> de ', 'United Press >> en ', 'Associated Press >> en ']
-['London >> de ', 'London >> de ', 'London >> de ', 'Stadt London >> de ', 'Londonderry >> de ']
-['Agence France-Presse >> fr ', 'Agence France-Presse >> fr ', 'Agence France-Presse de la Presse écrite >> fr ', 'Agence France-Presse de la porte de Vincennes >> fr ', 'Agence France-Presse de la porte océanique >> fr ']
-```
-Example with simulated OCR noise:
 ```python
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

 ## Usage
+Here is an example of generation for Wikipedia page disambiguation with simulated OCR noise:
 ```python
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM