Spaces:

Fralet
/

youtube

Sleeping

Fralet commited on Jun 21, 2024

Commit

6b8e76a

verified ·

1 Parent(s): b95583d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,6 @@
 import logging
 from transformers import MarianMTModel, MarianTokenizer
 # Setup logging
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
@@ -15,13 +16,13 @@ def translate_to_english(text):
     model = MarianMTModel.from_pretrained(model_name)
     logger.info("Tokenizing text")
-    tokenized_text = tokenizer.prepare_seq2seq_batch([text], return_tensors='pt')
     logger.info("Performing translation")
-    translation = model.generate(**tokenized_text)
     logger.info("Decoding translation")
-    translated_text = tokenizer.decode(translation[0], skip_special_tokens=True)
     return translated_text
 # Sample Russian text

 import logging
 from transformers import MarianMTModel, MarianTokenizer
+import sentencepiece
 # Setup logging
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
     model = MarianMTModel.from_pretrained(model_name)
     logger.info("Tokenizing text")
+    tokenized_text = tokenizer(text, return_tensors='pt', padding=True, truncation=True)
     logger.info("Performing translation")
+    translated_tokens = model.generate(**tokenized_text)
     logger.info("Decoding translation")
+    translated_text = tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
     return translated_text
 # Sample Russian text