TwentyNine
/

nllb-ain-kana-latin-converter-v1

@@ -16,7 +16,7 @@ The following is adapted from [slone/nllb-rus-tyv-v1](https://huggingface.co/slo
 ```Python
 # the version of transformers is important!
-!pip install sentencepiece transformers==4.33
 import torch
 from transformers import NllbTokenizer, AutoModelForSeq2SeqLM
@@ -39,14 +39,14 @@ def fix_tokenizer(tokenizer, new_lang):
 MODEL_URL = "TwentyNine/nllb-ain-kana-latin-converter-v1"
 model = AutoModelForSeq2SeqLM.from_pretrained(MODEL_URL)
 tokenizer = NllbTokenizer.from_pretrained(MODEL_URL)
-fix_tokenizer(tokenizer, 'ain_Jpan')
 fix_tokenizer(tokenizer, 'ain_Latn')
-def translate(
     text,
     model,
     tokenizer,
-    src_lang='ain_Jpan',
     tgt_lang='ain_Latn',
     max_length='auto',
     num_beams=4,
@@ -69,8 +69,12 @@ def translate(
     out = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
     if isinstance(text, str) and n_out is None:
         return out[0]
-    return
-translate("ポイ　セタ　クコン　ルスイ", model=model, tokenizer=tokenizer)
 # 'pon seta ku=kor rusuy'
 ```

 ```Python
 # the version of transformers is important!
+!pip install sentencepiece transformers==4.33 > /dev/null
 import torch
 from transformers import NllbTokenizer, AutoModelForSeq2SeqLM
 MODEL_URL = "TwentyNine/nllb-ain-kana-latin-converter-v1"
 model = AutoModelForSeq2SeqLM.from_pretrained(MODEL_URL)
 tokenizer = NllbTokenizer.from_pretrained(MODEL_URL)
+fix_tokenizer(tokenizer, 'ain_Japn')
 fix_tokenizer(tokenizer, 'ain_Latn')
+def convert(
     text,
     model,
     tokenizer,
+    src_lang='ain_Japn',
     tgt_lang='ain_Latn',
     max_length='auto',
     num_beams=4,
     out = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
     if isinstance(text, str) and n_out is None:
         return out[0]
+    return
+convert("ポイ　セタ　クコン　ルスイ", model=model, tokenizer=tokenizer)
 # 'pon seta ku=kor rusuy'
+convert("タント がっこう　オルン　パイェ", model=model, tokenizer=tokenizer)
+# 'tanto がっこう or un paye'
+# ideal: 'tanto GAKKO or un paye' or  'tanto GAKKOU or un paye'
 ```