Spaces:

emon-j
/

Translator

Sleeping

emon1521 commited on Sep 8, 2023

Commit

7f3ad0d

•

1 Parent(s): 0d399d8

Add application file

Files changed (7) hide show

app.py ADDED Viewed

+import streamlit as st
+import ctranslate2
+import transformers
+from translator import translate
+st.title("On Device Translator")
+user_input = st.text_area("Enter text to be translated in English here.")
+languages = {
+    "English": "eng_Latn",
+    "Japanese": "jpn_Jpan",
+    "Hindi": "hin_Deva",
+    "French": "fra_Latn",
+    "Spanish": "spa_Latn",
+    "Chinese": "zho_Hans",
+    "Italian": "ita_Latn",
+    "German": "deu_Latn",
+    "Russian": "rus_Cyrl"
+}
+selected_language = st.selectbox("Select Target Language", list(languages.keys()))
+if st.button("Translate"):
+    translated_text = translate(user_input, tgt_lang=languages[selected_language])
+    st.write(f"Translated text: {translated_text}")

lid.176.ftz ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:8f3472cfe8738a7b6099e8e999c3cbfae0dcd15696aac7d7738a8039db603e83
+size 938013

nllb-200-distilled-600M/config.json ADDED Viewed

+{
+  "add_source_bos": false,
+  "add_source_eos": false,
+  "bos_token": "<s>",
+  "decoder_start_token": "</s>",
+  "eos_token": "</s>",
+  "layer_norm_epsilon": null,
+  "unk_token": "<unk>"
+}

nllb-200-distilled-600M/model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:a3aef73bb382ccae3b25a2fecd7cfdc0146625e8ecd51c92f585984eaf654bc1
+size 622596037

nllb-200-distilled-600M/shared_vocabulary.json ADDED Viewed

The diff for this file is too large to render. See raw diff

requirments.txt ADDED Viewed

+gooey
+ctranslate2
+transformers

translator.py ADDED Viewed

+import ctranslate2
+import transformers
+def translate(text,tgt_lang):
+    translator = ctranslate2.Translator("nllb-200-distilled-600M")
+    tokenizer = transformers.AutoTokenizer.from_pretrained("facebook/nllb-200-distilled-600M")
+    source = tokenizer.convert_ids_to_tokens(tokenizer.encode(text))
+    target_prefix = [tgt_lang]
+    results = translator.translate_batch([source], target_prefix=[target_prefix])
+    target = results[0].hypotheses[0][1:]
+    final_result = tokenizer.decode(tokenizer.convert_tokens_to_ids(target))
+    return final_result
+#tgt_lang = "eng_Latn"
+#translated_text = translate("জাপান একটি সুন্দর দেশ। আমি জাপান যেতে আগ্রহী।", tgt_lang)
+#print(translated_text)