Spaces:
Sleeping
Sleeping
File size: 10,316 Bytes
7f24255 fee3c3b ae192d1 fee3c3b 7f24b74 fee3c3b ae192d1 fee3c3b ae192d1 7f24255 6375400 7f24b74 fee3c3b ae192d1 fee3c3b ae192d1 7f24b74 ae192d1 fee3c3b ae192d1 7f24b74 ae192d1 fee3c3b 7f24b74 ae192d1 7f24b74 ae192d1 fee3c3b 7f24b74 ae192d1 7f24b74 ae192d1 fee3c3b ae192d1 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 |
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
import gradio as gr
# Load fine-tuned BanglaT5 models for different tasks
translation_model_en_bn = AutoModelForSeq2SeqLM.from_pretrained("csebuetnlp/banglat5_nmt_en_bn")
translation_tokenizer_en_bn = AutoTokenizer.from_pretrained("csebuetnlp/banglat5_nmt_en_bn")
translation_model_bn_en = AutoModelForSeq2SeqLM.from_pretrained("csebuetnlp/banglat5_nmt_bn_en")
translation_tokenizer_bn_en = AutoTokenizer.from_pretrained("csebuetnlp/banglat5_nmt_bn_en")
summarization_model = AutoModelForSeq2SeqLM.from_pretrained("skl25/banglat5_xlsum_fine-tuned")
summarization_tokenizer = AutoTokenizer.from_pretrained("skl25/banglat5_xlsum_fine-tuned")
paraphrase_model = AutoModelForSeq2SeqLM.from_pretrained("csebuetnlp/banglat5_banglaparaphrase")
paraphrase_tokenizer = AutoTokenizer.from_pretrained("csebuetnlp/banglat5_banglaparaphrase")
# Define task functions
def translate_text_en_bn(input_text):
inputs = translation_tokenizer_en_bn(input_text, return_tensors="pt")
outputs = translation_model_en_bn.generate(**inputs)
return translation_tokenizer_en_bn.decode(outputs[0], skip_special_tokens=True)
def translate_text_bn_en(input_text):
inputs = translation_tokenizer_bn_en(input_text, return_tensors="pt")
outputs = translation_model_bn_en.generate(**inputs)
return translation_tokenizer_bn_en.decode(outputs[0], skip_special_tokens=True)
def summarize_text(input_text):
inputs = summarization_tokenizer(input_text, return_tensors="pt")
outputs = summarization_model.generate(**inputs)
return summarization_tokenizer.decode(outputs[0], skip_special_tokens=True)
def paraphrase_text(input_text):
inputs = paraphrase_tokenizer(input_text, return_tensors="pt")
outputs = paraphrase_model.generate(**inputs)
return paraphrase_tokenizer.decode(outputs[0], skip_special_tokens=True)
# Task-specific examples
examples_translate_en_bn = [
["The Department of Computer Science and Engineering, the first department of its kind, was established in 1982 under the faculty of Electrical and Electronics Engineering. From the very initial days of its establishment, it has been able to attract the very best students of the country. Students securing topmost merit positions in the legendary admission test of BUET opt for studies in this department. At the very beginning, the department offered only M. Sc. Engg. and M Engg. degrees in Computer Science and Engineering. The Undergraduate program started in 1986. At first, 30 students were admitted each year for pursuing the B.Sc. Engineering degree."],
["Artificial intelligence is shaping the future."],
["Bangladesh is known for its rich culture and heritage."]
]
examples_translate_bn_en = [
["বাংলাদেশ দক্ষিণ এশিয়ার একটি সার্বভৌম রাষ্ট্র।"],
["ফুল মানুষের হৃদয়কে উজ্জীবিত করে। বাংলাদেশের বিভিন্ন অঞ্চলে নানা রকমের ফুল ফুটে থাকে, যেমন গোলাপ, জবা, এবং কৃষ্ণকলি। বিশেষত বসন্তে, ফুলের সৌন্দর্য যেন চারপাশে ছড়িয়ে পড়ে, এবং এর গন্ধ বাতাসে ভাসে। ফুলের উৎসব, যেমন 'বসন্ত উৎসব', এ দেশের সংস্কৃতির একটি গুরুত্বপূর্ণ অংশ।"],
["রবীন্দ্রনাথ ঠাকুরের গান বাংলা সংস্কৃতির একটি অবিচ্ছেদ্য অংশ।"]
]
examples_summarize = [
["বাংলাদেশ দক্ষিণ এশিয়ার একটি সার্বভৌম রাষ্ট্র। বাংলাদেশের সাংবিধানিক নাম গণপ্রজাতন্ত্রী বাংলাদেশ। ভৌগোলিকভাবে বাংলাদেশের পশ্চিমে ভারতের পশ্চিমবঙ্গ, উত্তরে পশ্চিমবঙ্গ, আসাম ও মেঘালয়, পূর্ব সীমান্তে আসাম, ত্রিপুরা ও মিজোরাম, দক্ষিণ-পূর্ব সীমান্তে মিয়ানমারের চিন ও রাখাইন রাজ্য এবং দক্ষিণ উপকূলের দিকে বঙ্গোপসাগর অবস্থিত। ভৌগোলিকভাবে পৃথিবীর বৃহত্তম ব-দ্বীপের সিংহভাগ অঞ্চল জুড়ে বাংলাদেশ ভূখণ্ড অবস্থিত। জনসংখ্যার বিচারে প্রায় ১৭ কোটিরও অধিক জনসংখ্যা নিয়ে বাংলাদেশ বিশ্বের ৮ম বৃহত্তম দেশ। নদীমাতৃক বাংলাদেশ ভূখণ্ডের উপর দিয়ে বয়ে গেছে ৫৭টি আন্তর্জাতিক নদী। বাংলাদেশের উত্তর-পূর্বে ও দক্ষিণ-পূর্বে টারশিয়ারি যুগের পাহাড় ছেয়ে আছে। বিশ্বের বৃহত্তম ম্যানগ্রোভ অরণ্য সুন্দরবন ও দীর্ঘতম প্রাকৃতিক সৈকত কক্সবাজার সমুদ্র সৈকত বাংলাদেশে অবস্থিত।"],
["বিশ্বের আরও একটি সেরা ক্লাব। স্প্যানিশ ফুটবলে বার্সেলোনারই প্রবল প্রতিদ্বন্দ্বী রিয়াল মাদ্রিদ। লিওনেল মেসির ক্লাব ইতিহাসে উয়েফা চ্যাম্পিয়নস লিগ জিতেছে মোট পাঁচবার। ইউরোপীয় কাপ উইনার্স কাপে তাদের সাফল্য আছে চারবার। পাশাপাশি তিনবার ক্লাব বিশ্বকাপ জেতা বার্সা লা লিগায় সাফল্য পেয়েছেন মোট ২৪ বার। ডিয়েগো ম্যারাডোনা, ইয়োহান ক্রুইফ, রিভালদোদের মতো খেলোয়াড়েরা এই ক্লাবের হয়ে অংশ হয়ে আছেন ইতিহাসের।"],
["ফুল মানুষের হৃদয়কে উজ্জীবিত করে। বাংলাদেশের বিভিন্ন অঞ্চলে নানা রকমের ফুল ফুটে থাকে, যেমন গোলাপ, জবা, এবং কৃষ্ণকলি। বিশেষত বসন্তে, ফুলের সৌন্দর্য যেন চারপাশে ছড়িয়ে পড়ে, এবং এর গন্ধ বাতাসে ভাসে। ফুলের উৎসব, যেমন 'বসন্ত উৎসব', এ দেশের সংস্কৃতির একটি গুরুত্বপূর্ণ অংশ।"]
]
examples_paraphrase = [
["তিনজনের কেউই বাবার পথ ধরে প্রযুক্তি দুনিয়ায় হাঁটেননি।"],
["প্রতিদিন নিয়মিত ব্যায়াম করা স্বাস্থ্যের জন্য উপকারী।"],
["বাংলাদেশের প্রাকৃতিক সৌন্দর্য সকলকে মুগ্ধ করে।"]
]
# Enhanced visual layout and interface design
with gr.Blocks(theme="grass") as demo:
gr.Markdown("# BanglaT5 Model Hub - Translation, Summarization & Paraphrasing")
gr.Markdown("Explore the power of BanglaT5 with this easy-to-use interface for multiple tasks like translation, summarization, and paraphrasing.")
with gr.Tabs():
# Tab for English to Bengali Translation
with gr.Tab("Translate English to Bengali"):
en_bn_text = gr.Textbox(label="Enter English Text", lines=5)
en_bn_output = gr.Textbox(label="Bengali Translation")
gr.Examples(examples_translate_en_bn, inputs=en_bn_text)
en_bn_button = gr.Button("Show Output")
en_bn_button.click(translate_text_en_bn, inputs=en_bn_text, outputs=en_bn_output)
# Tab for Bengali to English Translation
with gr.Tab("Translate Bengali to English"):
bn_en_text = gr.Textbox(label="Enter Bengali Text", lines=5)
bn_en_output = gr.Textbox(label="English Translation")
gr.Examples(examples_translate_bn_en, inputs=bn_en_text)
bn_en_button = gr.Button("Show Output")
bn_en_button.click(translate_text_bn_en, inputs=bn_en_text, outputs=bn_en_output)
# Tab for Summarization
with gr.Tab("Summarize"):
summarize_text_input = gr.Textbox(label="Enter Bengali Text to Summarize", lines=5)
summarize_output = gr.Textbox(label="Summary")
gr.Examples(examples_summarize, inputs=summarize_text_input)
summarize_button = gr.Button("Show Output")
summarize_button.click(summarize_text, inputs=summarize_text_input, outputs=summarize_output)
# Tab for Paraphrasing
with gr.Tab("Paraphrase"):
paraphrase_text_input = gr.Textbox(label="Enter Bengali Text to Paraphrase", lines=5)
paraphrase_output = gr.Textbox(label="Paraphrased Text")
gr.Examples(examples_paraphrase, inputs=paraphrase_text_input)
paraphrase_button = gr.Button("Show Output")
paraphrase_button.click(paraphrase_text, inputs=paraphrase_text_input, outputs=paraphrase_output)
demo.launch()
|