{ "cells": [ { "cell_type": "code", "execution_count": 7, "id": "19bbb494-3054-48ae-9b64-7f0756c0532d", "metadata": {}, "outputs": [], "source": [ "import re\n", "\n", "def replace_words(sentence):\n", " # Define a dictionary mapping a single word to a list of words or phrases\n", " replacement_map = {\n", " # Multiples of ten\n", " 'twenty': ['ट्वेंटी', 'बीस'],\n", " 'thirty': ['थर्टी', 'तीस'],\n", " 'forty': ['फोर्टी', 'चालीस'],\n", " 'fifty': ['फिफ्टी', 'पचास'],\n", " 'sixty': ['सिक्स्टी', 'साठ'],\n", " 'seventy': ['सेवंटी', 'सत्तर','सेवनटी','सेवेनटी','सेवांटी'],\n", " 'eighty': ['एटी', 'अस्सी'],\n", " 'ninety': ['नाइंटी', 'नब्बे'],\n", " \n", " # Numbers from 11 to 19\n", " 'eleven': ['इलेवन', 'ग्यारह','इगारा'],\n", " 'twelve': ['ट्वेल्व', 'बारह'],\n", " 'thirteen': ['थर्टीन', 'तेरह','तेरा'],\n", " 'fourteen': ['फोर्टीन', 'चौदह'],\n", " 'fifteen': ['फिफ्टीन', 'पंद्रह','पंद्रा'],\n", " 'sixteen': ['सिक्स्टीन', 'सोलह','सोल्ला'],\n", " 'seventeen': ['सेवंटीन', 'सत्रह''सतरा'],\n", " 'eighteen': ['एटीन', 'अठारह''अठारा'],\n", " 'nineteen': ['नाइनटीन', 'उन्नीस','उन्नईस','उनाइस'],\n", "\n", " # Numbers from 21 to 29\n", " 'twenty one': ['ट्वेंटी वन', 'इक्कीस'],\n", " 'twenty two': ['ट्वेंटी टू', 'बाईस'],\n", " 'twenty three': ['ट्वेंटी थ्री', 'तेईस'],\n", " 'twenty four': ['ट्वेंटी फोर', 'चौबीस'],\n", " 'twenty five': ['ट्वेंटी फाइव', 'पच्चीस'],\n", " 'twenty six': ['ट्वेंटी सिक्स', 'छब्बीस'],\n", " 'twenty seven': ['ट्वेंटी सेवन', 'सत्ताईस','सताईस'],\n", " 'twenty eight': ['ट्वेंटी एट', 'अट्ठाईस','अठ्ठाइस','अठ्ठाईस'],\n", " 'twenty nine': ['ट्वेंटी नाइन', 'उनतीस'],\n", "\n", " # Numbers from 31 to 39\n", " 'thirty one': ['थर्टी वन', 'इकतीस'],\n", " 'thirty two': ['थर्टी टू', 'बत्तीस'],\n", " 'thirty three': ['थर्टी थ्री', 'तेतीस'],\n", " 'thirty four': ['थर्टी फोर', 'चौंतीस'],\n", " 'thirty five': ['थर्टी फाइव', 'पैंतीस'],\n", " 'thirty six': ['थर्टी सिक्स', 'छत्तीस'],\n", " 'thirty seven': ['थर्टी सेवन', 'सैंतीस'],\n", " 'thirty eight': ['थर्टी एट', 'अड़तीस'],\n", " 'thirty nine': ['थर्टी नाइन', 'उनतालीस'],\n", "\n", " # Numbers from 41 to 49\n", " 'forty one': ['फोर्टी वन', 'इकतालीस'],\n", " 'forty two': ['फोर्टी टू', 'बयालीस'],\n", " 'forty three': ['फोर्टी थ्री', 'तैंतालीस'],\n", " 'forty four': ['फोर्टी फोर', 'चौंतालीस'],\n", " 'forty five': ['फोर्टी फाइव', 'पैंतालीस'],\n", " 'forty six': ['फोर्टी सिक्स', 'छयालिस'],\n", " 'forty seven': ['फोर्टी सेवन', 'सैंतालीस'],\n", " 'forty eight': ['फोर्टी एट', 'अड़तालीस'],\n", " 'forty nine': ['फोर्टी नाइन', 'उनचास'],\n", "\n", " # Numbers from 51 to 59\n", " 'fifty one': ['फिफ्टी वन', 'इक्यावन'],\n", " 'fifty two': ['फिफ्टी टू', 'बावन'],\n", " 'fifty three': ['फिफ्टी थ्री', 'तिरेपन'],\n", " 'fifty four': ['फिफ्टी फोर', 'चौवन'],\n", " 'fifty five': ['फिफ्टी फाइव', 'पचपन'],\n", " 'fifty six': ['फिफ्टी सिक्स', 'छप्पन','छपपन'],\n", " 'fifty seven': ['फिफ्टी सेवन', 'सत्तावन','संताबन','संतावन'],\n", " 'fifty eight': ['फिफ्टी एट', 'अट्ठावन','अंठावन'],\n", " 'fifty nine': ['फिफ्टी नाइन', 'उनसठ','उंसट'],\n", "\n", " # Numbers from 61 to 69\n", " 'sixty one': ['सिक्स्टी वन', 'इकसठ'],\n", " 'sixty two': ['सिक्स्टी टू', 'बासठ'],\n", " 'sixty three': ['सिक्स्टी थ्री', 'तिरसठ'],\n", " 'sixty four': ['सिक्स्टी फोर', 'चौंसठ'],\n", " 'sixty five': ['सिक्स्टी फाइव', 'पैंसठ'],\n", " 'sixty six': ['सिक्स्टी सिक्स', 'छियासठ'],\n", " 'sixty seven': ['सिक्स्टी सेवन', 'सड़सठ'],\n", " 'sixty eight': ['सिक्स्टी एट', 'अड़सठ'],\n", " 'sixty nine': ['सिक्स्टी नाइन', 'उनहत्तर'],\n", "\n", " # Numbers from 71 to 79\n", " 'seventy one': ['सेवंटी वन', 'इकहत्तर','इखत्तर','इकत्तर'],\n", " 'seventy two': ['सेवंटी टू', 'बहत्तर'],\n", " 'seventy three': ['सेवंटी थ्री', 'तिहत्तर','तियत्र','तियत्तर','तीहत्तर','तिहत्थर'],\n", " 'seventy four': ['सेवंटी फोर', 'चौहत्तर',],\n", " 'seventy five': ['सेवंटी फाइव', 'पचहत्तर','पछत्तर','पिछत्तर','पचहत्तर','पचत्तर'],\n", " 'seventy six': ['सेवंटी सिक्स', 'छिहत्तर','छीहत्तर'],\n", " 'seventy seven': ['सेवंटी सेवन', 'सतहत्तर','सतात्तर','सतत्तर','सतहत्थर'],\n", " 'seventy eight': ['सेवंटी एट', 'अठहत्तर','अठत्तर'],\n", " 'seventy nine': ['सेवंटी नाइन', 'उन्यासी','उनासी'],\n", "\n", " # Numbers from 81 to 89\n", " 'eighty one': ['एटी वन', 'इक्यासी'],\n", " 'eighty two': ['एटी टू', 'बयासी'],\n", " 'eighty three': ['एटी थ्री', 'तिरासी'],\n", " 'eighty four': ['एटी फोर', 'चौरासी'],\n", " 'eighty five': ['एटी फाइव', 'पचासी'],\n", " 'eighty six': ['एटी सिक्स', 'छियासी'],\n", " 'eighty seven': ['एटी सेवन', 'सतासी'],\n", " 'eighty eight': ['एटी एट', 'अठासी'],\n", " 'eighty nine': ['एटी नाइन', 'नवासी'],\n", "\n", " # Numbers from 91 to 99\n", " 'ninety one': ['नाइंटी वन', 'इक्यानवे'],\n", " 'ninety two': ['नाइंटी टू', 'बानवे'],\n", " 'ninety three': ['नाइंटी थ्री', 'तिरानवे'],\n", " 'ninety four': ['नाइंटी फोर', 'चौरानवे'],\n", " 'ninety five': ['नाइंटी फाइव', 'पचानवे'],\n", " 'ninety six': ['नाइंटी सिक्स', 'छियानवे'],\n", " 'ninety seven': ['नाइंटी सेवन', 'सतानवे'],\n", " 'ninety eight': ['नाइंटी एट', 'अठानवे'],\n", " 'ninety nine': ['नाइंटी नाइन', 'निन्यानवे'],\n", " # Numbers from one to ten\n", " 'seven': ['सेवन', 'सात'],\n", " 'zero': ['शून्य', 'जेरो', 'शुन्ना', 'जीरो'],\n", " 'one': ['वन', 'एंक', 'इक', 'एक'],\n", " 'two': ['टू', 'दो'],\n", " 'three': ['थ्री', 'तीना', 'तीन', 'त्री'],\n", " 'four': ['फोर', 'फॉर', 'च्यार', 'चार'],\n", " 'five': ['फाइव', 'पाँच', 'पांच'],\n", " 'six': ['सिक्स', 'चह', 'छौ', 'छै', 'छह', 'छे'],\n", " 'eight': ['एट', 'अट', 'आठ'],\n", " 'nine': ['नाइन', 'नौ'],\n", " 'ten': ['टेन', 'दस'],\n", " # Hundred\n", " 'hundred': ['हंड्रेड', 'सौ','सो','साव'],\n", " # Thousand\n", " 'thousand' : ['हजार','थौजनड','थाउजंड','हज़ार'],\n", " # Lakhs\n", " 'lac' : ['लाख'],\n", "\n", " # Special for double digits\n", " 'डबल': ['दबल', 'डबल', 'दुबाल'],\n", " }\n", "\n", " words = sentence.split() # Split the sentence by spaces\n", "\n", " # Replace words using the mapping\n", " for i, word in enumerate(words):\n", " for replacement, patterns in replacement_map.items():\n", " if word in patterns:\n", " words[i] = replacement # Replace the word if it's fully matched\n", "\n", " # Join the processed words back into a sentence\n", " return ' '.join(words)" ] }, { "cell_type": "code", "execution_count": null, "id": "7bdb593a-cb68-4b04-af8d-b61ea396a5eb", "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.11.7" } }, "nbformat": 4, "nbformat_minor": 5 }