Spaces:

KIMOSSINO
/

transciptio

Sleeping

App Files Files Community

KIMOSSINO commited on Dec 7, 2024

Commit

0df4d00

verified ·

1 Parent(s): 3d72b47

Update app.py

Browse files

Files changed (1) hide show

app.py +81 -21

app.py CHANGED Viewed

@@ -31,28 +31,60 @@ SUPPORTED_LANGUAGES = {
     'de': 'Deutsch'
 }
-# تعيين أصوات لكل لغة
 VOICE_MAPPINGS = {
-    'ar': 'ar-EG-ShakirNeural',
-    'en': 'en-US-EricNeural',
-    'fr': 'fr-FR-HenriNeural',
-    'es': 'es-ES-AlvaroNeural',
-    'de': 'de-DE-ConradNeural'
 }
 # تحديد اللغات RTL
 RTL_LANGUAGES = ['ar']
-async def generate_speech(text, lang):
-    """توليد الصوت باستخدام edge-tts"""
     try:
-        voice = VOICE_MAPPINGS.get(lang, 'en-US-EricNeural')
-        communicate = edge_tts.Communicate(text, voice)
         audio_path = tempfile.mktemp(suffix='.mp3')
         await communicate.save(audio_path)
-        # التحقق من وجود الملف وحجمه
         if os.path.exists(audio_path) and os.path.getsize(audio_path) > 0:
             logger.info(f"تم إنشاء ملف صوتي: {audio_path}")
             return audio_path
@@ -64,8 +96,8 @@ async def generate_speech(text, lang):
         logger.error(f"خطأ في توليد الصوت: {str(e)}")
         return None
-def text_to_speech(text, lang, progress=gr.Progress()):
-    """واجهة لتحويل النص إلى صوت"""
     if not text:
         logger.warning("لم يتم تقديم نص للتحويل إلى صوت")
         return None
@@ -82,7 +114,7 @@ def text_to_speech(text, lang, progress=gr.Progress()):
         audio_files = []
         for i, part in enumerate(text_parts):
             progress((i + 1) / len(text_parts), desc=f"معالجة الجزء {i+1} من {len(text_parts)}...")
-            audio_path = asyncio.run(generate_speech(part, lang))
             if audio_path:
                 audio_files.append(audio_path)
@@ -276,8 +308,22 @@ def create_ui():
                     elem_classes=["ltr"]
                 )
                 with gr.Row():
-                    generate_original_audio = gr.Button("🔊 توليد الصوت", variant="secondary")
-                    original_audio = gr.Audio(label="الصوت", visible=True)
             with gr.TabItem("🔄 النص المترجم"):
                 translated_text = gr.Textbox(
@@ -286,8 +332,22 @@ def create_ui():
                     elem_classes=["rtl"]
                 )
                 with gr.Row():
-                    generate_translated_audio = gr.Button("🔊 توليد الصوت", variant="secondary")
-                    translated_audio = gr.Audio(label="الصوت", visible=True)
         with gr.Row():
             download_btn = gr.File(
@@ -318,13 +378,13 @@ def create_ui():
         generate_original_audio.click(
             fn=text_to_speech,
-            inputs=[original_text, source_lang],
             outputs=[original_audio]
         )
         generate_translated_audio.click(
             fn=text_to_speech,
-            inputs=[translated_text, target_lang],
             outputs=[translated_audio]
         )
@@ -336,4 +396,4 @@ if __name__ == "__main__":
         demo = create_ui()
         demo.launch()
     except Exception as e:
-        logger.error(f"خطأ في تشغيل التطبيق: {str(e)}")

     'de': 'Deutsch'
 }
+# تعيين أصوات لكل لغة مع خيارات الجنس
 VOICE_MAPPINGS = {
+    'ar': {
+        'male': 'ar-EG-ShakirNeural',
+        'female': 'ar-EG-SalmaNeural'
+    },
+    'en': {
+        'male': 'en-US-EricNeural',
+        'female': 'en-US-JennyNeural'
+    },
+    'fr': {
+        'male': 'fr-FR-HenriNeural',
+        'female': 'fr-FR-DeniseNeural'
+    },
+    'es': {
+        'male': 'es-ES-AlvaroNeural',
+        'female': 'es-ES-ElviraNeural'
+    },
+    'de': {
+        'male': 'de-DE-ConradNeural',
+        'female': 'de-DE-KatjaNeural'
+    }
+}
+# تعريف أنماط الصوت
+VOICE_STYLES = {
+    'normal': {'rate': '1.0', 'volume': '1.0', 'pitch': '1.0'},
+    'excited': {'rate': '1.2', 'volume': '1.5', 'pitch': '1.3'},
+    'calm': {'rate': '0.9', 'volume': '0.8', 'pitch': '0.9'},
+    'angry': {'rate': '1.1', 'volume': '1.4', 'pitch': '0.8'},
+    'broadcaster': {'rate': '1.1', 'volume': '1.2', 'pitch': '1.1'}
 }
 # تحديد اللغات RTL
 RTL_LANGUAGES = ['ar']
+async def generate_speech(text, lang, gender='male', style='normal'):
+    """توليد الصوت باستخدام edge-tts مع خيارات متقدمة"""
     try:
+        if not text:
+            logger.warning("لم يتم تقديم نص للتحويل إلى صوت")
+            return None
+        voice = VOICE_MAPPINGS[lang][gender]
+        style_params = VOICE_STYLES[style]
+        # إنشاء سلسلة الخيارات للصوت
+        voice_options = f"rate={style_params['rate']} volume={style_params['volume']} pitch={style_params['pitch']}"
+        communicate = edge_tts.Communicate(text, voice, options=voice_options)
         audio_path = tempfile.mktemp(suffix='.mp3')
         await communicate.save(audio_path)
         if os.path.exists(audio_path) and os.path.getsize(audio_path) > 0:
             logger.info(f"تم إنشاء ملف صوتي: {audio_path}")
             return audio_path
         logger.error(f"خطأ في توليد الصوت: {str(e)}")
         return None
+def text_to_speech(text, lang, gender='male', style='normal', progress=gr.Progress()):
+    """واجهة لتحويل النص إلى صوت مع خيارات متقدمة"""
     if not text:
         logger.warning("لم يتم تقديم نص للتحويل إلى صوت")
         return None
         audio_files = []
         for i, part in enumerate(text_parts):
             progress((i + 1) / len(text_parts), desc=f"معالجة الجزء {i+1} من {len(text_parts)}...")
+            audio_path = asyncio.run(generate_speech(part, lang, gender, style))
             if audio_path:
                 audio_files.append(audio_path)
                     elem_classes=["ltr"]
                 )
                 with gr.Row():
+                    with gr.Column():
+                        original_gender = gr.Radio(
+                            choices=["male", "female"],
+                            value="male",
+                            label="🧑 جنس المتحدث",
+                            info="اختر جنس المتحدث"
+                        )
+                        original_style = gr.Dropdown(
+                            choices=list(VOICE_STYLES.keys()),
+                            value="normal",
+                            label="🎭 نمط الصوت",
+                            info="اختر نمط الصوت المناسب"
+                        )
+                    with gr.Column():
+                        generate_original_audio = gr.Button("🔊 توليد الصوت", variant="secondary")
+                        original_audio = gr.Audio(label="الصوت", visible=True)
             with gr.TabItem("🔄 النص المترجم"):
                 translated_text = gr.Textbox(
                     elem_classes=["rtl"]
                 )
                 with gr.Row():
+                    with gr.Column():
+                        translated_gender = gr.Radio(
+                            choices=["male", "female"],
+                            value="male",
+                            label="🧑 جنس المتحدث",
+                            info="اختر جنس المتحدث"
+                        )
+                        translated_style = gr.Dropdown(
+                            choices=list(VOICE_STYLES.keys()),
+                            value="normal",
+                            label="🎭 نمط الصوت",
+                            info="اختر نمط الصوت المناسب"
+                        )
+                    with gr.Column():
+                        generate_translated_audio = gr.Button("🔊 توليد الصوت", variant="secondary")
+                        translated_audio = gr.Audio(label="الصوت", visible=True)
         with gr.Row():
             download_btn = gr.File(
         generate_original_audio.click(
             fn=text_to_speech,
+            inputs=[original_text, source_lang, original_gender, original_style],
             outputs=[original_audio]
         )
         generate_translated_audio.click(
             fn=text_to_speech,
+            inputs=[translated_text, target_lang, translated_gender, translated_style],
             outputs=[translated_audio]
         )
         demo = create_ui()
         demo.launch()
     except Exception as e:
+        logger.error(f"خطأ في تشغيل التطبيق: {str(e)}")