import gradio as gr
import whisper
import os
import asyncio
import edge_tts
from transformers import pipeline
from deep_translator import GoogleTranslator
from docx import Document
import tempfile
from datetime import datetime
import logging
import sys

# إعداد التسجيل
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
    handlers=[
        logging.FileHandler('app.log'),
        logging.StreamHandler(sys.stdout)
    ]
)
logger = logging.getLogger(__name__)

# قائمة اللغات المدعومة
SUPPORTED_LANGUAGES = {
    'ar': 'العربية',
    'en': 'English',
    'fr': 'Français',
    'es': 'Español',
    'de': 'Deutsch'
}

# تعيين أصوات لكل لغة
VOICE_MAPPINGS = {
    'ar': 'ar-EG-ShakirNeural',
    'en': 'en-US-EricNeural',
    'fr': 'fr-FR-HenriNeural',
    'es': 'es-ES-AlvaroNeural',
    'de': 'de-DE-ConradNeural'
}

# تحديد اللغات RTL
RTL_LANGUAGES = ['ar']

async def generate_speech(text, lang):
    """توليد الصوت باستخدام edge-tts"""
    try:
        voice = VOICE_MAPPINGS.get(lang, 'en-US-EricNeural')
        communicate = edge_tts.Communicate(text, voice)
        
        audio_path = tempfile.mktemp(suffix='.mp3')
        await communicate.save(audio_path)
        
        # التحقق من وجود الملف وحجمه
        if os.path.exists(audio_path) and os.path.getsize(audio_path) > 0:
            logger.info(f"تم إنشاء ملف صوتي: {audio_path}")
            return audio_path
        else:
            logger.error("فشل إنشاء ملف صوتي صالح")
            return None
            
    except Exception as e:
        logger.error(f"خطأ في توليد الصوت: {str(e)}")
        return None

def text_to_speech(text, lang, progress=gr.Progress()):
    """واجهة لتحويل النص إلى صوت"""
    if not text:
        logger.warning("لم يتم تقديم نص للتحويل إلى صوت")
        return None
        
    try:
        progress(0.2, desc="جاري تجهيز الصوت...")
        logger.info(f"بدء تحويل النص إلى صوت باللغة: {lang}")
        
        # تقسيم النص إلى أجزاء إذا كان طويلاً
        max_length = 1000
        text_parts = [text[i:i+max_length] for i in range(0, len(text), max_length)]
        
        # إنشاء ملف صوتي لكل جزء
        audio_files = []
        for i, part in enumerate(text_parts):
            progress((i + 1) / len(text_parts), desc=f"معالجة الجزء {i+1} من {len(text_parts)}...")
            audio_path = asyncio.run(generate_speech(part, lang))
            if audio_path:
                audio_files.append(audio_path)
        
        if not audio_files:
            logger.error("لم يتم إنشاء أي ملفات صوتية")
            return None
            
        # إذا كان هناك جزء واحد فقط
        if len(audio_files) == 1:
            return audio_files[0]
            
        # دمج الملفات الصوتية إذا كان هناك أكثر من جزء
        from pydub import AudioSegment
        
        final_audio = AudioSegment.from_mp3(audio_files[0])
        for audio_file in audio_files[1:]:
            final_audio += AudioSegment.from_mp3(audio_file)
        
        final_path = tempfile.mktemp(suffix='.mp3')
        final_audio.export(final_path, format="mp3")
        
        # تنظيف الملفات المؤقتة
        for file in audio_files:
            try:
                os.remove(file)
            except:
                pass
        
        progress(1.0, desc="تم إنشاء الصوت بنجاح!")
        return final_path
            
    except Exception as e:
        logger.error(f"خطأ في تحويل النص إلى صوت: {str(e)}")
        return None

def create_document(original_text, translated_text, source_lang, target_lang, progress=gr.Progress()):
    """إنشاء ملف Word يحتوي على النص الأصلي والترجمة"""
    try:
        progress(0, desc="جاري إنشاء المستند...")
        doc = Document()
        doc.add_heading('النص الأصلي والترجمة', 0)
        
        progress(0.3, desc="جاري إضافة المحتوى...")
        # إضافة التاريخ والوقت
        doc.add_paragraph(f'تم الإنشاء في: {datetime.now().strftime("%Y-%m-%d %H:%M:%S")}')
        
        # إضافة النص الأصلي
        doc.add_heading(f'النص الأصلي ({SUPPORTED_LANGUAGES[source_lang]})', level=1)
        doc.add_paragraph(original_text)
        
        progress(0.6, desc="جاري إضافة الترجمة...")
        # إضافة الترجمة
        doc.add_heading(f'الترجمة ({SUPPORTED_LANGUAGES[target_lang]})', level=1)
        doc.add_paragraph(translated_text)
        
        # حفظ الملف
        progress(0.9, desc="جاري حفظ المستند...")
        temp_path = tempfile.mktemp(suffix='.docx')
        doc.save(temp_path)
        
        progress(1.0, desc="تم إنشاء المستند بنجاح!")
        logger.info(f"تم إنشاء مستند Word: {temp_path}")
        return temp_path
        
    except Exception as e:
        logger.error(f"خطأ في إنشاء المستند: {str(e)}")
        return None

def translate_text(text, source_lang, target_lang, progress=gr.Progress()):
    """ترجمة النص باستخدام deep-translator"""
    if source_lang == target_lang:
        return text
    
    try:
        progress(0.3, desc="جاري الترجمة...")
        logger.info(f"بدء الترجمة من {source_lang} إلى {target_lang}")
        
        translator = GoogleTranslator(source=source_lang, target=target_lang)
        
        # تقسيم النص إلى أجزاء إذا كان طويلاً
        max_length = 5000
        text_parts = [text[i:i+max_length] for i in range(0, len(text), max_length)]
        
        translated_parts = []
        for i, part in enumerate(text_parts):
            progress((i + 1) / len(text_parts), desc=f"ترجمة الجزء {i+1} من {len(text_parts)}...")
            translated_part = translator.translate(part)
            translated_parts.append(translated_part)
        
        translated_text = ' '.join(translated_parts)
        progress(1.0, desc="تمت الترجمة بنجاح!")
        
        return translated_text
        
    except Exception as e:
        logger.error(f"خطأ في الترجمة: {str(e)}")
        return f"خطأ في الترجمة: {str(e)}"

def format_timestamp(seconds):
    """تحويل الثواني إلى تنسيق MM:SS"""
    minutes = int(seconds // 60)
    seconds = int(seconds % 60)
    return f"{minutes:02d}:{seconds:02d}"        

def process_video(video, source_lang="en", target_lang="ar", progress=gr.Progress()):
    """معالجة الفيديو واستخراج النص وترجمته"""
    if video is None:
        return {
            "error": "الرجاء رفع ملف فيديو",
            "original": "",
            "translated": "",
            "document": None
        }
    
    try:
        # حفظ الفيديو مؤقتاً
        progress(0.1, desc="جاري تحميل الفيديو...")
        temp_path = video.name
        logger.info(f"تم استلام ملف فيديو: {temp_path}")
        
        # تحميل نموذج Whisper
        progress(0.3, desc="جاري تحميل نموذج التعرف على الكلام...")
        model = whisper.load_model("base")
        
        # استخراج النص مع التوقيت
        progress(0.5, desc="جاري استخراج النص من الفيديو...")
        result = model.transcribe(temp_path, language=source_lang)
        
        # تنسيق النص مع التوقيت
        transcribed_text = ""
        segments_for_translation = []
        
        # تجميع النص الأصلي مع التوقيت
        for segment in result["segments"]:
            start_time = format_timestamp(segment["start"])
            text = segment["text"].strip()
            transcribed_text += f"[{start_time}] {text}\n"
            segments_for_translation.append((start_time, text))
        
        logger.info("تم استخراج النص بنجاح")
        
        # ترجمة النص مع الحفاظ على التوقيت
        progress(0.7, desc="جاري ترجمة النص...")
        translated_segments = []
        translator = GoogleTranslator(source=source_lang, target=target_lang)
        
        for start_time, text in segments_for_translation:
            try:
                translated_text = translator.translate(text)
                translated_segments.append(f"[{start_time}] {translated_text}")
                logger.info(f"تمت ترجمة المقطع: {text} -> {translated_text}")
            except Exception as e:
                logger.error(f"خطأ في ترجمة المقطع: {str(e)}")
                translated_segments.append(f"[{start_time}] [خطأ في الترجمة: {text}]")
        
        translated_text = "\n".join(translated_segments)
        
        # إنشاء ملف Word
        progress(0.9, desc="جاري إنشاء المستند...")
        doc_path = create_document(transcribed_text, translated_text, source_lang, target_lang)
        
        progress(1.0, desc="تمت المعالجة بنجاح!")
        return {
            "error": None,
            "original": transcribed_text,
            "translated": translated_text,
            "document": doc_path
        }
        
    except Exception as e:
        logger.error(f"خطأ في معالجة الفيديو: {str(e)}")
        return {
            "error": f"حدث خطأ: {str(e)}",
            "original": "",
            "translated": "",
            "document": None
        }

def create_ui():
    """إنشاء واجهة المستخدم"""
    with gr.Blocks(theme=gr.themes.Soft(
        primary_hue="blue",
        secondary_hue="indigo",
    )) as demo:
        gr.Markdown(
            """
            # 🎥 منصة تحويل الفيديو إلى نص مع الترجمة
            ### قم برفع فيديو للحصول على النص والترجمة مع إمكانية تحويل النص إلى صوت
            """
        )
        
        with gr.Row():
            with gr.Column(scale=2):
                video_input = gr.File(
                    label="📁 رفع فيديو",
                    file_types=["video"],
                    elem_id="video_input"
                )
            with gr.Column(scale=1):
                source_lang = gr.Dropdown(
                    choices=list(SUPPORTED_LANGUAGES.keys()),
                    value="en",
                    label="🗣️ لغة الفيديو الأصلية"
                )
                target_lang = gr.Dropdown(
                    choices=list(SUPPORTED_LANGUAGES.keys()),
                    value="ar",
                    label="🌐 لغة الترجمة"
                )
                process_btn = gr.Button("🎯 معالجة الفيديو", variant="primary")
        
        with gr.Row():
            error_output = gr.Textbox(label="⚠️ الأخطاء", visible=False)
        
        with gr.Tabs():
            with gr.TabItem("📝 النص الأصلي"):
                original_text = gr.Textbox(
                    label="النص المستخرج من الفيديو",
                    lines=10,
                    elem_classes=["ltr"]
                )
                with gr.Row():
                    generate_original_audio = gr.Button("🔊 توليد الصوت", variant="secondary")
                    original_audio = gr.Audio(label="الصوت", visible=True)
            
            with gr.TabItem("🔄 النص المترجم"):
                translated_text = gr.Textbox(
                    label="النص المترجم",
                    lines=10,
                    elem_classes=["rtl"]
                )
                with gr.Row():
                    generate_translated_audio = gr.Button("🔊 توليد الصوت", variant="secondary")
                    translated_audio = gr.Audio(label="الصوت", visible=True)
        
        with gr.Row():
            download_btn = gr.File(
                label="📥 تحميل المستند (Word)",
                interactive=False
            )
        
        def update_ui(video, src_lang, tgt_lang):
            result = process_video(video, src_lang, tgt_lang)
            
            # تحديث اتجاه النص
            original_classes = "rtl" if src_lang in RTL_LANGUAGES else "ltr"
            translated_classes = "rtl" if tgt_lang in RTL_LANGUAGES else "ltr"
            
            return {
                error_output: gr.update(value=result["error"], visible=bool(result["error"])),
                original_text: gr.update(value=result["original"], elem_classes=[original_classes]),
                translated_text: gr.update(value=result["translated"], elem_classes=[translated_classes]),
                download_btn: result["document"]
            }
        
        # ربط الأحداث
        process_btn.click(
            fn=update_ui,
            inputs=[video_input, source_lang, target_lang],
            outputs=[error_output, original_text, translated_text, download_btn]
        )
        
        generate_original_audio.click(
            fn=text_to_speech,
            inputs=[original_text, source_lang],
            outputs=[original_audio]
        )
        
        generate_translated_audio.click(
            fn=text_to_speech,
            inputs=[translated_text, target_lang],
            outputs=[translated_audio]
        )
    
    return demo

if __name__ == "__main__":
    try:
        logger.info("بدء تشغيل التطبيق")
        demo = create_ui()
        demo.launch()
    except Exception as e:
        logger.error(f"خطأ في تشغيل التطبيق: {str(e)}")