Spaces:

KIMOSSINO
/

transciptio

Sleeping

App Files Files Community

KIMOSSINO commited on Dec 9, 2024

Commit

b7ad0ca

verified ·

1 Parent(s): c23c554

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -4

app.py CHANGED Viewed

@@ -181,6 +181,12 @@ def translate_text(text, source_lang, target_lang, progress=gr.Progress()):
         logger.error(f"خطأ في الترجمة: {str(e)}")
         return f"خطأ في الترجمة: {str(e)}"
 def process_video(video, source_lang="en", target_lang="ar", progress=gr.Progress()):
     """معالجة الفيديو واستخراج النص وترجمته"""
     if video is None:
@@ -201,15 +207,29 @@ def process_video(video, source_lang="en", target_lang="ar", progress=gr.Progres
         progress(0.3, desc="جاري تحميل نموذج التعرف على الكلام...")
         model = whisper.load_model("base")
-        # استخراج النص
         progress(0.5, desc="جاري استخراج النص من الفيديو...")
         result = model.transcribe(temp_path, language=source_lang)
-        transcribed_text = result["text"]
         logger.info("تم استخراج النص بنجاح")
-        # ترجمة النص
         progress(0.7, desc="جاري ترجمة النص...")
-        translated_text = translate_text(transcribed_text, source_lang, target_lang)
         # إنشاء ملف Word
         progress(0.9, desc="جاري إنشاء المستند...")

         logger.error(f"خطأ في الترجمة: {str(e)}")
         return f"خطأ في الترجمة: {str(e)}"
+def format_timestamp(seconds):
+    """تحويل الثواني إلى تنسيق MM:SS"""
+    minutes = int(seconds // 60)
+    seconds = int(seconds % 60)
+    return f"{minutes:02d}:{seconds:02d}"
 def process_video(video, source_lang="en", target_lang="ar", progress=gr.Progress()):
     """معالجة الفيديو واستخراج النص وترجمته"""
     if video is None:
         progress(0.3, desc="جاري تحميل نموذج التعرف على الكلام...")
         model = whisper.load_model("base")
+        # استخراج النص مع التوقيت
         progress(0.5, desc="جاري استخراج النص من الفيديو...")
         result = model.transcribe(temp_path, language=source_lang)
+        # تنسيق النص مع التوقيت
+        transcribed_text = ""
+        for segment in result["segments"]:
+            start_time = format_timestamp(segment["start"])
+            text = segment["text"].strip()
+            transcribed_text += f"[{start_time}] {text}\n"
         logger.info("تم استخراج النص بنجاح")
+        # ترجمة النص مع الحفاظ على التوقيت
         progress(0.7, desc="جاري ترجمة النص...")
+        translated_segments = []
+        for segment in result["segments"]:
+            start_time = format_timestamp(segment["start"])
+            text = segment["text"].strip()
+            translated_text = translate_text(text, source_lang, target_lang)
+            translated_segments.append(f"[{start_time}] {translated_text}")
+        translated_text = "\n".join(translated_segments)
         # إنشاء ملف Word
         progress(0.9, desc="جاري إنشاء المستند...")