Spaces:

kryman27
/

invoice-processor

Paused

kryman27 commited on Jan 30

Commit

d3bb8fd

verified ·

1 Parent(s): c4d2029

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,34 +2,41 @@ from transformers import TrOCRProcessor, VisionEncoderDecoderModel
 from PIL import Image
 import pdf2image
 import gradio as gr
-# Załaduj model TroCR
-processor = TrOCRProcessor.from_pretrained("microsoft/trocr-large-stage1")
-model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-large-stage1")
-# Funkcja do przetwarzania faktur
 def process_invoice(pdf_file):
-    # Konwersja PDF do obrazu
-    images = pdf2image.convert_from_bytes(pdf_file.read())
-    # Przetwarzanie pierwszej strony faktury
-    image = images[0].convert("RGB")
-    pixel_values = processor(images=image, return_tensors="pt").pixel_values
-    # Uruchomienie modelu AI
-    generated_ids = model.generate(pixel_values)
-    extracted_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
-    return extracted_text
-# Tworzenie UI w Gradio
 interface = gr.Interface(
     fn=process_invoice,
-    inputs=gr.File(type="file"),
     outputs="text",
     title="AI Invoice Processor",
     description="Wgraj fakturę PDF, a AI wyodrębni dane tekstowe.",
 )
-# Uruchomienie aplikacji
 interface.launch()

 from PIL import Image
 import pdf2image
 import gradio as gr
+import torch
+# ✅ Używamy mniejszej wersji modelu dla szybszego działania
+MODEL_NAME = "microsoft/trocr-base-stage1"
+# ✅ Ładujemy model i procesor
+processor = TrOCRProcessor.from_pretrained(MODEL_NAME)
+model = VisionEncoderDecoderModel.from_pretrained(MODEL_NAME)
+# ✅ Funkcja do przetwarzania faktur PDF
 def process_invoice(pdf_file):
+    try:
+        # ✅ Konwersja PDF do obrazu
+        images = pdf2image.convert_from_bytes(pdf_file.read())
+        # ✅ Przetwarzanie pierwszej strony faktury
+        image = images[0].convert("RGB")
+        pixel_values = processor(images=image, return_tensors="pt").pixel_values
+        # ✅ Uruchomienie modelu AI
+        generated_ids = model.generate(pixel_values)
+        extracted_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+        return extracted_text
+    except Exception as e:
+        return f"Błąd przetwarzania: {str(e)}"
+# ✅ Poprawne użycie `gr.File(type="binary")`
 interface = gr.Interface(
     fn=process_invoice,
+    inputs=gr.File(type="binary"),
     outputs="text",
     title="AI Invoice Processor",
     description="Wgraj fakturę PDF, a AI wyodrębni dane tekstowe.",
 )
+# ✅ Uruchomienie aplikacji
 interface.launch()