Spaces:

desarrolloasesoreslocales
/

ModeloRecorte

Sleeping

desarrolloasesoreslocales commited on Nov 3, 2023

Commit

c60d26e

1 Parent(s): b1e68da

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,9 +16,6 @@ from PIL import Image
 #print('HOLA:', os.walk('../'))
-pytesseract.pytesseract.tesseract_cmd = r"./lib/Tesseract-OCR/tesseract.exe"
-path_to_poppler_exe = r"./lib/poppler-0.68.0/bin"
 def ocrtotext(filename):
     # Almacena todas las páginas del PDF en una variable
     image_file_list = []  # Lista para almacenar los nombres de los archivos de imagen
@@ -26,7 +23,7 @@ def ocrtotext(filename):
     text_file = (f'{filename}.txt')  # Nombre del archivo de texto de salida
     # Parte #1: Convirtiendo el PDF a imágenes
-    pdf_pages = convert_from_path(PDF_file, 300, poppler_path=path_to_poppler_exe)
     # Lee el archivo PDF a 300 DPI
     # Itera a través de todas las páginas almacenadas arriba

 #print('HOLA:', os.walk('../'))
 def ocrtotext(filename):
     # Almacena todas las páginas del PDF en una variable
     image_file_list = []  # Lista para almacenar los nombres de los archivos de imagen
     text_file = (f'{filename}.txt')  # Nombre del archivo de texto de salida
     # Parte #1: Convirtiendo el PDF a imágenes
+    pdf_pages = convert_from_path(PDF_file, 300)
     # Lee el archivo PDF a 300 DPI
     # Itera a través de todas las páginas almacenadas arriba