tomaseo2022 commited on
Commit
454ae00
1 Parent(s): c8dc3e9

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +18 -10
app.py CHANGED
@@ -1,19 +1,27 @@
1
- import gradio as gr
2
- import os
3
  os.system("pip install pdfplumber")
 
4
  import pdfplumber
5
 
6
  def pdf_to_xml(pdf_file):
7
- with pdfplumber.open(pdf_file.name) as pdf:
8
- pdf_text = ""
9
- for page in pdf.pages:
10
- pdf_text += page.extract_text()
 
 
 
 
 
 
 
 
11
 
12
- # Aquí iría la lógica para convertir el texto del PDF a XML
13
- # Por ejemplo, puedes usar una librería como lxml para construir un XML
14
 
15
- # Por ahora, simplemente devolveré el texto del PDF
16
- return pdf_text
17
 
18
  iface = gr.Interface(
19
  fn=pdf_to_xml,
 
1
+ import os
 
2
  os.system("pip install pdfplumber")
3
+ import gradio as gr
4
  import pdfplumber
5
 
6
  def pdf_to_xml(pdf_file):
7
+ try:
8
+ # Verificar si se recibió un archivo
9
+ if pdf_file is None:
10
+ raise ValueError("No se recibió ningún archivo PDF.")
11
+
12
+ with pdfplumber.open(pdf_file) as pdf:
13
+ pdf_text = ""
14
+ for page in pdf.pages:
15
+ pdf_text += page.extract_text()
16
+
17
+ # Aquí iría la lógica para convertir el texto del PDF a XML
18
+ # Por ejemplo, puedes usar una librería como lxml para construir un XML
19
 
20
+ # Por ahora, simplemente devolveré el texto del PDF
21
+ return pdf_text
22
 
23
+ except Exception as e:
24
+ return f"Error al procesar el archivo: {str(e)}"
25
 
26
  iface = gr.Interface(
27
  fn=pdf_to_xml,