tomaseo2022 commited on
Commit
444e1e4
1 Parent(s): 3d92e09

Create app.py

Browse files
Files changed (1) hide show
  1. app.py +23 -0
app.py ADDED
@@ -0,0 +1,23 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import gradio as gr
2
+ from io import BytesIO
3
+ import PyPDF2
4
+
5
+ def pdf_to_xml(pdf_file):
6
+ pdf_reader = PyPDF2.PdfReader(pdf_file)
7
+ pdf_text = ""
8
+ for page in pdf_reader.pages:
9
+ pdf_text += page.extract_text()
10
+
11
+ # Aquí iría la lógica para convertir el texto del PDF a XML
12
+ # Por ejemplo, puedes usar una librería como lxml para construir un XML
13
+
14
+ # Por ahora, simplemente devolveré el texto del PDF
15
+ return pdf_text
16
+
17
+ iface = gr.Interface(
18
+ fn=pdf_to_xml,
19
+ inputs=gr.inputs.File(label="Selecciona un archivo PDF"),
20
+ outputs=gr.outputs.Textbox(label="Archivo XML convertido")
21
+ )
22
+
23
+ iface.launch(share=True)