Spaces:

Soumen
/

Text-Summarization-and-NLP-tasks

Running

Soumen commited on Nov 25, 2022

Commit

baf370a

1 Parent(s): 8c41dee

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -34,6 +34,8 @@ from PyPDF2 import PdfFileReader
 from pdf2image import convert_from_bytes
 import pdfplumber
 from line_cor import mark_region
 # NLP Pkgs
 from textblob import TextBlob
@@ -46,8 +48,9 @@ import pytesseract
 #pytesseract.pytesseract.tesseract_cmd = r"./Tesseract-OCR/tesseract.exe"
 from PIL import Image
 def read_pdf(file):
-    images=pdf2image.convert_from_bytes(file.read())
     #pdfReader = PdfFileReader(file)
     #count = pdfReader.numPages
     all_page_text = ""

 from pdf2image import convert_from_bytes
 import pdfplumber
 from line_cor import mark_region
+import pdf2image
 # NLP Pkgs
 from textblob import TextBlob
 #pytesseract.pytesseract.tesseract_cmd = r"./Tesseract-OCR/tesseract.exe"
 from PIL import Image
+@st.experimental_singleton
 def read_pdf(file):
+    images=pdf2image.convert_from_bytes(file.read(),"rb")
     #pdfReader = PdfFileReader(file)
     #count = pdfReader.numPages
     all_page_text = ""