Spaces:

omkar56
/

Text-to-Image-OCR-FASTAPI

Sleeping

App Files Files Community

omkar56 commited on Dec 10, 2023

Commit

70d82fc

1 Parent(s): bd96cbb

Update main.py

Browse files

Files changed (1) hide show

main.py +29 -1

main.py CHANGED Viewed

@@ -1,4 +1,6 @@
 import os
 from fastapi import FastAPI, File, Request, UploadFile, Body, Depends, HTTPException
 from fastapi.security.api_key import APIKeyHeader
 from typing import Optional, Annotated
@@ -8,6 +10,7 @@ from io import BytesIO
 import pytesseract
 from nltk.tokenize import sent_tokenize
 from transformers import MarianMTModel, MarianTokenizer
 API_KEY = os.environ.get("API_KEY")
@@ -19,19 +22,44 @@ def get_api_key(api_key: Optional[str] = Depends(api_key_header)):
         raise HTTPException(status_code=401, detail="Unauthorized access")
     return api_key
 @app.post("/api/ocr", response_model=dict)
 async def ocr(
     api_key: str = Depends(get_api_key),
     image: UploadFile = File(...),
     # languages: list = Body(["eng"])
 ):
     try:
         content = await image.read()
         image = Image.open(BytesIO(content))
         print("[image]",image)
         if hasattr(pytesseract, "image_to_string"):
             print("Image to string function is available")
-            print(pytesseract.image_to_string(image, lang = 'eng'))
         else:
             print("Image to string function is not available")
         # text = pytesseract.image_to_string(image, lang="+".join(languages))

 import os
+os.system("sudo apt-get install xclip")
+import nltk
 from fastapi import FastAPI, File, Request, UploadFile, Body, Depends, HTTPException
 from fastapi.security.api_key import APIKeyHeader
 from typing import Optional, Annotated
 import pytesseract
 from nltk.tokenize import sent_tokenize
 from transformers import MarianMTModel, MarianTokenizer
+nltk.download('punkt')
 API_KEY = os.environ.get("API_KEY")
         raise HTTPException(status_code=401, detail="Unauthorized access")
     return api_key
+# Image path
+img_dir = "./data"
+# Get tesseract language list
+choices = os.popen('tesseract --list-langs').read().split('\n')[1:-1]
+# Convert tesseract language list to pytesseract language
+def ocr_lang(lang_list):
+    lang_str = ""
+    lang_len = len(lang_list)
+    if lang_len == 1:
+        return lang_list[0]
+    else:
+        for i in range(lang_len):
+            lang_list.insert(lang_len - i, "+")
+        lang_str = "".join(lang_list[:-1])
+        return lang_str
+# ocr tesseract
+def ocr_tesseract(img, languages):
+    print("[img]", img)
+    print("[languages]", languages)
+    ocr_str = pytesseract.image_to_string(img, lang=ocr_lang(languages))
+    return ocr_str
 @app.post("/api/ocr", response_model=dict)
 async def ocr(
     api_key: str = Depends(get_api_key),
     image: UploadFile = File(...),
     # languages: list = Body(["eng"])
 ):
     try:
         content = await image.read()
         image = Image.open(BytesIO(content))
         print("[image]",image)
         if hasattr(pytesseract, "image_to_string"):
             print("Image to string function is available")
+            # print(pytesseract.image_to_string(image, lang = 'eng'))
+            text = ocr_tesseract(image, ['eng'])
         else:
             print("Image to string function is not available")
         # text = pytesseract.image_to_string(image, lang="+".join(languages))