Spaces:

Aumkeshchy2003
/

Gradio-OCR

Sleeping

Aumkeshchy2003 commited on Sep 30, 2024

Commit

04c7dbc

verified ·

1 Parent(s): d7381ee

Create app.py

Files changed (1) hide show

app.py ADDED Viewed

+import gradio as gr
+from PIL import Image
+import pytesseract
+import re
+def perform_ocr(image):
+    extracted_text = pytesseract.image_to_string(image, lang='hin+eng')
+    return extracted_text
+def search_and_highlight(text, keyword):
+    highlighted_text = re.sub(f"({keyword})", r"<mark>\1</mark>", text, flags=re.IGNORECASE)
+    return highlighted_text
+def ocr_and_search(image, keyword):
+    if image is None:
+        return "Please upload an image."
+    extracted_text = perform_ocr(image)
+    if keyword:
+        highlighted_text = search_and_highlight(extracted_text, keyword)
+        return highlighted_text
+    else:
+        return extracted_text
+iface = gr.Interface(
+    fn=ocr_and_search,
+    inputs=[
+        gr.Image(type="pil", label="Upload Image"),
+        gr.Textbox(label="Enter keyword to search (optional)")
+    ],
+    outputs=gr.HTML(label="Extracted and Highlighted Text"),
+    title="OCR and Keyword Search",
+    description="Upload an image for OCR processing and search for keywords in the extracted text."
+)
+iface.launch()