priyank-m
/

m_OCR

Image-Text-to-Text

vision-encoder-decoder

Image-Captioning

Text-Recognition

Inference Endpoints

Model card Files Files and versions Community

priyank-m commited on Dec 19, 2022

Commit

04c5ff2

·

1 Parent(s): 6b7803f

Update README.md

Files changed (1) hide show

README.md +18 -1

README.md CHANGED Viewed

@@ -10,4 +10,21 @@ datasets:
   - priyank-m/text_recognition_en_zh_clean
 metrics:
   - cer
----

   - priyank-m/text_recognition_en_zh_clean
 metrics:
   - cer
+---
+Multilingual OCR (mOCR) is a VisionEncoderDecoder model based on the concept of TrOCR for English and Chinese document text-recognition.
+It uses a pre-trained Vision encoder and a pre-trained Language decoder model.
+Encoder model used: facebook/vit-mae-large
+Decoder model used: xlm-roberta-base