kkatiz
/

thai-trocr-thaigov-v2

vision-encoder-decoder

image-text-to-text

Inference Endpoints

Model card Files Files and versions Community

kkatiz commited on Mar 13

Commit

b56e2a8

•

1 Parent(s): 766443f

Update README.md

Files changed (1) hide show

README.md +18 -1

README.md CHANGED Viewed

@@ -11,4 +11,21 @@ Vision Encoder Decoder Models
 - Use microsoft/trocr-base-handwritten as encoder.
 - Use airesearch/wangchanberta-base-att-spm-uncased as decoder
 - Fine-tune on 250k synthetic text images dataset using [ThaiGov V2 Corpus](https://github.com/PyThaiNLP/thaigov-v2-corpus)
-- It is useful to fine-tune any Thai OCR task.

 - Use microsoft/trocr-base-handwritten as encoder.
 - Use airesearch/wangchanberta-base-att-spm-uncased as decoder
 - Fine-tune on 250k synthetic text images dataset using [ThaiGov V2 Corpus](https://github.com/PyThaiNLP/thaigov-v2-corpus)
+- Use [SynthTIGER](https://github.com/clovaai/synthtiger) to generate synthetic text image.
+- It is useful to fine-tune any Thai OCR task.
+# Usage
+```
+from transformers import TrOCRProcessor, VisionEncoderDecoderModel
+processor = TrOCRProcessor.from_pretrained("kkatiz/ocr-nithan")
+model = VisionEncoderDecoderModel.from_pretrained("kkatiz/ocr-nithan")
+image = Image.open(img_path).convert("RGB")
+pixel_values = processor(image, return_tensors="pt").pixel_values
+generated_ids = model.generate(pixel_values)
+generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+print(generated_text)
+```