Trofish
/

korean_syllable_roberta_256

Inference Endpoints

Model card Files Files and versions Community

Trofish commited on May 8

Commit

2c959b8

•

1 Parent(s): fa3719a

Update README.md

Files changed (1) hide show

README.md +4 -2

README.md CHANGED Viewed

@@ -35,12 +35,14 @@
 ![Evaluation Accuracy Graph](https://cdn-uploads.huggingface.co/production/uploads/64a0fd6fd3149e05bc5260dd/LPq5M6S8LTwkFSCepD33S.png)
 ## 사용 방법
 ```python
 from transformers import AutoModel, AutoTokenizer
 # 모델과 토크나이저 불러오기
-model = AutoModel.from_pretrained("your_model_name")
-tokenizer = AutoTokenizer.from_pretrained("your_tokenizer_name")
 # 텍스트를 토큰으로 변환하고 예측 수행
 inputs = tokenizer("여기에 한국어 텍스트 입력", return_tensors="pt")

 ![Evaluation Accuracy Graph](https://cdn-uploads.huggingface.co/production/uploads/64a0fd6fd3149e05bc5260dd/LPq5M6S8LTwkFSCepD33S.png)
 ## 사용 방법
+## tokenizer의 경우 wordpiece가 아닌 syllable 단위이기에 AutoTokenizer가 아니라 SyllableTokenizer를 사용해야 합니다. (레포에서 제공하고 있는 syllabletokenizer.py를 가져와서 사용해야 합니다.)
 ```python
 from transformers import AutoModel, AutoTokenizer
+from syllabletokenizer import SyllableTokenizer
 # 모델과 토크나이저 불러오기
+model = AutoModelForMaskedLM.from_pretrained("Trofish/korean_syllable_roberta")
+tokenizer = SyllableTokenizer(vocab_file='vocab.json',**tokenizer_kwargs)
 # 텍스트를 토큰으로 변환하고 예측 수행
 inputs = tokenizer("여기에 한국어 텍스트 입력", return_tensors="pt")