ysakuramoto
/

mobilebert-ja

Transformers

PyTorch

Japanese

mobilebert

Inference Endpoints

Model card Files Files and versions Community

ysakuramoto commited on Jan 23, 2022

Commit

0368b5f

•

1 Parent(s): 837edc5

Update README.md

Browse files

Files changed (1) hide show

README.md +8 -8

README.md CHANGED Viewed

@@ -13,20 +13,20 @@ AI関係の仕事をしている櫻本です。
 このページを見つけた方はかなりラッキーですから、ぜひ一度使ってみてください！！
 # 利用方法
-transformersを利用されている場合の方法です。
-トークナイザを東北大学さんのモデルからお借りしました。
-それ以外は、**BertFor**なんちゃら～のクラスを**MobileBertFor**なんちゃら～に直して、このリポジトリを指定するだけです！
-（注意：文書分類などのタスクに利用するには、ファインチューニングが必要です）
 ```from transformers import BertJapaneseTokenizer, MobileBertForSequenceClassification
 tokenizer = BertJapaneseTokenizer.from_pretrained("cl-tohoku/bert-large-japanese")
 model = MobileBertForSequenceClassification.from_pretrained("ysakuramoto/mobilebert-ja") # 文書分類の場合
 ```
 # BERTとの性能比較
 文書分類と固有表現抽出について、ファインチューニング・性能評価を行いました。
-参考程度にご覧ください。(ファインチューニング後の性能を常に保証するものではありません）
-  - 文書分類（MobileBertForSequenceClassification）
   |メトリック|BERT|MobileBERT(高速化前)|MobileBERT(高速化後)|
   |-----------|-----------| ------- | -------- |
   |学習時間(s)|585.0|399.7|-|
@@ -38,7 +38,7 @@ model = MobileBertForSequenceClassification.from_pretrained("ysakuramoto/mobileb
       - 推論データ n=1,474。精度はAccuracy。
       - エポック数=10, lr=1e-4
       - 推論時の高速化として、枝刈り・量子化・jitコンパイルを実施。
-      - Google Colabにて、学習にGPU、推論にCPUを利用した。推論はバッチ処理でなく1件ずつ処理。
   - 固有表現抽出(BertForTokenClassification)
   |メトリック|BERT|MobileBERT(高速化前)|MobileBERT(高速化後)|
@@ -52,7 +52,7 @@ model = MobileBertForSequenceClassification.from_pretrained("ysakuramoto/mobileb
       - 推論データ n=2,140。精度は完全一致のAccuracy。
       - エポック数=10, lr=1e-4
       - 推論時の高速化として、枝刈り・量子化・jitコンパイルを実施。
-      - Google Colabにて、学習にGPU、推論にCPUを利用した。推論はバッチ処理でなく1件ずつ処理。
 # モデルの説明
 - モデルの構造

 このページを見つけた方はかなりラッキーですから、ぜひ一度使ってみてください！！
 # 利用方法
+既にtransformersでBERTを利用されている方向けです。
+トークナイザは東北大学さんのモデル(cl-tohoku/bert-large-japanese)からお借りしましたのでご指定ください。
+後は、**BertFor**なんちゃら～のクラスを**MobileBertFor**なんちゃら～に直して、このリポジトリを指定するだけです！
 ```from transformers import BertJapaneseTokenizer, MobileBertForSequenceClassification
 tokenizer = BertJapaneseTokenizer.from_pretrained("cl-tohoku/bert-large-japanese")
 model = MobileBertForSequenceClassification.from_pretrained("ysakuramoto/mobilebert-ja") # 文書分類の場合
 ```
+(注意：文書分類などのタスクに利用するには、ファインチューニングが必要です)
 # BERTとの性能比較
 文書分類と固有表現抽出について、ファインチューニング・性能評価を行いました。
+参考程度にご覧ください。(ファインチューニング後の性能を保証するものではありません)
+  - 文書分類(MobileBertForSequenceClassification)
   |メトリック|BERT|MobileBERT(高速化前)|MobileBERT(高速化後)|
   |-----------|-----------| ------- | -------- |
   |学習時間(s)|585.0|399.7|-|
       - 推論データ n=1,474。精度はAccuracy。
       - エポック数=10, lr=1e-4
       - 推論時の高速化として、枝刈り・量子化・jitコンパイルを実施。
+      - Google Colabにて、学習にGPU、推論にCPUを利用。推論はバッチ処理でなく1件ずつ処理。
   - 固有表現抽出(BertForTokenClassification)
   |メトリック|BERT|MobileBERT(高速化前)|MobileBERT(高速化後)|
       - 推論データ n=2,140。精度は完全一致のAccuracy。
       - エポック数=10, lr=1e-4
       - 推論時の高速化として、枝刈り・量子化・jitコンパイルを実施。
+      - Google Colabにて、学習にGPU、推論にCPUを利用。推論はバッチ処理でなく1件ずつ処理。
 # モデルの説明
 - モデルの構造