Spaces:

taishi-i
/

nagisa_bert-fill_mask

Sleeping

App Files Files Community

taishi-i commited on Oct 18, 2022

Commit

896ca2b

1 Parent(s): bde3055

Update app.py

Browse files

Files changed (1) hide show

app.py +75 -21

app.py CHANGED Viewed

@@ -3,25 +3,79 @@ import streamlit as st
 from transformers import pipeline
 from nagisa_bert import NagisaBertTokenizer
-tokenizer = NagisaBertTokenizer.from_pretrained("taishi-i/nagisa_bert")
-fill_mask = pipeline(
-    "fill-mask",
-    model="taishi-i/nagisa_bert",
-    tokenizer=tokenizer
-)
-with st.form("Fill-mask"):
-    text = st.text_area(
-        label="[MASK]を含むテキストを入力してください。",
-        value="nagisaで[MASK]できるモデルです",
-        max_chars=512
     )
-    submitted = st.form_submit_button("Submit")
-    if submitted:
-        if "[MASK]" in text:
-            out = fill_mask(text)
-            st.json(out)
-        else:
-            st.write("[MASK] を含むテキストを入力してください。")

 from transformers import pipeline
 from nagisa_bert import NagisaBertTokenizer
+@st.cache(allow_output_mutation=True)
+def load_tasks():
+    model_name = "taishi-i/nagisa_bert"
+    tokenizer = NagisaBertTokenizer.from_pretrained(model_name)
+    fill_mask = pipeline(
+        "fill-mask",
+        model=model_name,
+        tokenizer=tokenizer
+    )
+    feature_extract = pipeline(
+        "feature-extraction",
+        model=model_name,
+        tokenizer=tokenizer
     )
+    tasks = {
+        "Tokenize": tokenizer,
+        "Fill-mask": fill_mask,
+        "Feature-extraction": feature_extract
+    }
+    return tasks
+task2samples = {
+    "Fill-mask": {
+        "label": "[MASK]を含むテキストを入力してください。",
+        "value": "nagisaで[MASK]できるモデルです"
+    },
+    "Feature-extraction": {
+        "label": "[CLS]トークンのベクトルを取得します。ベクトル化するテキストを入力してください。",
+        "value": "nagisaで利用できるモデルです"
+    },
+    "Tokenize": {
+        "label": "トークナイズするテキストを入力してください。",
+        "value": "nagisaで利用できるモデルです"
+    },
+}
+def main():
+    tasks = load_tasks()
+    task_selection = st.selectbox(
+        "Select task (Fill-mask, Feature-extraction, Tokenize)",
+        ("Fill-mask", "Feature-extraction", "Tokenize"))
+    with st.form("Fill-mask"):
+        text = st.text_area(
+            label=task2samples[task_selection]["label"],
+            value=task2samples[task_selection]["value"],
+            max_chars=512
+        )
+        submitted = st.form_submit_button("Submit")
+        if submitted:
+            if task_selection == "Fill-mask":
+                if "[MASK]" in text:
+                    out = tasks[task_selection](text)
+                    st.json(out)
+                else:
+                    st.write("[MASK] を含むテキストを入力してください。")
+            elif task_selection == "Feature-extraction":
+                out = tasks[task_selection](text)[0][0]
+                st.code(out)
+            elif task_selection == "Tokenize":
+                out = tasks[task_selection].tokenize(text)
+                st.json(out)
+if __name__ == "__main__":
+    main()