Spaces:

snoop2head
/

privacy-filtering-ner

Running

App Files Files Community

snoop2head commited on Nov 29, 2022

Commit

849819f

1 Parent(s): 498ff0a

upload post processing

Browse files

Files changed (1) hide show

app.py +38 -6

app.py CHANGED Viewed

@@ -25,7 +25,7 @@ model = load_model("QuoQA-NLP/konec-privacy")
 model.eval()
-default_value = "성욱님, 당뇨 검사한 거 결과 나오셨어요."
 src_text = st.text_area(
     "검사하고 싶은 문장을 입력하세요.",
@@ -74,10 +74,10 @@ def yield_df(default_value):
   print(class_decoded)
   label_map = {
-  "ADD": 0,
   "DN": "질환 정보",
   "DT": "날짜 정보",
-  "LC": "주소 정보(지역, 이메일 주소 등)",
   "OG": "기관 정보",
   "PS": "인명/별명 정보",
   "QT": "수량 정보",
@@ -85,6 +85,7 @@ def yield_df(default_value):
   "O": "비민감 정보"
   }
   # pair tokens with prediction
   tokenized_text = tokenizer.convert_ids_to_tokens(tokenized)
   list_result = []
@@ -99,7 +100,6 @@ def yield_df(default_value):
   df = pd.DataFrame(list_result)
   # remove first and last row
   df = df.iloc[1:-1]
-  st.table(df)
   return df
 def convert_df(df:pd.DataFrame):
@@ -113,15 +113,45 @@ def convert_json(df:pd.DataFrame):
     return json_string
 if src_text == "":
     st.warning("Please **enter text** for translation")
 else:
     st.markdown("### 분류된 단어들")
     st.header("")
     cs, c1, c2, c3, cLast = st.columns([0.75, 1.5, 1.5, 1.5, 0.75])
-    df_result = yield_df(src_text)
     with c1:
         #csvbutton = download_button(results, "results.csv", "📥 Download .csv")
         csvbutton = st.download_button(label="📥 csv로 다운로드", data=convert_df(df_result), file_name= "results.csv", mime='text/csv', key='csv')
@@ -132,6 +162,8 @@ else:
         #jsonbutton = download_button(results, "results.json", "📥 Download .json")
         jsonbutton = st.download_button(label="📥 json으로 다운로드", data=convert_json(df_result), file_name= "results.json", mime='application/json',  key='json')
 with st.expander("(주) 쿼카에이아이 데모 사사 관련", expanded=True):
   st.write(

 model.eval()
+default_value = "영진님, 당뇨 검사한 거 결과 나오셨어요."
 src_text = st.text_area(
     "검사하고 싶은 문장을 입력하세요.",
   print(class_decoded)
   label_map = {
+  "ADD": "주소 정보",
   "DN": "질환 정보",
   "DT": "날짜 정보",
+  "LC": "장소 정보",
   "OG": "기관 정보",
   "PS": "인명/별명 정보",
   "QT": "수량 정보",
   "O": "비민감 정보"
   }
   # pair tokens with prediction
   tokenized_text = tokenizer.convert_ids_to_tokens(tokenized)
   list_result = []
   df = pd.DataFrame(list_result)
   # remove first and last row
   df = df.iloc[1:-1]
   return df
 def convert_df(df:pd.DataFrame):
     return json_string
+filtering_map = {
+  "주소 정보": "[주소]",
+  "질환 정보": "[질환]",
+  "날짜 정보": "[날짜]",
+  "장소 정보": "[장소]",
+  "기관 정보": "[기관]",
+  "인명/별명 정보": "[이름]",
+  "수량 정보": "[수량]",
+  "관계 정보": "[관계]",
+  "비민감 정보": "[비민감]"
+  }
 if src_text == "":
     st.warning("Please **enter text** for translation")
 else:
+    df_result = yield_df(src_text)
+    st.markdown("### 필터링 된 문장")
+    display_result = ""
+    for index, row in df_result.iterrows():
+        token_info = row["형태소"]
+        label_info = row["예상 라벨"]
+        if label_info != "비민감 정보":
+            token_info = filtering_map[label_info]
+        if "##" in token_info:
+            token_info = token_info.replace("##", "")
+        else:
+            token_info = " " + token_info
+        display_result += token_info
+    st.write(display_result)
     st.markdown("### 분류된 단어들")
     st.header("")
     cs, c1, c2, c3, cLast = st.columns([0.75, 1.5, 1.5, 1.5, 0.75])
+    st.table(df_result)
     with c1:
         #csvbutton = download_button(results, "results.csv", "📥 Download .csv")
         csvbutton = st.download_button(label="📥 csv로 다운로드", data=convert_df(df_result), file_name= "results.csv", mime='text/csv', key='csv')
         #jsonbutton = download_button(results, "results.json", "📥 Download .json")
         jsonbutton = st.download_button(label="📥 json으로 다운로드", data=convert_json(df_result), file_name= "results.json", mime='application/json',  key='json')
 with st.expander("(주) 쿼카에이아이 데모 사사 관련", expanded=True):
   st.write(