Upload app.py
Browse files
app.py
CHANGED
@@ -165,8 +165,7 @@ demo = gr.Interface(builder, inputs=[gr.inputs.Dropdown(['Default', 'Eng', 'Kor'
|
|
165 |
# outputs='label',
|
166 |
title=title, description=description, examples=examples)
|
167 |
|
168 |
-
|
169 |
-
return [None, None, None]
|
170 |
|
171 |
with gr.Blocks() as demo1:
|
172 |
gr.Markdown(
|
@@ -178,51 +177,27 @@ with gr.Blocks() as demo1:
|
|
178 |
|
179 |
gr.Markdown(
|
180 |
"""
|
181 |
-
|
|
|
|
|
|
|
182 |
""")
|
183 |
|
184 |
-
|
185 |
-
with gr.Row():
|
186 |
-
gr.Markdown(
|
187 |
-
"""
|
188 |
-
### ์
๋ ฅ(Lang, Text)์ ๋ํ ์ค๋ช
|
189 |
-
๊ฐ์ด๋ฐ๋ฅผ ๊ธฐ์ค์ผ๋ก ์ผ์ชฝ์ ์๋ ์นธ๋ค์ ์
๋ ฅ์ ํด๋นํ๋ค.
|
190 |
-
* โLangโ์ ์์ ์ด ์
๋ ฅํ ์ธ์ด๋ฅผ ์ ํํ๋ ๊ฒ์ด๋ค. ๊ธฐ์
์ด ์์ ๊ฒฝ์ฐ(Default)์๋ ํ๊ตญ์ด์ธ์ง ์์ด์ธ์ง ์ค๋ฅธ์ชฝ ๋ฐ์ค โLangโ์์ ํ๋จ ํด์ค๋ค.
|
191 |
-
* โTextโ๋ ์ํ ๋ฆฌ๋ทฐ๋ฅผ ์
๋ ฅํ๋ ๊ณณ์ด๋ค. ์
๋ ฅ์ ๋ง์น๊ณ ์ ์ถํ๊ธฐ ๋ฒํผ์ ๋๋ฅด๋ฉด ๊ฒฐ๊ณผ๋ฅผ ๋ถ์ํ ์ ์๋ค.
|
192 |
-
""")
|
193 |
-
gr.Markdown(
|
194 |
-
"""
|
195 |
-
### ์ถ๋ ฅ(Lang, Result, Analysis)์ ๋ํ ์ค๋ช
|
196 |
-
๊ฐ์ด๋ฐ๋ฅผ ๊ธฐ์ค์ผ๋ก ์ค๋ฅธ์ชฝ์ ์๋ ์นธ๋ค์ ์ถ๋ ฅ์ ํด๋นํ๋ค.
|
197 |
-
* โLangโ์ ์ผ์ชฝ ์
๋ ฅ์์ ์ธ์ด๋ฅผ ์ ํํ ๋, ํ๊ตญ์ด๋ฅผ ์ ํํ์ผ๋ฉด 100% Kor, ์์ด๋ฅผ ์ ํํ๋ค๋ฉด 100%% Eng ์ด๋ค.
|
198 |
-
๋ง์ฝ Default๋ฅผ ์ ํํ๋ค๋ฉด ํ๊ตญ์ด์ธ์ง ์์ด์ธ์ง ํ๋จ ํด์ค๋ค.
|
199 |
-
์ด ๋ฐฉ๋ฒ์ [ํด๋น ์ฌ์ดํธ](https://medium.com/@c.chaitanya/language-identification-in-python-using-fasttext-60359dc30ed0)์ ์๋ ํจํค์ง๋ฅผ ์ฌ์ฉํ๋ค.
|
200 |
-
* โResultโ๋ ๋ ๋ชจ๋ธ(Kor, Eng)์ ์ด์ฉํด์ ๊ธ์ ๋ฆฌ๋ทฐ ๋๋ ๋ถ์ ๋ฆฌ๋ทฐ๋ฅผ ํ๋จํ๋ค. (๋ชจ๋ธ์ ๋ํด ๋ ์๊ณ ์ถ์ผ๋ฉด ๋ฐ์์ ํ์ธํ๊ธธ ๋ฐ๋๋ค.)
|
201 |
-
* โAnalysisโ๋ ์
๋ ฅํ ๋ฆฌ๋ทฐ์ ๊ธ์ ๋๋ ๋ถ์ ์ ๊ฒฐ์ ๋ ๋, ์ด๋ค ๋จ์ด์ ์ํด์ ๊ฒฐ์ ๋์๋์ง ๊ฐ์กฐ ํด์ค๋ค.
|
202 |
-
์ฆ, ์ํฅ์ ์ค ๋จ์ด์ ๋ํด์๋ ์ผ๋ง๋ ๊ธ์ ์ ์ธ(๋๋ ๋ถ์ ์ ์ธ) ์ํฅ์ ์ฃผ์๋์ง ๊ฐ์กฐ๋์ด ์๋ค.
|
203 |
-
( ๊ธ์ ์ธ ๊ฒฝ์ฐ ๋ถ์์(+++, ++, +), ๋ถ์ ์ธ ๊ฒฝ์ฐ ํ๋์(---,--,-) )
|
204 |
-
""")
|
205 |
-
|
206 |
-
with gr.Accordion("๋ชจ๋ธ์ ๋ํ ์ค๋ช
"):
|
207 |
gr.Markdown(
|
208 |
"""
|
209 |
-
|
210 |
-
|
211 |
-
|
212 |
-
|
213 |
-
Batch Size Train | 64 | 64
|
214 |
-
Steps | 2800 | 2000
|
215 |
-
Batch Size Test | 4 | 4
|
216 |
-
Validation Accuracy | 93.55% | 95.81%
|
217 |
-
Test Accuracy | 94.0% | 92.8%
|
218 |
""")
|
219 |
|
220 |
with gr.Row():
|
221 |
with gr.Column():
|
222 |
-
inputs_1 = gr.
|
223 |
inputs_2 = gr.Textbox(placeholder="๋ฆฌ๋ทฐ๋ฅผ ์
๋ ฅํ์์ค.", label='Text')
|
224 |
with gr.Row():
|
225 |
-
btn2 = gr.Button("ํด๋ฆฌ์ด")
|
226 |
btn = gr.Button("์ ์ถํ๊ธฐ")
|
227 |
with gr.Column():
|
228 |
output_1 = gr.Label(num_top_classes=3, label='Lang')
|
|
|
165 |
# outputs='label',
|
166 |
title=title, description=description, examples=examples)
|
167 |
|
168 |
+
|
|
|
169 |
|
170 |
with gr.Blocks() as demo1:
|
171 |
gr.Markdown(
|
|
|
177 |
|
178 |
gr.Markdown(
|
179 |
"""
|
180 |
+
์ํ ๋ฆฌ๋ทฐ๋ฅผ ์
๋ ฅํ๋ฉด, ๋ฆฌ๋ทฐ๊ฐ ๊ธ์ ์ธ์ง ๋ถ์ ์ธ์ง ํ๋ณํด์ฃผ๋ ๋ชจ๋ธ์ด๋ค. \
|
181 |
+
์์ด์ ํ๊ธ์ ์ง์ํ๋ฉฐ, ์ธ์ด๋ฅผ ์ง์ ์ ํํ ์๋, ํน์ ๋ชจ๋ธ์ด ์ธ์ด๊ฐ์ง๋ฅผ ์ง์ ํ๋๋ก ํ ์ ์๋ค.
|
182 |
+
๋ฆฌ๋ทฐ๋ฅผ ์
๋ ฅํ๋ฉด, (1) ๊ฐ์ง๋ ์ธ์ด, (2) ๊ธ์ ๋ฆฌ๋ทฐ์ผ ํ๋ฅ ๊ณผ ๋ถ์ ๋ฆฌ๋ทฐ์ผ ํ๋ฅ , (3) ์
๋ ฅ๋ ๋ฆฌ๋ทฐ์ ์ด๋ ๋จ์ด๊ฐ ๊ธ์ /๋ถ์ ๊ฒฐ์ ์ ์ํฅ์ ์ฃผ์๋์ง \
|
183 |
+
(๊ธ์ ์ผ ๊ฒฝ์ฐ ๋นจ๊ฐ์, ๋ถ์ ์ผ ๊ฒฝ์ฐ ํ๋์)๋ฅผ ํ์ธํ ์ ์๋ค.
|
184 |
""")
|
185 |
|
186 |
+
with gr.Accordion(label="๋ชจ๋ธ์ ๋ํ ์ค๋ช
", open=False):
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
187 |
gr.Markdown(
|
188 |
"""
|
189 |
+
์์ด ๋ชจ๋ธ์ bert-base-uncased ๊ธฐ๋ฐ์ผ๋ก, ์์ด ์ํ ๋ฆฌ๋ทฐ ๋ถ์ ๋ฐ์ดํฐ์
์ธ SST-2๋ก ํ์ต ๋ฐ ํ๊ฐ๋์๋ค.
|
190 |
+
ํ๊ธ ๋ชจ๋ธ์ klue/roberta-base ๊ธฐ๋ฐ์ด๋ค. ๊ธฐ์กด ํ๊ธ ์ํ ๋ฆฌ๋ทฐ ๋ถ์ ๋ฐ์ดํฐ์
์ด ์กด์ฌํ์ง ์์, ๋ค์ด๋ฒ ์ํ์ ๋ฆฌ๋ทฐ๋ฅผ ํฌ๋กค๋งํด์ ์ํ ๋ฆฌ๋ทฐ ๋ถ์ ๋ฐ์ดํฐ์
์ ์ ์ํ๊ณ , ์ด๋ฅผ ์ด์ฉํ์ฌ ๋ชจ๋ธ์ ํ์ต ๋ฐ ํ๊ฐํ์๋ค.
|
191 |
+
์์ด ๋ชจ๋ธ์ SST-2์์ 92.8%, ํ๊ธ ๋ชจ๋ธ์ ๋ค์ด๋ฒ ์ํ ๋ฆฌ๋ทฐ ๋ฐ์ดํฐ์
์์ 94%์ ์ ํ๋๋ฅผ ๊ฐ์ง๋ค (test set ๊ธฐ์ค).
|
192 |
+
์ธ์ด๊ฐ์ง๋ fasttext์ language detector๋ฅผ ์ฌ์ฉํ์๋ค. ๋ฆฌ๋ทฐ์ ๋จ์ด๋ณ ์ํฅ๋ ฅ์, ๋จ์ด ๊ฐ๊ฐ์ ๋ชจ๋ธ์ ๋ฃ์์ ๋ ๊ฒฐ๊ณผ๊ฐ ๊ธ์ ์ผ๋ก ๋์ค๋์ง ๋ถ์ ์ผ๋ก ๋์ค๋์ง๋ฅผ ๋ฐํ์ผ๋ก ์ธก์ ํ์๋ค.
|
|
|
|
|
|
|
|
|
|
|
193 |
""")
|
194 |
|
195 |
with gr.Row():
|
196 |
with gr.Column():
|
197 |
+
inputs_1 = gr.Dropdown(choices=['์ธ์ด๊ฐ์ง ๊ธฐ๋ฅ ์ฌ์ฉ', 'Eng', 'Kor'], value='์ธ์ด๊ฐ์ง ๊ธฐ๋ฅ ์ฌ์ฉ', label='Lang')
|
198 |
inputs_2 = gr.Textbox(placeholder="๋ฆฌ๋ทฐ๋ฅผ ์
๋ ฅํ์์ค.", label='Text')
|
199 |
with gr.Row():
|
200 |
+
# btn2 = gr.Button("ํด๋ฆฌ์ด")
|
201 |
btn = gr.Button("์ ์ถํ๊ธฐ")
|
202 |
with gr.Column():
|
203 |
output_1 = gr.Label(num_top_classes=3, label='Lang')
|