A newer version of the Gradio SDK is available:
5.16.0
BERTology
BERT์ ๊ฐ์ ๋๊ท๋ชจ ํธ๋์คํฌ๋จธ์ ๋ด๋ถ ๋์์ ์กฐ์ฌํ๋ ์ฐ๊ตฌ ๋ถ์ผ๊ฐ ์ ์ ๋ ์ค์ํด์ง๊ณ ์์ต๋๋ค. ํน์๋ "BERTology"๋ผ ์นญํ๊ธฐ๋ ํฉ๋๋ค. ์ด ๋ถ์ผ์ ์ข์ ์์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- BERT๋ ๊ณ ์ ์ ์ธ NLP ํ์ดํ๋ผ์ธ์ ์ฌ๋ฐ๊ฒฌ - Ian Tenney, Dipanjan Das, Ellie Pavlick: https://arxiv.org/abs/1905.05950
- 16๊ฐ์ ํค๋๊ฐ ์ ๋ง๋ก 1๊ฐ๋ณด๋ค ๋์๊ฐ? - Paul Michel, Omer Levy, Graham Neubig: https://arxiv.org/abs/1905.10650
- BERT๋ ๋ฌด์์ ๋ณด๋๊ฐ? BERT์ ์ดํ ์ ๋ถ์ - Kevin Clark, Urvashi Khandelwal, Omer Levy, Christopher D. Manning: https://arxiv.org/abs/1906.04341
- CAT-probing: ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์ ๋ํด ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ด ์ด๋ป๊ฒ ์ฝ๋ ๊ตฌ์กฐ๋ฅผ ๋ณด๋์ง ์์๋ณด๊ธฐ ์ํ ๋ฉํธ๋ฆญ ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ๋ฒ: https://arxiv.org/abs/2210.04633
์ฐ๋ฆฌ๋ ์ด ์๋ก์ด ์ฐ๊ตฌ ๋ถ์ผ์ ๋ฐ์ ์ ๋๊ธฐ ์ํด, BERT/GPT/GPT-2 ๋ชจ๋ธ์ ๋ด๋ถ ํํ์ ์ดํด๋ณผ ์ ์๋ ๋ช ๊ฐ์ง ๊ธฐ๋ฅ์ ์ถ๊ฐํ์ต๋๋ค. ์ด ๊ธฐ๋ฅ๋ค์ ์ฃผ๋ก Paul Michel์ ํ๋ฅญํ ์์ ์ ์ฐธ๊ณ ํ์ฌ ๊ฐ๋ฐ๋์์ต๋๋ค (https://arxiv.org/abs/1905.10650):
- BERT/GPT/GPT-2์ ๋ชจ๋ ์๋ ์ํ์ ์ ๊ทผํ๊ธฐ,
- BERT/GPT/GPT-2์ ๊ฐ ํค๋์ ๋ชจ๋ ์ดํ ์ ๊ฐ์ค์น์ ์ ๊ทผํ๊ธฐ,
- ํค๋์ ์ถ๋ ฅ ๊ฐ๊ณผ ๊ทธ๋๋์ธํธ๋ฅผ ๊ฒ์ํ์ฌ ํค๋ ์ค์๋ ์ ์๋ฅผ ๊ณ์ฐํ๊ณ https://arxiv.org/abs/1905.10650์์ ์ค๋ช ๋ ๋๋ก ํค๋๋ฅผ ์ ๊ฑฐํ๋ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค.
์ด๋ฌํ ๊ธฐ๋ฅ๋ค์ ์ดํดํ๊ณ ์ง์ ์ฌ์ฉํด๋ณผ ์ ์๋๋ก bertology.py ์์ ์คํฌ๋ฆฝํธ๋ฅผ ์ถ๊ฐํ์ต๋๋ค. ์ด ์์ ์คํฌ๋ฆฝํธ์์๋ GLUE์ ๋ํด ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์์ ์ ๋ณด๋ฅผ ์ถ์ถํ๊ณ ๋ชจ๋ธ์ ๊ฐ์ง์น๊ธฐ(prune)ํด๋ด ๋๋ค.