Aston-xMAD's picture
init commit
9382e3f verified

A newer version of the Gradio SDK is available: 5.16.0

Upgrade

BERTology

BERT์™€ ๊ฐ™์€ ๋Œ€๊ทœ๋ชจ ํŠธ๋žœ์Šคํฌ๋จธ์˜ ๋‚ด๋ถ€ ๋™์ž‘์„ ์กฐ์‚ฌํ•˜๋Š” ์—ฐ๊ตฌ ๋ถ„์•ผ๊ฐ€ ์ ์  ๋” ์ค‘์š”ํ•ด์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํ˜น์ž๋Š” "BERTology"๋ผ ์นญํ•˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ถ„์•ผ์˜ ์ข‹์€ ์˜ˆ์‹œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • BERT๋Š” ๊ณ ์ „์ ์ธ NLP ํŒŒ์ดํ”„๋ผ์ธ์˜ ์žฌ๋ฐœ๊ฒฌ - Ian Tenney, Dipanjan Das, Ellie Pavlick: https://arxiv.org/abs/1905.05950
  • 16๊ฐœ์˜ ํ—ค๋“œ๊ฐ€ ์ •๋ง๋กœ 1๊ฐœ๋ณด๋‹ค ๋‚˜์€๊ฐ€? - Paul Michel, Omer Levy, Graham Neubig: https://arxiv.org/abs/1905.10650
  • BERT๋Š” ๋ฌด์—‡์„ ๋ณด๋Š”๊ฐ€? BERT์˜ ์–ดํ…์…˜ ๋ถ„์„ - Kevin Clark, Urvashi Khandelwal, Omer Levy, Christopher D. Manning: https://arxiv.org/abs/1906.04341
  • CAT-probing: ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด์— ๋Œ€ํ•ด ์‚ฌ์ „ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์ด ์–ด๋–ป๊ฒŒ ์ฝ”๋“œ ๊ตฌ์กฐ๋ฅผ ๋ณด๋Š”์ง€ ์•Œ์•„๋ณด๊ธฐ ์œ„ํ•œ ๋ฉ”ํŠธ๋ฆญ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ ๋ฐฉ๋ฒ•: https://arxiv.org/abs/2210.04633

์šฐ๋ฆฌ๋Š” ์ด ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ๋ถ„์•ผ์˜ ๋ฐœ์ „์„ ๋•๊ธฐ ์œ„ํ•ด, BERT/GPT/GPT-2 ๋ชจ๋ธ์— ๋‚ด๋ถ€ ํ‘œํ˜„์„ ์‚ดํŽด๋ณผ ์ˆ˜ ์žˆ๋Š” ๋ช‡ ๊ฐ€์ง€ ๊ธฐ๋Šฅ์„ ์ถ”๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ธฐ๋Šฅ๋“ค์€ ์ฃผ๋กœ Paul Michel์˜ ํ›Œ๋ฅญํ•œ ์ž‘์—…์„ ์ฐธ๊ณ ํ•˜์—ฌ ๊ฐœ๋ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค (https://arxiv.org/abs/1905.10650):

  • BERT/GPT/GPT-2์˜ ๋ชจ๋“  ์€๋‹‰ ์ƒํƒœ์— ์ ‘๊ทผํ•˜๊ธฐ,
  • BERT/GPT/GPT-2์˜ ๊ฐ ํ—ค๋“œ์˜ ๋ชจ๋“  ์–ดํ…์…˜ ๊ฐ€์ค‘์น˜์— ์ ‘๊ทผํ•˜๊ธฐ,
  • ํ—ค๋“œ์˜ ์ถœ๋ ฅ ๊ฐ’๊ณผ ๊ทธ๋ž˜๋””์–ธํŠธ๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ ํ—ค๋“œ ์ค‘์š”๋„ ์ ์ˆ˜๋ฅผ ๊ณ„์‚ฐํ•˜๊ณ  https://arxiv.org/abs/1905.10650์—์„œ ์„ค๋ช…๋œ ๋Œ€๋กœ ํ—ค๋“œ๋ฅผ ์ œ๊ฑฐํ•˜๋Š” ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๊ธฐ๋Šฅ๋“ค์„ ์ดํ•ดํ•˜๊ณ  ์ง์ ‘ ์‚ฌ์šฉํ•ด๋ณผ ์ˆ˜ ์žˆ๋„๋ก bertology.py ์˜ˆ์ œ ์Šคํฌ๋ฆฝํŠธ๋ฅผ ์ถ”๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ์˜ˆ์ œ ์Šคํฌ๋ฆฝํŠธ์—์„œ๋Š” GLUE์— ๋Œ€ํ•ด ์‚ฌ์ „ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์—์„œ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜๊ณ  ๋ชจ๋ธ์„ ๊ฐ€์ง€์น˜๊ธฐ(prune)ํ•ด๋ด…๋‹ˆ๋‹ค.