language: ko
tags:
- summarization
- bigbird
- bart
inference: false
- This model is a monologg/kobigbird-bert-base, ainize/kobart-news finetuned on the daekeun-ml/naver-news-summarization-ko
<<20220917 Commit>>
๊ฐ์ธ ์คํฐ๋์ฉ์ผ๋ก ๊ธด ๋ฌธ์ฅ(๋ด์ค ๋ฑ)์ ์์ฝ ๋ชจ๋ธ ํนํ๋ ๋ชจ๋ธ์ ๋ง๋ค๊ธฐ ์ํด BERT๊ธฐ๋ฐ์ KoBigBird ๋ชจ๋ธ์ Encoder Decoder๋ก ๋ณํํ ๋ชจ๋ธ์ ๋๋ค. ๊ธฐ์กด์ monologg๋์ KoBigBird๋ BERT๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ด๋ ์ฑ๋ฅ์ ์๋ํ์ง๋ง ์์ฑ ์์ฝ ๋ถ๋ถ์ ์์ด์๋ Decoder๊ฐ ์๊ธฐ ๋๋ฌธ์ ์ถ๊ฐ์ ์ผ๋ก Decoder๋ฅผ ์ถ๊ฐํ์ต๋๋ค.
๋ง๋ค์๋ ์ด๊ธฐ ๋ชจ๋ธ์ KoBigBird์ Encoder๋ฅผ Decoder๋ก ํ์ฉํ์ฌ ๋ง๋์์ต๋๋ค๋ง, ์์ํ ์ค๋ฅ๋ก ์ธํ์ฌ monologg๋์ KoBigBird-bert-base์ Encoder ๋ถ๋ถ๊ณผ ainize๋์ KoBART-news์ Decoder๋ฅผ ์ด์ด์ ๋ง๋ค์์ต๋๋ค. config ์์ ๋ฑ hyper-parameter finetuned ๋ฐ์ดํฐ์ ์ผ๋ก daekeun-ml๋์ด ์ ๊ณตํด์ฃผ์ naver-news-summarization-ko ๋ฐ์ดํฐ์ ์ ํ์ฉํ์ต๋๋ค.
์ดํ AIํ๋ธ์์ ์ ๊ณตํ๋ ์์ฝ ๋ฐ์ดํฐ์ ์ผ๋ก ์ถ๊ฐ ํ์ต ์งํ ์์ ์ ๋๋ค.
์ฑ๋ฅ๋ ๋ง์ด ์์ข๊ณ ์ด์ํ์ง๋ง, ์์ฐ์ด ์ฒ๋ฆฌ์ ๋ํด์ ๊ด์ฌ๋ ์๊ณ ์ ๋๋ก ํ์ฉํ๊ณ ์ถ์ด ์ค์ค๋ก ๋ง๋ค์ด๋ณด๊ณ ์์ต๋๋ค. ์ง์์ ์ผ๋ก ๋ฐ์ ์์ผ ์ข์ ์ฑ๋ฅ์ ๋ชจ๋ธ์ ๊ตฌํํ๊ฒ ์ต๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
# Python Code
from transformers import AutoTokenizer
from transformers import AutoModelForSeq2SeqLM
tokenizer = AutoTokenizer.from_pretrained("noahkim/KoBigBird-KoBart-News-Summarization")
model = AutoModelForSeq2SeqLM.from_pretrained("noahkim/KoBigBird-KoBart-News-Summarization")
@software{jangwon_park_2021_5654154, author = {Jangwon Park and Donggyu Kim}, title = {KoBigBird: Pretrained BigBird Model for Korean}, month = nov, year = 2021, publisher = {Zenodo}, version = {1.0.0}, doi = {10.5281/zenodo.5654154}, url = {https://doi.org/10.5281/zenodo.5654154} }