File size: 2,226 Bytes
750c79e ed9b5a9 750c79e ed9b5a9 78453a2 f7cbb70 ed9b5a9 f7cbb70 ed9b5a9 f7cbb70 ed9b5a9 6801730 f7cbb70 366ad9d ed9b5a9 f7cbb70 ed9b5a9 750c79e 366ad9d ed9b5a9 750c79e ed9b5a9 750c79e 530fa5f ed9b5a9 265a525 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 |
---
language: ko
tags:
- summarization
- bigbird
- bart
inference: false
---
- This model is a [monologg/kobigbird-bert-base](https://huggingface.co/monologg/kobigbird-bert-base), [ainize/kobart-news](https://huggingface.co/ainize/kobart-news) finetuned on the [daekeun-ml/naver-news-summarization-ko](https://huggingface.co/datasets/daekeun-ml/naver-news-summarization-ko)
<<20220917 Commit>>
๊ฐ์ธ ์คํฐ๋์ฉ์ผ๋ก ๊ธด ๋ฌธ์ฅ(๋ด์ค ๋ฑ)์ ์์ฝ ๋ชจ๋ธ ํนํ๋ ๋ชจ๋ธ์ ๋ง๋ค๊ธฐ ์ํด BERT๊ธฐ๋ฐ์ KoBigBird ๋ชจ๋ธ์ Encoder Decoder๋ก ๋ณํํ ๋ชจ๋ธ์
๋๋ค.
๊ธฐ์กด์ monologg๋์ KoBigBird๋ BERT๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ด๋ ์ฑ๋ฅ์ ์๋ํ์ง๋ง ์์ฑ ์์ฝ ๋ถ๋ถ์ ์์ด์๋ Decoder๊ฐ ์๊ธฐ ๋๋ฌธ์ ์ถ๊ฐ์ ์ผ๋ก Decoder๋ฅผ ์ถ๊ฐํ์ต๋๋ค.
๋ง๋ค์๋ ์ด๊ธฐ ๋ชจ๋ธ์ KoBigBird์ Encoder๋ฅผ Decoder๋ก ํ์ฉํ์ฌ ๋ง๋์์ต๋๋ค๋ง, ์์ํ ์ค๋ฅ๋ก ์ธํ์ฌ monologg๋์ KoBigBird-bert-base์ Encoder ๋ถ๋ถ๊ณผ ainize๋์ KoBART-news์ Decoder๋ฅผ ์ด์ด์ ๋ง๋ค์์ต๋๋ค. config ์์ ๋ฑ hyper-parameter
finetuned ๋ฐ์ดํฐ์
์ผ๋ก daekeun-ml๋์ด ์ ๊ณตํด์ฃผ์ naver-news-summarization-ko ๋ฐ์ดํฐ์
์ ํ์ฉํ์ต๋๋ค.
์ดํ AIํ๋ธ์์ ์ ๊ณตํ๋ ์์ฝ ๋ฐ์ดํฐ์
์ผ๋ก ์ถ๊ฐ ํ์ต ์งํ ์์ ์
๋๋ค.
์ฑ๋ฅ๋ ๋ง์ด ์์ข๊ณ ์ด์ํ์ง๋ง, ์์ฐ์ด ์ฒ๋ฆฌ์ ๋ํด์ ๊ด์ฌ๋ ์๊ณ ์ ๋๋ก ํ์ฉํ๊ณ ์ถ์ด ์ค์ค๋ก ๋ง๋ค์ด๋ณด๊ณ ์์ต๋๋ค.
์ง์์ ์ผ๋ก ๋ฐ์ ์์ผ ์ข์ ์ฑ๋ฅ์ ๋ชจ๋ธ์ ๊ตฌํํ๊ฒ ์ต๋๋ค.
๊ฐ์ฌํฉ๋๋ค.
<pre><code>
# Python Code
from transformers import AutoTokenizer
from transformers import AutoModelForSeq2SeqLM
tokenizer = AutoTokenizer.from_pretrained("noahkim/KoBigBird-KoBart-News-Summarization")
model = AutoModelForSeq2SeqLM.from_pretrained("noahkim/KoBigBird-KoBart-News-Summarization")
</pre></code>
@software{jangwon_park_2021_5654154,
author = {Jangwon Park and Donggyu Kim},
title = {KoBigBird: Pretrained BigBird Model for Korean},
month = nov,
year = 2021,
publisher = {Zenodo},
version = {1.0.0},
doi = {10.5281/zenodo.5654154},
url = {https://doi.org/10.5281/zenodo.5654154}
} |