|
--- |
|
language: ko |
|
tags: |
|
- summarization |
|
- bigbird |
|
- bart |
|
inference: false |
|
|
|
--- |
|
- This model is a [monologg/kobigbird-bert-base](https://huggingface.co/monologg/kobigbird-bert-base), [ainize/kobart-news](https://huggingface.co/ainize/kobart-news) finetuned on the [daekeun-ml/naver-news-summarization-ko](https://huggingface.co/datasets/daekeun-ml/naver-news-summarization-ko) |
|
|
|
<<20220917 Commit>> |
|
|
|
๊ฐ์ธ ์คํฐ๋์ฉ์ผ๋ก ๊ธด ๋ฌธ์ฅ(๋ด์ค ๋ฑ)์ ์์ฝ ๋ชจ๋ธ ํนํ๋ ๋ชจ๋ธ์ ๋ง๋ค๊ธฐ ์ํด BERT๊ธฐ๋ฐ์ KoBigBird ๋ชจ๋ธ์ Encoder Decoder๋ก ๋ณํํ ๋ชจ๋ธ์
๋๋ค. |
|
๊ธฐ์กด์ monologg๋์ KoBigBird๋ BERT๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ด๋ ์ฑ๋ฅ์ ์๋ํ์ง๋ง ์์ฑ ์์ฝ ๋ถ๋ถ์ ์์ด์๋ Decoder๊ฐ ์๊ธฐ ๋๋ฌธ์ ์ถ๊ฐ์ ์ผ๋ก Decoder๋ฅผ ์ถ๊ฐํ์ต๋๋ค. |
|
|
|
๋ง๋ค์๋ ์ด๊ธฐ ๋ชจ๋ธ์ KoBigBird์ Encoder๋ฅผ Decoder๋ก ํ์ฉํ์ฌ ๋ง๋์์ต๋๋ค๋ง, ์์ํ ์ค๋ฅ๋ก ์ธํ์ฌ monologg๋์ KoBigBird-bert-base์ Encoder ๋ถ๋ถ๊ณผ ainize๋์ KoBART-news์ Decoder๋ฅผ ์ด์ด์ ๋ง๋ค์์ต๋๋ค. config ์์ ๋ฑ hyper-parameter |
|
finetuned ๋ฐ์ดํฐ์
์ผ๋ก daekeun-ml๋์ด ์ ๊ณตํด์ฃผ์ naver-news-summarization-ko ๋ฐ์ดํฐ์
์ ํ์ฉํ์ต๋๋ค. |
|
|
|
์ดํ AIํ๋ธ์์ ์ ๊ณตํ๋ ์์ฝ ๋ฐ์ดํฐ์
์ผ๋ก ์ถ๊ฐ ํ์ต ์งํ ์์ ์
๋๋ค. |
|
|
|
์ฑ๋ฅ๋ ๋ง์ด ์์ข๊ณ ์ด์ํ์ง๋ง, ์์ฐ์ด ์ฒ๋ฆฌ์ ๋ํด์ ๊ด์ฌ๋ ์๊ณ ์ ๋๋ก ํ์ฉํ๊ณ ์ถ์ด ์ค์ค๋ก ๋ง๋ค์ด๋ณด๊ณ ์์ต๋๋ค. |
|
์ง์์ ์ผ๋ก ๋ฐ์ ์์ผ ์ข์ ์ฑ๋ฅ์ ๋ชจ๋ธ์ ๊ตฌํํ๊ฒ ์ต๋๋ค. |
|
๊ฐ์ฌํฉ๋๋ค. |
|
|
|
<pre><code> |
|
# Python Code |
|
from transformers import AutoTokenizer |
|
from transformers import AutoModelForSeq2SeqLM |
|
|
|
tokenizer = AutoTokenizer.from_pretrained("noahkim/KoBigBird-KoBart-News-Summarization") |
|
model = AutoModelForSeq2SeqLM.from_pretrained("noahkim/KoBigBird-KoBart-News-Summarization") |
|
</pre></code> |
|
|
|
|
|
|
|
@software{jangwon_park_2021_5654154, |
|
author = {Jangwon Park and Donggyu Kim}, |
|
title = {KoBigBird: Pretrained BigBird Model for Korean}, |
|
month = nov, |
|
year = 2021, |
|
publisher = {Zenodo}, |
|
version = {1.0.0}, |
|
doi = {10.5281/zenodo.5654154}, |
|
url = {https://doi.org/10.5281/zenodo.5654154} |
|
} |