File size: 4,097 Bytes
a807d8d 9bfcdd9 a807d8d a7f11e8 b77fa64 a7f11e8 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 a807d8d 9bfcdd9 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 |
---
library_name: transformers
license: cc-by-nc-sa-4.0
---
# The license is cc-by-nc-sa-4.0.
- Commercializing is not allowed.
![mark1](ko-1.4.png)
# Model Card for Model ID
๊ธฐ์กด์ DopeorNope/Ko-Mixtral-v1.3-MoE-7Bx2 ๋ชจ๋ธ์์ ํฅ์๋ 1.4๋ฒ์ ์
๋๋ค.
์ถ๊ฐ๋ ์ฌํญ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
1. ํ๋ จ์ ํ์ฉ๋ ์ฝํผ์ค๋ฅผ ๋งค๋ด์ผํ๊ฒ ๊ฒํ ํ๊ณ ์ด์ํ ์ฝํผ์ค๋ฅผ ์์ ํ๊ณ ์ ์ ํ์์ต๋๋ค.
2. Near dudup ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ์ฌ ์ค๋ณต๋๋ ์ฝํผ์ค๋ฅผ ์ ๊ฑฐํ์์ต๋๋ค.
3. ๊ธฐ์กด์ 3๊ฐ์ง task์์ ํ๊ฐ์ง task๋ฅผ ์ถ๊ฐํ์์ต๋๋ค.
## Model Details
### Model Description
- **Developed by:** DopeorNope(Seungyoo Lee), kyujinpy(Kyujin Han)
- **Model type:** Mixtral
- **Language:** English based model but finetuned with Korean corpus
- **License:** cc-by-nc-sa-4.0
- **Finetuned from model:** DopeorNope/Ko-Mixtral-v1.3-MoE-7Bx2
- **funded by:** the Ministry of Science and ICT(MSIT, Korea) & Gwangju Metropolitan City
## Training
#### Testing Data
AI-HUB์์ ์ ๊ณต๋ ์ฝํผ์ค๋ฅผ ๊ฐ์ง๊ณ ๋ค์๊ณผ ๊ฐ์ 4๊ฐ์ง task๋ฅผ text mining์ผ๋ก ๋ง๋ค์ด ์ ์ฉํ์์ต๋๋ค.
- **1.Mask prediction Task**
```python
#Mask prediction
#๋ฌธ์ฅ์์ ํ๊ตญ์ด ๋จ์ด๋ฅผ ๋ง์คํน ํ ์ดํ, ์ด ๋จ์ด๋ฅผ ์์ธกํ๊ฒ ๋ง๋๋ Task์
๋๋ค.
Text='์ง๋ฅ(ๆบ่ฝ) ๋๋ ์ธํ
๋ฆฌ์ ์ค(intelligence)๋ ์ธ๊ฐ์ <MASK> ๋ฅ๋ ฅ์ ๋งํ๋ค.'
Response='์ง์ '
Complete_text='์ง๋ฅ(ๆบ่ฝ) ๋๋ ์ธํ
๋ฆฌ์ ์ค(intelligence)๋ ์ธ๊ฐ์ ์ง์ ๋ฅ๋ ฅ์ ๋งํ๋ค.'
```
- **2.Text-allign Task**
```python
#Text-allign Task
#๋ฌธ๋จ์์ ๊ฐ ๋ฌธ์ฅ๋ค์ ์ถ์ถํ๊ณ ์ถ์ถํ ๋ฌธ์ฅ๋ค์ ๋ฌด์์๋ก ์์ ํ ์์ ๋ฌธ์ฅ๋ค์ ๋ฌธ๋งฅ์ ์ ์ ํ๊ฒ ๋ฐฐ์ดํ๋ ํ์คํธ ์
๋๋ค.
Text_list=['๋ณต์๋ช
๋ น-๋ณต์์๋ฃ(MIMD,Multiple Instruction, Multiple Data)์ ์ ์ฐ์์ ๋ณ๋ ฌํ์ ํ ๊ธฐ๋ฒ์ด๋ค.',
'๋ถ์ฐ ๋ฉ๋ชจ๋ฆฌ์ ์๋ MPP(massively parallel processors)์ COW (Clusters of Workstations)์ด๋ค.',
'MIMD๊ธฐ๊ณ๋ ๊ณต์ ๋ฉ๋ชจ๋ฆฌ์ด๊ฑฐ๋ ๋ถ์ฐ ๋ฉ๋ชจ๋ฆฌ์ด๋ฉฐ ์ด๋ฌํ ๋ถ๋ฅ๋ MIMD๊ฐ ์ด๋ป๊ฒ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ด์ฉํ๋๋์ ๋ฐ๋ผ ๋๋๋ค.']
Response='๋ณต์๋ช
๋ น-๋ณต์์๋ฃ(MIMD,Multiple Instruction, Multiple Data)์ ์ ์ฐ์์ ๋ณ๋ ฌํ์ ํ ๊ธฐ๋ฒ์ด๋ค.
MIMD๊ธฐ๊ณ๋ ๊ณต์ ๋ฉ๋ชจ๋ฆฌ์ด๊ฑฐ๋ ๋ถ์ฐ ๋ฉ๋ชจ๋ฆฌ์ด๋ฉฐ ์ด๋ฌํ ๋ถ๋ฅ๋ MIMD๊ฐ ์ด๋ป๊ฒ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ด์ฉํ๋๋์ ๋ฐ๋ผ ๋๋๋ค.
๋ถ์ฐ ๋ฉ๋ชจ๋ฆฌ์ ์๋ MPP(massively parallel processors)์ COW (Clusters of Workstations)์ด๋ค.'
```
- **3.Text completion Task**
```python
#Text Completion
# ๋ฌธ๋จ์์ ๋ง์ง๋ง ๋ฌธ์ฅ์ ์ถ์ถํ๊ณ , ์ถ์ถ๋ ๋ฌธ์ฅ์ ์ด์ ์ ๋ฌธ๋จ๊น์ง๋ฅผ input์ผ๋ก ํ์ฌ ๋ง์ง๋ง ๋ฌธ์ฅ์ ์์ธกํ๊ฒ ํ๋ ๊ณผ์ ์
๋๋ค.
Text= '๊ทธ๋ฆฐ๋ธ๋ผ์ฐ์ (GreenBrowser)๋ ์ธํฐ๋ท ์ต์คํ๋ก๋ฌ์์ ์ฌ์ฉํ๋ ํธ๋ผ์ด๋ํธ ๋ ์ด์์ ์์ง์ ๋ฐํ์ผ๋ก ํ๋ฉฐ ์ค๊ตญ์ ๊ธฐ๋ฐ์ ๋ ์ํํธ์จ์ด ํ์ฌ์ธ ๋ชจ์ดํต(morequick)์์ ๋ง๋ ๋ฌด๋ฃ ์น ๋ธ๋ผ์ฐ์ ๋ค. ๊ฐ์ฒด์ ์ค๊ตญ์ด๊ฐ ์น ๋ธ๋ผ์ฐ์ ์ ๋ด์ฅ๋์ด ์๋ค.
๋งฅ์คํค ์น ๋ธ๋ผ์ฐ์ ์ ๋น์ทํ์ฌ MyIE์ ๋ฐ์ ํ๊ฒ ๊ด๋ จ๋์ด ์๋ค. ๋งฅ์คํค์ฉ์ ์ผ๋ถ ํ๋ฌ๊ทธ์ธ์ด ๊ทธ๋ฆฐ๋ธ๋ผ์ฐ์ ์์๋ ์๋ํ ๊ฒ์ด๋ค.'
Response= '์๋ ์คํฌ๋กค, ์๋ ๋ฆฌํ๋ ์, ์๋ ์ ์ฅ, ์๋ ํผ ์ฑ์ฐ๊ธฐ์ ๊ฐ์ ๋ง์ ์๋ํ ๊ธฐ๋ฅ์ด ์๋ค.'
```
- **4. Sentence Genration**
```python
#Text Completion
# ๋ฌธ์ฅ์์ ๋ชจ๋ ๋จ์ด๋ค์ ์ถ์ถํ๊ณ ๋ฌด์์๋ก ์์ ํ ์ค๋ณต๋ ๋จ์ด๋ฅผ ์ ๊ฑฐํ๊ณ , ์ ์๋ ๋จ์ด ๋ฆฌ์คํธ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ฒฝํ ๋ฌธ์ฅ์ ์์ฑํด๋ด๋ task์
๋๋ค.
Word_List: ['ฯ์', '์ ์ด์์๋', '์ ์ด์', 'ํํ์ด', 'ฯ', '๋ก๋ด', '์ฐ์ธ๋ค', 'ฮธ', '๊ฐ์', '์์ฃผ', '๊ธฐ๊ธฐ']
response= '์๋ ์คํฌ๋กค, ์๋ ๋ฆฌํ๋ ์, ์๋ ์ ์ฅ, ์๋ ํผ ์ฑ์ฐ๊ธฐ์ ๊ฐ์ ๋ง์ ์๋ํ ๊ธฐ๋ฅ์ด ์๋ค.'
```
### Environments
- **Hardware Type:** Nvidia A100 x 4
- **Training hours:** 3 Days
|