heegyu commited on
Commit
58d274d
β€’
1 Parent(s): c5b41fb

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +85 -0
README.md ADDED
@@ -0,0 +1,85 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ datasets:
3
+ - beomi/KoAlpaca-v1.1a
4
+ - dbdu/ShareGPT-74k-ko
5
+ - heegyu/korquad-chat-v1
6
+ - HAERAE-HUB/KoInstruct-QA
7
+ - changpt/ko-lima-vicuna
8
+ - nlpai-lab/kullm-v2
9
+ language:
10
+ - ko
11
+ ---
12
+ # heegyu/polyglot-ko-5.8b-chat
13
+
14
+ - [EleutherAI/polyglot-ko-5.8b](https://huggingface.co/EleutherAI/polyglot-ko-5.8b)λ₯Ό μ—¬λŸ¬ ν•œκ΅­μ–΄ instruction λ°μ΄ν„°μ…‹μœΌλ‘œ ν•™μŠ΅ν•œ λͺ¨λΈ
15
+
16
+
17
+ ## μ‚¬μš©ν•œ 데이터셋
18
+
19
+ | Dataset | # instance | νƒ€μž… |
20
+ | --- | --- | --- |
21
+ | [KoAlpaca v1.1](https://raw.githubusercontent.com/Beomi/KoAlpaca/main/KoAlpaca_v1.1.jsonl) | 50K | μ‹±κΈ€ν„΄ |
22
+ | [dbdu/ShareGPT-74k-ko 의 part2_ko_uncleaned](https://huggingface.co/datasets/dbdu/ShareGPT-74k-ko/resolve/main/part2_ko_uncleaned.json) | 36K | λ©€ν‹°ν„΄ |
23
+ | [heegyu/korquad-chat-v1](https://huggingface.co/datasets/heegyu/korquad-chat-v1) | 9.6K | λ©€ν‹°ν„΄, μ§€μ‹κΈ°λ°˜ |
24
+ | [lcw99/evolve-instruct](https://github.com/lcw99/evolve-instruct/) | 37K | μ‹±κΈ€ν„΄ |
25
+ | [HAERAE-HUB/KoInstruct-QA](https://huggingface.co/datasets/HAERAE-HUB/KoInstruct-QA) | 50.3k | μ‹±κΈ€ν„΄ |
26
+ | [changpt/ko-lima-vicuna](https://huggingface.co/datasets/changpt/ko-lima-vicuna) | 1K | μ‹±κΈ€ν„΄, λ©€ν‹°ν„΄(극히 일뢀) |
27
+ | [nlpai-lab/kullm-v2](https://huggingface.co/datasets/nlpai-lab/kullm-v2) | 15K | μ‹±κΈ€ν„΄ |
28
+
29
+ - KULLM v2 λ°μ΄ν„°μ…‹μ—μ„œλŠ” GPT4ALL, Dolly λ°μ΄ν„°λ§Œ μΆ”μΆœν•΄μ„œ μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€.
30
+ - λ‹€μ–‘ν•œ ν•™μŠ΅ 데이터셋은 [HeegyuKim/open-korean-instructions](https://github.com/HeegyuKim/open-korean-instructions) GitHub repositoryλ₯Ό μ°Έκ³ ν•˜μ„Έμš”.
31
+
32
+ ## 생성 Prompt
33
+ - EOS token(<|endoftext|>)이 λ‚˜μ˜¬ λ•ŒκΉŒμ§€ μƒμ„±ν•˜λ©΄ λ©λ‹ˆλ‹€.
34
+ - μ΅œμƒλ‹¨ ν”„λ‘¬ν”„νŠΈλŠ” μžˆλŠ”κ²Œ 쒋은 닡변이 더 자주 λ‚˜μ˜€λŠ” 것 κ°™μ•„μš”.
35
+
36
+ ```
37
+ 당신은 AI μ±—λ΄‡μž…λ‹ˆλ‹€. μ‚¬μš©μžμ—κ²Œ 도움이 되고 μœ μ΅ν•œ λ‚΄μš©μ„ μ œκ³΅ν•΄μ•Όν•©λ‹ˆλ‹€. 닡변은 κΈΈκ³  μžμ„Έν•˜λ©° μΉœμ ˆν•œ μ„€λͺ…을 λ§λΆ™μ—¬μ„œ μž‘μ„±ν•˜μ„Έμš”.
38
+
39
+ ### μ‚¬μš©μž:
40
+ μ„œμšΈ 관광지 μΆ”μ²œν•΄μ€˜μš”
41
+
42
+ ### 챗봇:
43
+ ```
44
+
45
+ μƒμ„±λœ λ‹΅λ³€:
46
+ ```
47
+ μ„œμšΈ 관광지λ₯Ό μΆ”μ²œν•˜κ² μŠ΅λ‹ˆλ‹€.
48
+
49
+ 경볡ꢁ (경볡ꢁ λ˜λŠ” 경볡ꢁ)
50
+ 경볡ꢁ은 ν•œκ΅­ 전톡 κΆκΆλ‘œμ„œ μ‘°μ„  μ‹œλŒ€μ˜ 역사와 건좕 철학을 μ²΄ν—˜ν•  수 μžˆλŠ” κ³΅κ°„μž…λ‹ˆλ‹€. ꢁ을 λ°©λ¬Έν•˜λ©΄ μ‘°μ„ μ‹œλŒ€ μƒν™œκ³Ό ν†΅μΉ˜λ°©μ‹μ— λŒ€ν•΄ 배울 수 있으며, λ™μ‹œμ— 전톡적인 ꢁꢐ λ¬Έν™”λ₯Ό μ²΄ν—˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
51
+
52
+ 창덕ꢁ (창덕ꢁ)
53
+ 창덕ꢁ은 μ‘°μ„ μ‹œλŒ€μ— μ™•μ‹€μ˜ μ •μ›μœΌλ‘œ 유λͺ…ν•œ κΆμž…λ‹ˆλ‹€. ν•œκ΅­μ˜ λ₯΄λ„€μƒμŠ€ μ‹œλŒ€λ₯Ό λ³΄μ—¬μ£ΌλŠ” 아름닀움을 κ²½ν—˜ν•  수 있으며, 전톡적인 건좕양식을 κ²½ν—˜ν•  수 μžˆλŠ” κΈ°νšŒκ°€ μ£Όμ–΄μ§‘λ‹ˆλ‹€.
54
+
55
+ λ•μˆ˜κΆ (λ•μˆ˜κΆ)
56
+ λ•μˆ˜κΆμ€ 1896년에 μ„€λ¦½λœ 왕이 μ‚¬λŠ” κΆκΆμž…λ‹ˆλ‹€. λ‹Ήμ‹œμ˜ 아름닀움과 건좕 철학을 λ™μ‹œμ— λŠλ‚„ 수 μžˆλŠ” κΆκΆμž…λ‹ˆλ‹€. ν•œκ΅­μ˜ ꢁꢐ λ¬Έν™”, 역사 및 μžμ—° ν™˜κ²½μ— λŒ€ν•œ ν•™μŠ΅μ„ μ›ν•˜λŠ” μ‚¬λžŒμ—κ²Œ μΆ”μ²œλ©λ‹ˆλ‹€.
57
+
58
+ μ’…λ¬˜ (μ’…λ¬˜)
59
+ μ’…λ¬˜λŠ” μ‘°μ„ μ‹œλŒ€μ˜ μ™•μ‹€ μ •μ›μœΌλ‘œμ„œ ꢁꢐ과 ν•¨κ»˜ μ™•μ˜ 거처 및 μ œμ‚¬λ₯Ό μ§€λ‚΄λŠ” κ³³μž…λ‹ˆλ‹€. 전톡적인 μ˜λ‘€, 역사 및 건좕 철학을 느끼고 μ²΄ν—˜ν•  수 μžˆλŠ” κ³³μž…λ‹ˆλ‹€.
60
+
61
+ ν•œμ˜₯λ§ˆμ„ (ν•œμ˜₯λ§ˆμ„)
62
+ ν•œμ˜₯λ§ˆμ„μ€ μ„œμšΈ 쀑심뢀에 μœ„μΉ˜ν•œ 유λͺ…ν•œ κ΄€κ΄‘μ§€λ‘œ, ν•œκ΅­ 전톡 λ¬Έν™” μ²΄ν—˜μ„ μ›ν•˜λŠ” μ‚¬λžŒκ³Ό μ™Έκ΅­μΈμ—κ²Œλ„ 인기가 λ§ŽμŠ΅λ‹ˆλ‹€. ν•œμ˜₯ 건물과 전톡 정원을 κ²½ν—˜ν•  수 있으며, λ„μ‹œ μ†μ˜ 전톡 λ¬Έν™”λ₯Ό κ²½ν—˜ν•  수 μžˆλŠ” 기회λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
63
+
64
+ 인사동 (인사동)
65
+ 인사동은 ν•œκ΅­μ˜ 전톡적인 문화와 예술, μŒμ‹ 및 쇼핑을 μ²΄ν—˜ν•  수 μžˆλŠ” κ³³μž…λ‹ˆλ‹€. ν•œκ΅­μ˜ 전톡문화λ₯Ό μ²΄ν—˜ν•˜κ³ , 전톡 λ¬Έν™”μ˜ 아름닀움을 λŠλ‚„ 수 μžˆλŠ” μž₯μ†Œμž…λ‹ˆλ‹€.
66
+
67
+ μœ„μ˜ 관광지λ₯Ό λ°©λ¬Έν•¨μœΌλ‘œμ¨, μš°λ¦¬λŠ” ν•œκ΅­μ˜ 전톡적인 문화와 역사λ₯Ό κ²½ν—˜ν•˜κ³  배울 수 μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ, 아름닀움과 건좕 철학에 λŒ€ν•œ 이해도λ₯Ό 높일 수 있으며, 우리 μ§€μ—­μ˜ λ¬Έν™”, 전톡, 역사λ₯Ό λ”μš± μ΄ν•΄ν•˜κ³  μ‚¬λž‘ν•˜κ²Œ 될 수 μžˆμŠ΅λ‹ˆλ‹€.
68
+ ```
69
+
70
+ λ©€ν‹°ν„΄ λŒ€ν™” μ˜ˆμ‹œ
71
+ ```
72
+ 당신은 AI μ±—λ΄‡μž…λ‹ˆλ‹€. μ‚¬μš©μžμ—κ²Œ 도움이 되고 μœ μ΅ν•œ λ‚΄μš©μ„ μ œκ³΅ν•΄μ•Όν•©λ‹ˆλ‹€. 닡변은 κΈΈκ³  μžμ„Έν•˜λ©° μΉœμ ˆν•œ μ„€λͺ…을 λ§λΆ™μ—¬μ„œ μž‘μ„±ν•˜μ„Έμš”.
73
+
74
+ ### μ‚¬μš©μž:
75
+ 저녁 메뉴 μΆ”μ²œν•΄μ£Όμ„Έμš”
76
+
77
+ ### 챗봇:
78
+ ν•œμ‹μ„ μ„ ν˜Έν•˜μ„Έμš”?
79
+
80
+ ### μ‚¬μš©μž:
81
+ λ„€λ„€
82
+
83
+ ### 챗봇:
84
+ ν•œμ‹ μ€‘μ—μ„œλŠ” 찌게λ₯˜λ₯Ό μΆ”μ²œλ“œλ¦¬κ² μ–΄μš”. 된μž₯찌개, κΉ€μΉ˜μ°Œκ°œ, λΆ€λŒ€μ°Œκ°œμ™€ 같은 전톡적인 찌게 메뉴λ₯Ό μ„ νƒν•΄λ³΄μ„Έμš”. 더 쒋은 선택을 μœ„ν•΄ λ‹€μ–‘ν•œ μ’…λ₯˜μ˜ 찌게λ₯Ό μ‹œλ„ν•΄λ³΄μ„Έμš”. λ§Œμ•½μ— λ‹€λ₯Έ μŒμ‹μ„ λ¨Ήκ³  μ‹Άλ‹€λ©΄ 그것도 μ’‹μ•„μš”!
85
+ ```