zlsl commited on
Commit
0cd3c65
1 Parent(s): 047a4a4

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +65 -1
README.md CHANGED
@@ -1,3 +1,67 @@
1
  ---
2
- license: cc-by-nd-4.0
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ license: cc-by-nc-sa-4.0
3
+ language:
4
+ - ru
5
+ library_name: transformers
6
+ tags:
7
+ - chat
8
+ - porn
9
+ - sex
10
+ - erotic
11
+ - roleplay
12
+ widget:
13
+ - text: "(улыбаюсь)Давай"
14
+ - text: "Ух ты "
15
+ - text: "Ложись"
16
+ pipeline_tag: text-generation
17
  ---
18
+
19
+ Small модель для эротического ролеплея.
20
+
21
+ К удивлению, работает приемлемо, чуть хуже medium модели, со своим "шармом", параметры для старта:
22
+
23
+ do_sample: true<br>
24
+ top_p: 0.9<br>
25
+ top_k: 20<br>
26
+ temperature: 0.7 # При высоких значениях также работает неплохо<br>
27
+ repetition_penalty: 1.15<br>
28
+ encoder_repetition_penalty: 1.0-1.15<br>
29
+ typical_p: 1.0<br>
30
+
31
+
32
+ Для чата желательно останавливать после '\n', также ставьте более 5 попыток генерации и ожидаемое количество новых токенов > 350, тогда диалоги будут интереснее.
33
+
34
+ Очень желательно в контексте и во время диалога указывать действия и мысли в скобках. Например: Привет (вхожу в комнату, закрываю дверь)
35
+
36
+ Важно! В модели добавлен токен `<char>`, он указывает начало строки диалога, прямой речи:
37
+
38
+
39
+ >Абзац ... контекста<br>
40
+ >Я: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
41
+ >Собеседник: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
42
+
43
+ Также хорошие результаты в другом формате диалогов:
44
+ >Абзац ... контекста<br>
45
+ >Я: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
46
+ >Еще действия, описание окружения.<br>
47
+ >Собеседник: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
48
+ >Еще действия, описание окружения.<br>
49
+
50
+ Новый токен желательно использовать, но не обязательно. Также указывать имена персонажей - опционально.
51
+
52
+ Модель с удовольствием может "в мультичар", количество собеседников может быть более двух.
53
+
54
+
55
+
56
+ ## Для пользователей text-generation-webui
57
+ В инструменте поломана работа с GPT-2, GPTJ, GPT-NEO и аналогичными модлями, неверно загружается токенизер.
58
+ Ошибка такая:<br>
59
+ >eos_token_id = eos_token_id[0]
60
+ >IndexError: list index out of range
61
+
62
+ Исправляется легко, в файл modules/models.py в функцию load_tokenizer() надо добавить строчку<br>
63
+ <code>tokenizer.eos_token_id = 2</code><br>
64
+ перед<br>
65
+ <code>return tokenizer</code>
66
+
67
+