Informalone commited on
Commit
7635570
1 Parent(s): f83b769

Upload tokenizer

Browse files
Files changed (4) hide show
  1. special_tokens_map.json +7 -0
  2. tokenizer.json +1274 -0
  3. tokenizer_config.json +15 -0
  4. vocab.txt +1124 -0
special_tokens_map.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": "[CLS]",
3
+ "mask_token": "[MASK]",
4
+ "pad_token": "[PAD]",
5
+ "sep_token": "[SEP]",
6
+ "unk_token": "[UNK]"
7
+ }
tokenizer.json ADDED
@@ -0,0 +1,1274 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "version": "1.0",
3
+ "truncation": null,
4
+ "padding": null,
5
+ "added_tokens": [
6
+ {
7
+ "id": 0,
8
+ "content": "[PAD]",
9
+ "single_word": false,
10
+ "lstrip": false,
11
+ "rstrip": false,
12
+ "normalized": false,
13
+ "special": true
14
+ },
15
+ {
16
+ "id": 1,
17
+ "content": "[UNK]",
18
+ "single_word": false,
19
+ "lstrip": false,
20
+ "rstrip": false,
21
+ "normalized": false,
22
+ "special": true
23
+ },
24
+ {
25
+ "id": 2,
26
+ "content": "[CLS]",
27
+ "single_word": false,
28
+ "lstrip": false,
29
+ "rstrip": false,
30
+ "normalized": false,
31
+ "special": true
32
+ },
33
+ {
34
+ "id": 3,
35
+ "content": "[SEP]",
36
+ "single_word": false,
37
+ "lstrip": false,
38
+ "rstrip": false,
39
+ "normalized": false,
40
+ "special": true
41
+ },
42
+ {
43
+ "id": 4,
44
+ "content": "[MASK]",
45
+ "single_word": false,
46
+ "lstrip": false,
47
+ "rstrip": false,
48
+ "normalized": false,
49
+ "special": true
50
+ }
51
+ ],
52
+ "normalizer": {
53
+ "type": "BertNormalizer",
54
+ "clean_text": true,
55
+ "handle_chinese_chars": true,
56
+ "strip_accents": null,
57
+ "lowercase": true
58
+ },
59
+ "pre_tokenizer": {
60
+ "type": "BertPreTokenizer"
61
+ },
62
+ "post_processor": {
63
+ "type": "TemplateProcessing",
64
+ "single": [
65
+ {
66
+ "SpecialToken": {
67
+ "id": "[CLS]",
68
+ "type_id": 0
69
+ }
70
+ },
71
+ {
72
+ "Sequence": {
73
+ "id": "A",
74
+ "type_id": 0
75
+ }
76
+ },
77
+ {
78
+ "SpecialToken": {
79
+ "id": "[SEP]",
80
+ "type_id": 0
81
+ }
82
+ }
83
+ ],
84
+ "pair": [
85
+ {
86
+ "SpecialToken": {
87
+ "id": "[CLS]",
88
+ "type_id": 0
89
+ }
90
+ },
91
+ {
92
+ "Sequence": {
93
+ "id": "A",
94
+ "type_id": 0
95
+ }
96
+ },
97
+ {
98
+ "SpecialToken": {
99
+ "id": "[SEP]",
100
+ "type_id": 0
101
+ }
102
+ },
103
+ {
104
+ "Sequence": {
105
+ "id": "B",
106
+ "type_id": 1
107
+ }
108
+ },
109
+ {
110
+ "SpecialToken": {
111
+ "id": "[SEP]",
112
+ "type_id": 1
113
+ }
114
+ }
115
+ ],
116
+ "special_tokens": {
117
+ "[CLS]": {
118
+ "id": "[CLS]",
119
+ "ids": [
120
+ 2
121
+ ],
122
+ "tokens": [
123
+ "[CLS]"
124
+ ]
125
+ },
126
+ "[SEP]": {
127
+ "id": "[SEP]",
128
+ "ids": [
129
+ 3
130
+ ],
131
+ "tokens": [
132
+ "[SEP]"
133
+ ]
134
+ }
135
+ }
136
+ },
137
+ "decoder": {
138
+ "type": "WordPiece",
139
+ "prefix": "##",
140
+ "cleanup": true
141
+ },
142
+ "model": {
143
+ "type": "WordPiece",
144
+ "unk_token": "[UNK]",
145
+ "continuing_subword_prefix": "##",
146
+ "max_input_chars_per_word": 100,
147
+ "vocab": {
148
+ "[PAD]": 0,
149
+ "[UNK]": 1,
150
+ "[CLS]": 2,
151
+ "[SEP]": 3,
152
+ "[MASK]": 4,
153
+ "!": 5,
154
+ "\"": 6,
155
+ "#": 7,
156
+ "$": 8,
157
+ "%": 9,
158
+ "&": 10,
159
+ "'": 11,
160
+ "(": 12,
161
+ ")": 13,
162
+ "*": 14,
163
+ "+": 15,
164
+ ",": 16,
165
+ "-": 17,
166
+ ".": 18,
167
+ "/": 19,
168
+ "0": 20,
169
+ "1": 21,
170
+ "2": 22,
171
+ "3": 23,
172
+ "4": 24,
173
+ "5": 25,
174
+ "6": 26,
175
+ "7": 27,
176
+ "8": 28,
177
+ "9": 29,
178
+ ":": 30,
179
+ ";": 31,
180
+ "<": 32,
181
+ "=": 33,
182
+ ">": 34,
183
+ "?": 35,
184
+ "@": 36,
185
+ "[": 37,
186
+ "\\": 38,
187
+ "]": 39,
188
+ "^": 40,
189
+ "_": 41,
190
+ "`": 42,
191
+ "a": 43,
192
+ "b": 44,
193
+ "c": 45,
194
+ "d": 46,
195
+ "e": 47,
196
+ "f": 48,
197
+ "g": 49,
198
+ "h": 50,
199
+ "i": 51,
200
+ "j": 52,
201
+ "k": 53,
202
+ "l": 54,
203
+ "m": 55,
204
+ "n": 56,
205
+ "o": 57,
206
+ "p": 58,
207
+ "q": 59,
208
+ "r": 60,
209
+ "s": 61,
210
+ "t": 62,
211
+ "u": 63,
212
+ "v": 64,
213
+ "w": 65,
214
+ "x": 66,
215
+ "y": 67,
216
+ "z": 68,
217
+ "|": 69,
218
+ "}": 70,
219
+ "~": 71,
220
+ "¡": 72,
221
+ "¢": 73,
222
+ "£": 74,
223
+ "¥": 75,
224
+ "§": 76,
225
+ "°": 77,
226
+ "±": 78,
227
+ "²": 79,
228
+ "³": 80,
229
+ "´": 81,
230
+ "µ": 82,
231
+ "·": 83,
232
+ "º": 84,
233
+ "½": 85,
234
+ "¿": 86,
235
+ "×": 87,
236
+ "ß": 88,
237
+ "æ": 89,
238
+ "ð": 90,
239
+ "ø": 91,
240
+ "þ": 92,
241
+ "đ": 93,
242
+ "ħ": 94,
243
+ "ı": 95,
244
+ "ł": 96,
245
+ "œ": 97,
246
+ "ɐ": 98,
247
+ "ɑ": 99,
248
+ "ɒ": 100,
249
+ "ɔ": 101,
250
+ "ə": 102,
251
+ "ɛ": 103,
252
+ "ɜ": 104,
253
+ "ɡ": 105,
254
+ "ɢ": 106,
255
+ "ɪ": 107,
256
+ "ɫ": 108,
257
+ "ɳ": 109,
258
+ "ɽ": 110,
259
+ "ɾ": 111,
260
+ "ʁ": 112,
261
+ "ʃ": 113,
262
+ "ʊ": 114,
263
+ "ʋ": 115,
264
+ "ʒ": 116,
265
+ "ʔ": 117,
266
+ "ʕ": 118,
267
+ "ʲ": 119,
268
+ "ʻ": 120,
269
+ "ʼ": 121,
270
+ "ʾ": 122,
271
+ "ʿ": 123,
272
+ "ˈ": 124,
273
+ "ˌ": 125,
274
+ "ː": 126,
275
+ "α": 127,
276
+ "β": 128,
277
+ "γ": 129,
278
+ "δ": 130,
279
+ "ε": 131,
280
+ "η": 132,
281
+ "θ": 133,
282
+ "ι": 134,
283
+ "κ": 135,
284
+ "λ": 136,
285
+ "μ": 137,
286
+ "��": 138,
287
+ "ξ": 139,
288
+ "ο": 140,
289
+ "π": 141,
290
+ "ρ": 142,
291
+ "ς": 143,
292
+ "σ": 144,
293
+ "τ": 145,
294
+ "υ": 146,
295
+ "φ": 147,
296
+ "χ": 148,
297
+ "ψ": 149,
298
+ "ω": 150,
299
+ "а": 151,
300
+ "б": 152,
301
+ "в": 153,
302
+ "г": 154,
303
+ "д": 155,
304
+ "е": 156,
305
+ "ж": 157,
306
+ "з": 158,
307
+ "и": 159,
308
+ "к": 160,
309
+ "л": 161,
310
+ "м": 162,
311
+ "н": 163,
312
+ "о": 164,
313
+ "п": 165,
314
+ "р": 166,
315
+ "с": 167,
316
+ "т": 168,
317
+ "у": 169,
318
+ "х": 170,
319
+ "ц": 171,
320
+ "ш": 172,
321
+ "ъ": 173,
322
+ "ы": 174,
323
+ "ь": 175,
324
+ "ю": 176,
325
+ "я": 177,
326
+ "є": 178,
327
+ "א": 179,
328
+ "ב": 180,
329
+ "ג": 181,
330
+ "ה": 182,
331
+ "ו": 183,
332
+ "ז": 184,
333
+ "ח": 185,
334
+ "י": 186,
335
+ "ל": 187,
336
+ "ם": 188,
337
+ "מ": 189,
338
+ "ן": 190,
339
+ "נ": 191,
340
+ "ס": 192,
341
+ "ף": 193,
342
+ "פ": 194,
343
+ "צ": 195,
344
+ "ר": 196,
345
+ "ש": 197,
346
+ "ת": 198,
347
+ "ء": 199,
348
+ "ا": 200,
349
+ "ب": 201,
350
+ "ة": 202,
351
+ "ت": 203,
352
+ "ث": 204,
353
+ "ج": 205,
354
+ "ح": 206,
355
+ "خ": 207,
356
+ "د": 208,
357
+ "ذ": 209,
358
+ "ر": 210,
359
+ "س": 211,
360
+ "ش": 212,
361
+ "ص": 213,
362
+ "ع": 214,
363
+ "ف": 215,
364
+ "ق": 216,
365
+ "ك": 217,
366
+ "ل": 218,
367
+ "م": 219,
368
+ "ن": 220,
369
+ "ه": 221,
370
+ "و": 222,
371
+ "ي": 223,
372
+ "ܐ": 224,
373
+ "ܕ": 225,
374
+ "ܗ": 226,
375
+ "ܝ": 227,
376
+ "ܠ": 228,
377
+ "ܢ": 229,
378
+ "ܬ": 230,
379
+ "अ": 231,
380
+ "ई": 232,
381
+ "क": 233,
382
+ "ग": 234,
383
+ "ण": 235,
384
+ "त": 236,
385
+ "द": 237,
386
+ "न": 238,
387
+ "प": 239,
388
+ "ब": 240,
389
+ "म": 241,
390
+ "य": 242,
391
+ "र": 243,
392
+ "ल": 244,
393
+ "व": 245,
394
+ "स": 246,
395
+ "ह": 247,
396
+ "ा": 248,
397
+ "ि": 249,
398
+ "আ": 250,
399
+ "ল": 251,
400
+ "হ": 252,
401
+ "া": 253,
402
+ "ਅ": 254,
403
+ "ਲ": 255,
404
+ "ਹ": 256,
405
+ "ਾ": 257,
406
+ "അ": 258,
407
+ "ള": 259,
408
+ "ഹ": 260,
409
+ "ാ": 261,
410
+ "ก": 262,
411
+ "ค": 263,
412
+ "ง": 264,
413
+ "ช": 265,
414
+ "ซ": 266,
415
+ "ญ": 267,
416
+ "ฐ": 268,
417
+ "ณ": 269,
418
+ "ด": 270,
419
+ "ต": 271,
420
+ "น": 272,
421
+ "บ": 273,
422
+ "ป": 274,
423
+ "พ": 275,
424
+ "ภ": 276,
425
+ "ม": 277,
426
+ "ย": 278,
427
+ "ร": 279,
428
+ "ล": 280,
429
+ "ว": 281,
430
+ "ศ": 282,
431
+ "ษ": 283,
432
+ "ส": 284,
433
+ "ห": 285,
434
+ "อ": 286,
435
+ "ฮ": 287,
436
+ "ะ": 288,
437
+ "า": 289,
438
+ "เ": 290,
439
+ "แ": 291,
440
+ "ไ": 292,
441
+ "ა": 293,
442
+ "ბ": 294,
443
+ "გ": 295,
444
+ "დ": 296,
445
+ "ე": 297,
446
+ "ვ": 298,
447
+ "ზ": 299,
448
+ "თ": 300,
449
+ "ი": 301,
450
+ "კ": 302,
451
+ "ლ": 303,
452
+ "მ": 304,
453
+ "ნ": 305,
454
+ "ო": 306,
455
+ "პ": 307,
456
+ "ჟ": 308,
457
+ "რ": 309,
458
+ "ს": 310,
459
+ "ტ": 311,
460
+ "უ": 312,
461
+ "ფ": 313,
462
+ "ქ": 314,
463
+ "ღ": 315,
464
+ "ყ": 316,
465
+ "შ": 317,
466
+ "ჩ": 318,
467
+ "ც": 319,
468
+ "ძ": 320,
469
+ "წ": 321,
470
+ "ჭ": 322,
471
+ "ხ": 323,
472
+ "ჯ": 324,
473
+ "ჰ": 325,
474
+ "ჱ": 326,
475
+ "ჲ": 327,
476
+ "ჳ": 328,
477
+ "ჴ": 329,
478
+ "ჵ": 330,
479
+ "ჶ": 331,
480
+ "ჷ": 332,
481
+ "ჸ": 333,
482
+ "ჹ": 334,
483
+ "ჺ": 335,
484
+ "჻": 336,
485
+ "ᄃ": 337,
486
+ "ᄅ": 338,
487
+ "ᄇ": 339,
488
+ "ᄋ": 340,
489
+ "ᄌ": 341,
490
+ "ᅡ": 342,
491
+ "ᅢ": 343,
492
+ "ᅦ": 344,
493
+ "ᅧ": 345,
494
+ "ᅩ": 346,
495
+ "ᅮ": 347,
496
+ "ᅵ": 348,
497
+ "ᆨ": 349,
498
+ "ᆫ": 350,
499
+ "ᆯ": 351,
500
+ "ᆸ": 352,
501
+ "ᆼ": 353,
502
+ "ᵻ": 354,
503
+ "‐": 355,
504
+ "‑": 356,
505
+ "–": 357,
506
+ "—": 358,
507
+ "―": 359,
508
+ "‘": 360,
509
+ "’": 361,
510
+ "“": 362,
511
+ "”": 363,
512
+ "„": 364,
513
+ "†": 365,
514
+ "‡": 366,
515
+ "•": 367,
516
+ "…": 368,
517
+ "′": 369,
518
+ "″": 370,
519
+ "⁄": 371,
520
+ "₣": 372,
521
+ "₤": 373,
522
+ "€": 374,
523
+ "₹": 375,
524
+ "⅓": 376,
525
+ "⅔": 377,
526
+ "→": 378,
527
+ "−": 379,
528
+ "≡": 380,
529
+ "≤": 381,
530
+ "①": 382,
531
+ "☉": 383,
532
+ "☫": 384,
533
+ "♀": 385,
534
+ "♭": 386,
535
+ "♯": 387,
536
+ "⚳": 388,
537
+ "ⴀ": 389,
538
+ "ⴂ": 390,
539
+ "ⴃ": 391,
540
+ "ⴈ": 392,
541
+ "ⴌ": 393,
542
+ "ⴕ": 394,
543
+ "ⴟ": 395,
544
+ "〈": 396,
545
+ "〉": 397,
546
+ "〜": 398,
547
+ "あ": 399,
548
+ "い": 400,
549
+ "う": 401,
550
+ "お": 402,
551
+ "か": 403,
552
+ "き": 404,
553
+ "く": 405,
554
+ "け": 406,
555
+ "こ": 407,
556
+ "さ": 408,
557
+ "し": 409,
558
+ "す": 410,
559
+ "せ": 411,
560
+ "た": 412,
561
+ "ち": 413,
562
+ "っ": 414,
563
+ "つ": 415,
564
+ "と": 416,
565
+ "な": 417,
566
+ "に": 418,
567
+ "の": 419,
568
+ "は": 420,
569
+ "ひ": 421,
570
+ "ふ": 422,
571
+ "ほ": 423,
572
+ "ま": 424,
573
+ "み": 425,
574
+ "め": 426,
575
+ "も": 427,
576
+ "ゃ": 428,
577
+ "ゆ": 429,
578
+ "ょ": 430,
579
+ "ら": 431,
580
+ "り": 432,
581
+ "る": 433,
582
+ "れ": 434,
583
+ "わ": 435,
584
+ "を": 436,
585
+ "ん": 437,
586
+ "ァ": 438,
587
+ "ア": 439,
588
+ "ィ": 440,
589
+ "イ": 441,
590
+ "ゥ": 442,
591
+ "ウ": 443,
592
+ "ェ": 444,
593
+ "エ": 445,
594
+ "ォ": 446,
595
+ "オ": 447,
596
+ "カ": 448,
597
+ "キ": 449,
598
+ "ク": 450,
599
+ "ケ": 451,
600
+ "コ": 452,
601
+ "サ": 453,
602
+ "シ": 454,
603
+ "ス": 455,
604
+ "セ": 456,
605
+ "タ": 457,
606
+ "チ": 458,
607
+ "ッ": 459,
608
+ "ツ": 460,
609
+ "テ": 461,
610
+ "ト": 462,
611
+ "ナ": 463,
612
+ "ニ": 464,
613
+ "ネ": 465,
614
+ "ノ": 466,
615
+ "ハ": 467,
616
+ "フ": 468,
617
+ "ヘ": 469,
618
+ "マ": 470,
619
+ "ミ": 471,
620
+ "ム": 472,
621
+ "モ": 473,
622
+ "ャ": 474,
623
+ "ュ": 475,
624
+ "ョ": 476,
625
+ "ラ": 477,
626
+ "リ": 478,
627
+ "ル": 479,
628
+ "レ": 480,
629
+ "ロ": 481,
630
+ "ン": 482,
631
+ "・": 483,
632
+ "ー": 484,
633
+ "一": 485,
634
+ "七": 486,
635
+ "下": 487,
636
+ "世": 488,
637
+ "丙": 489,
638
+ "中": 490,
639
+ "主": 491,
640
+ "乃": 492,
641
+ "之": 493,
642
+ "乙": 494,
643
+ "九": 495,
644
+ "二": 496,
645
+ "云": 497,
646
+ "人": 498,
647
+ "今": 499,
648
+ "付": 500,
649
+ "作": 501,
650
+ "侗": 502,
651
+ "依": 503,
652
+ "信": 504,
653
+ "傳": 505,
654
+ "儚": 506,
655
+ "充": 507,
656
+ "光": 508,
657
+ "全": 509,
658
+ "兵": 510,
659
+ "其": 511,
660
+ "具": 512,
661
+ "円": 513,
662
+ "再": 514,
663
+ "出": 515,
664
+ "判": 516,
665
+ "前": 517,
666
+ "剛": 518,
667
+ "劇": 519,
668
+ "劉": 520,
669
+ "動": 521,
670
+ "化": 522,
671
+ "北": 523,
672
+ "华": 524,
673
+ "厂": 525,
674
+ "去": 526,
675
+ "古": 527,
676
+ "可": 528,
677
+ "台": 529,
678
+ "史": 530,
679
+ "同": 531,
680
+ "名": 532,
681
+ "君": 533,
682
+ "吳": 534,
683
+ "周": 535,
684
+ "命": 536,
685
+ "和": 537,
686
+ "咲": 538,
687
+ "善": 539,
688
+ "四": 540,
689
+ "國": 541,
690
+ "園": 542,
691
+ "圣": 543,
692
+ "在": 544,
693
+ "坂": 545,
694
+ "堤": 546,
695
+ "場": 547,
696
+ "塘": 548,
697
+ "夕": 549,
698
+ "大": 550,
699
+ "天": 551,
700
+ "夫": 552,
701
+ "女": 553,
702
+ "妙": 554,
703
+ "姚": 555,
704
+ "子": 556,
705
+ "孟": 557,
706
+ "守": 558,
707
+ "安": 559,
708
+ "宋": 560,
709
+ "完": 561,
710
+ "宗": 562,
711
+ "宝": 563,
712
+ "宫": 564,
713
+ "寝": 565,
714
+ "寺": 566,
715
+ "小": 567,
716
+ "少": 568,
717
+ "尾": 569,
718
+ "山": 570,
719
+ "岳": 571,
720
+ "川": 572,
721
+ "州": 573,
722
+ "巳": 574,
723
+ "市": 575,
724
+ "師": 576,
725
+ "平": 577,
726
+ "广": 578,
727
+ "庆": 579,
728
+ "府": 580,
729
+ "座": 581,
730
+ "廬": 582,
731
+ "建": 583,
732
+ "式": 584,
733
+ "張": 585,
734
+ "彌": 586,
735
+ "彩": 587,
736
+ "彼": 588,
737
+ "後": 589,
738
+ "御": 590,
739
+ "德": 591,
740
+ "思": 592,
741
+ "愛": 593,
742
+ "憑": 594,
743
+ "憶": 595,
744
+ "應": 596,
745
+ "懷": 597,
746
+ "战": 598,
747
+ "戦": 599,
748
+ "扈": 600,
749
+ "技": 601,
750
+ "拉": 602,
751
+ "拳": 603,
752
+ "挑": 604,
753
+ "揺": 605,
754
+ "攻": 606,
755
+ "放": 607,
756
+ "政": 608,
757
+ "散": 609,
758
+ "斯": 610,
759
+ "方": 611,
760
+ "日": 612,
761
+ "旦": 613,
762
+ "旭": 614,
763
+ "昌": 615,
764
+ "明": 616,
765
+ "星": 617,
766
+ "春": 618,
767
+ "晋": 619,
768
+ "景": 620,
769
+ "曦": 621,
770
+ "月": 622,
771
+ "望": 623,
772
+ "未": 624,
773
+ "本": 625,
774
+ "李": 626,
775
+ "村": 627,
776
+ "杜": 628,
777
+ "束": 629,
778
+ "来": 630,
779
+ "林": 631,
780
+ "桜": 632,
781
+ "梶": 633,
782
+ "棘": 634,
783
+ "椎": 635,
784
+ "楊": 636,
785
+ "楚": 637,
786
+ "榮": 638,
787
+ "橘": 639,
788
+ "機": 640,
789
+ "正": 641,
790
+ "殻": 642,
791
+ "殿": 643,
792
+ "母": 644,
793
+ "水": 645,
794
+ "汉": 646,
795
+ "沂": 647,
796
+ "沙": 648,
797
+ "河": 649,
798
+ "泗": 650,
799
+ "波": 651,
800
+ "泣": 652,
801
+ "洪": 653,
802
+ "淹": 654,
803
+ "清": 655,
804
+ "湯": 656,
805
+ "漢": 657,
806
+ "澄": 658,
807
+ "澤": 659,
808
+ "火": 660,
809
+ "灯": 661,
810
+ "灵": 662,
811
+ "灼": 663,
812
+ "焼": 664,
813
+ "熱": 665,
814
+ "物": 666,
815
+ "狐": 667,
816
+ "狸": 668,
817
+ "玄": 669,
818
+ "王": 670,
819
+ "玩": 671,
820
+ "珂": 672,
821
+ "珙": 673,
822
+ "球": 674,
823
+ "理": 675,
824
+ "琦": 676,
825
+ "琪": 677,
826
+ "瓊": 678,
827
+ "生": 679,
828
+ "田": 680,
829
+ "畢": 681,
830
+ "番": 682,
831
+ "瘡": 683,
832
+ "白": 684,
833
+ "皮": 685,
834
+ "真": 686,
835
+ "砲": 687,
836
+ "礮": 688,
837
+ "祈": 689,
838
+ "神": 690,
839
+ "祠": 691,
840
+ "秋": 692,
841
+ "空": 693,
842
+ "立": 694,
843
+ "精": 695,
844
+ "約": 696,
845
+ "絵": 697,
846
+ "織": 698,
847
+ "義": 699,
848
+ "翠": 700,
849
+ "者": 701,
850
+ "耕": 702,
851
+ "肖": 703,
852
+ "胡": 704,
853
+ "膀": 705,
854
+ "臂": 706,
855
+ "興": 707,
856
+ "良": 708,
857
+ "花": 709,
858
+ "芳": 710,
859
+ "芽": 711,
860
+ "若": 712,
861
+ "英": 713,
862
+ "藕": 714,
863
+ "藥": 715,
864
+ "蘄": 716,
865
+ "蘇": 717,
866
+ "行": 718,
867
+ "裁": 719,
868
+ "規": 720,
869
+ "覺": 721,
870
+ "观": 722,
871
+ "解": 723,
872
+ "記": 724,
873
+ "誓": 725,
874
+ "誡": 726,
875
+ "誰": 727,
876
+ "謎": 728,
877
+ "许": 729,
878
+ "谭": 730,
879
+ "豪": 731,
880
+ "豫": 732,
881
+ "費": 733,
882
+ "贵": 734,
883
+ "赤": 735,
884
+ "趙": 736,
885
+ "足": 737,
886
+ "跡": 738,
887
+ "転": 739,
888
+ "辛": 740,
889
+ "逆": 741,
890
+ "遇": 742,
891
+ "運": 743,
892
+ "過": 744,
893
+ "遠": 745,
894
+ "選": 746,
895
+ "邦": 747,
896
+ "邱": 748,
897
+ "部": 749,
898
+ "郭": 750,
899
+ "都": 751,
900
+ "酈": 752,
901
+ "里": 753,
902
+ "野": 754,
903
+ "金": 755,
904
+ "銃": 756,
905
+ "鋼": 757,
906
+ "錄": 758,
907
+ "錡": 759,
908
+ "鍵": 760,
909
+ "鐵": 761,
910
+ "钱": 762,
911
+ "铁": 763,
912
+ "關": 764,
913
+ "防": 765,
914
+ "阿": 766,
915
+ "陈": 767,
916
+ "陳": 768,
917
+ "陽": 769,
918
+ "隊": 770,
919
+ "階": 771,
920
+ "集": 772,
921
+ "雪": 773,
922
+ "雲": 774,
923
+ "霖": 775,
924
+ "霹": 776,
925
+ "靂": 777,
926
+ "韓": 778,
927
+ "願": 779,
928
+ "顯": 780,
929
+ "颜": 781,
930
+ "马": 782,
931
+ "高": 783,
932
+ "龍": 784,
933
+ "ﷲ": 785,
934
+ "ﻋ": 786,
935
+ "/": 787,
936
+ "3": 788,
937
+ "~": 789,
938
+ "##i": 790,
939
+ "##y": 791,
940
+ "##o": 792,
941
+ "##r": 793,
942
+ "##g": 794,
943
+ "##a": 795,
944
+ "##w": 796,
945
+ "##l": 797,
946
+ "##b": 798,
947
+ "##z": 799,
948
+ "##t": 800,
949
+ "##n": 801,
950
+ "##c": 802,
951
+ "##h": 803,
952
+ "##s": 804,
953
+ "##u": 805,
954
+ "##d": 806,
955
+ "##e": 807,
956
+ "##k": 808,
957
+ "##v": 809,
958
+ "##f": 810,
959
+ "##x": 811,
960
+ "##q": 812,
961
+ "##p": 813,
962
+ "##æ": 814,
963
+ "##0": 815,
964
+ "##5": 816,
965
+ "##m": 817,
966
+ "##8": 818,
967
+ "##4": 819,
968
+ "##س": 820,
969
+ "##ت": 821,
970
+ "##ا": 822,
971
+ "##ن": 823,
972
+ "##6": 824,
973
+ "##1": 825,
974
+ "##7": 826,
975
+ "##j": 827,
976
+ "##つ": 828,
977
+ "##う": 829,
978
+ "##2": 830,
979
+ "##9": 831,
980
+ "##3": 832,
981
+ "##ø": 833,
982
+ "##ล": 834,
983
+ "##ว": 835,
984
+ "##ง": 836,
985
+ "##พ": 837,
986
+ "##ไ": 838,
987
+ "##ช": 839,
988
+ "##ย": 840,
989
+ "##า": 841,
990
+ "##ร": 842,
991
+ "##თ": 843,
992
+ "##ა": 844,
993
+ "##ვ": 845,
994
+ "##რ": 846,
995
+ "##ი": 847,
996
+ "##ള": 848,
997
+ "##あ": 849,
998
+ "##ん": 850,
999
+ "##α": 851,
1000
+ "##ν": 852,
1001
+ "##τ": 853,
1002
+ "##ο": 854,
1003
+ "##κ": 855,
1004
+ "##ρ": 856,
1005
+ "##ω": 857,
1006
+ "##ς": 858,
1007
+ "##の": 859,
1008
+ "##な": 860,
1009
+ "##ら": 861,
1010
+ "##ð": 862,
1011
+ "##œ": 863,
1012
+ "##ɛ": 864,
1013
+ "##ł": 865,
1014
+ "##η": 866,
1015
+ "##μ": 867,
1016
+ "##ซ": 868,
1017
+ "##ル": 869,
1018
+ "##シ": 870,
1019
+ "##ア": 871,
1020
+ "##リ": 872,
1021
+ "##ス": 873,
1022
+ "##ʔ": 874,
1023
+ "##ल": 875,
1024
+ "##ᄇ": 876,
1025
+ "##ᅮ": 877,
1026
+ "##ᄃ": 878,
1027
+ "##ᅢ": 879,
1028
+ "##β": 880,
1029
+ "##ß": 881,
1030
+ "##か": 882,
1031
+ "##た": 883,
1032
+ "##ə": 884,
1033
+ "##ʻ": 885,
1034
+ "##ι": 886,
1035
+ "##χ": 887,
1036
+ "##о": 888,
1037
+ "##л": 889,
1038
+ "##с": 890,
1039
+ "##а": 891,
1040
+ "##т": 892,
1041
+ "##ы": 893,
1042
+ "##и": 894,
1043
+ "##в": 895,
1044
+ "##к": 896,
1045
+ "##з": 897,
1046
+ "##ッ": 898,
1047
+ "##ク": 899,
1048
+ "##マ": 900,
1049
+ "##ン": 901,
1050
+ "##გ": 902,
1051
+ "##ლ": 903,
1052
+ "##ო": 904,
1053
+ "##ნ": 905,
1054
+ "##ː": 906,
1055
+ "##ל": 907,
1056
+ "##ה": 908,
1057
+ "##א": 909,
1058
+ "##く": 910,
1059
+ "##み": 911,
1060
+ "##ε": 912,
1061
+ "##ξ": 913,
1062
+ "##ল": 914,
1063
+ "##ˈ": 915,
1064
+ "##ɡ": 916,
1065
+ "##ɑ": 917,
1066
+ "##ɒ": 918,
1067
+ "##し": 919,
1068
+ "##す": 920,
1069
+ "##き": 921,
1070
+ "##ひ": 922,
1071
+ "##と": 923,
1072
+ "##đ": 924,
1073
+ "##ъ": 925,
1074
+ "##н": 926,
1075
+ "##е": 927,
1076
+ "##י": 928,
1077
+ "##פ": 929,
1078
+ "##イ": 930,
1079
+ "##λ": 931,
1080
+ "##ق": 932,
1081
+ "##ع": 933,
1082
+ "##د": 934,
1083
+ "##ᅡ": 935,
1084
+ "##ᆯ": 936,
1085
+ "##ᄅ": 937,
1086
+ "##ɪ": 938,
1087
+ "##ค": 939,
1088
+ "##ต": 940,
1089
+ "##व": 941,
1090
+ "##��": 942,
1091
+ "##द": 943,
1092
+ "##は": 944,
1093
+ "##り": 945,
1094
+ "##レ": 946,
1095
+ "##ー": 947,
1096
+ "##ツ": 948,
1097
+ "##ي": 949,
1098
+ "##ش": 950,
1099
+ "##و": 951,
1100
+ "##م": 952,
1101
+ "##º": 953,
1102
+ "##ਲ": 954,
1103
+ "##ਾ": 955,
1104
+ "##ਹ": 956,
1105
+ "##д": 957,
1106
+ "##р": 958,
1107
+ "##ل": 959,
1108
+ "##ب": 960,
1109
+ "##い": 961,
1110
+ "##ち": 962,
1111
+ "##ゃ": 963,
1112
+ "##ʒ": 964,
1113
+ "##ʃ": 965,
1114
+ "##ɔ": 966,
1115
+ "##ह": 967,
1116
+ "##ニ": 968,
1117
+ "##ウ": 969,
1118
+ "##ァ": 970,
1119
+ "##キ": 971,
1120
+ "##ュ": 972,
1121
+ "##3": 973,
1122
+ "##ხ": 974,
1123
+ "##ს": 975,
1124
+ "##お": 976,
1125
+ "##タ": 977,
1126
+ "##ാ": 978,
1127
+ "##ഹ": 979,
1128
+ "##ɳ": 980,
1129
+ "##ま": 981,
1130
+ "##る": 982,
1131
+ "##ะ": 983,
1132
+ "##อ": 984,
1133
+ "##น": 985,
1134
+ "##ן": 986,
1135
+ "##я": 987,
1136
+ "##แ": 988,
1137
+ "##ก": 989,
1138
+ "##ɾ": 990,
1139
+ "##ʲ": 991,
1140
+ "##フ": 992,
1141
+ "##უ": 993,
1142
+ "##ภ": 994,
1143
+ "##ด": 995,
1144
+ "##ב": 996,
1145
+ "##ת": 997,
1146
+ "##خ": 998,
1147
+ "##ラ": 999,
1148
+ "##れ": 1000,
1149
+ "##ण": 1001,
1150
+ "##स": 1002,
1151
+ "##न": 1003,
1152
+ "##ه": 1004,
1153
+ "##ف": 1005,
1154
+ "##ر": 1006,
1155
+ "##エ": 1007,
1156
+ "##テ": 1008,
1157
+ "##ษ": 1009,
1158
+ "##ฐ": 1010,
1159
+ "##ィ": 1011,
1160
+ "##क": 1012,
1161
+ "##ノ": 1013,
1162
+ "##θ": 1014,
1163
+ "##ネ": 1015,
1164
+ "##ョ": 1016,
1165
+ "##δ": 1017,
1166
+ "##ɽ": 1018,
1167
+ "##ʁ": 1019,
1168
+ "##ტ": 1020,
1169
+ "##ჱ": 1021,
1170
+ "##ェ": 1022,
1171
+ "##ハ": 1023,
1172
+ "##υ": 1024,
1173
+ "##र": 1025,
1174
+ "##х": 1026,
1175
+ "##も": 1027,
1176
+ "##っ": 1028,
1177
+ "##ょ": 1029,
1178
+ "##に": 1030,
1179
+ "##γ": 1031,
1180
+ "##ც": 1032,
1181
+ "##ე": 1033,
1182
+ "##є": 1034,
1183
+ "##м": 1035,
1184
+ "##ܕ": 1036,
1185
+ "##ܝ": 1037,
1186
+ "##ܢ": 1038,
1187
+ "##ܬ": 1039,
1188
+ "##ณ": 1040,
1189
+ "##ม": 1041,
1190
+ "##ฮ": 1042,
1191
+ "##ж": 1043,
1192
+ "##ם": 1044,
1193
+ "##ء": 1045,
1194
+ "##ʊ": 1046,
1195
+ "##ई": 1047,
1196
+ "##め": 1048,
1197
+ "##მ": 1049,
1198
+ "##ム": 1050,
1199
+ "##チ": 1051,
1200
+ "##ᵻ": 1052,
1201
+ "##ˌ": 1053,
1202
+ "##ו": 1054,
1203
+ "##ף": 1055,
1204
+ "##წ": 1056,
1205
+ "##ფ": 1057,
1206
+ "##ャ": 1058,
1207
+ "##モ": 1059,
1208
+ "##ɐ": 1060,
1209
+ "##ᅦ": 1061,
1210
+ "##ᅩ": 1062,
1211
+ "##ᆨ": 1063,
1212
+ "##ᅵ": 1064,
1213
+ "##ᆸ": 1065,
1214
+ "##ᅧ": 1066,
1215
+ "##ᆼ": 1067,
1216
+ "##ᄋ": 1068,
1217
+ "##ᆫ": 1069,
1218
+ "##わ": 1070,
1219
+ "##ı": 1071,
1220
+ "##ქ": 1072,
1221
+ "##დ": 1073,
1222
+ "##ि": 1074,
1223
+ "##ჲ": 1075,
1224
+ "##ר": 1076,
1225
+ "##セ": 1077,
1226
+ "##オ": 1078,
1227
+ "##ゆ": 1079,
1228
+ "##せ": 1080,
1229
+ "##ك": 1081,
1230
+ "##ʿ": 1082,
1231
+ "##ש": 1083,
1232
+ "##מ": 1084,
1233
+ "##צ": 1085,
1234
+ "##п": 1086,
1235
+ "##г": 1087,
1236
+ "##カ": 1088,
1237
+ "##ܠ": 1089,
1238
+ "##ܗ": 1090,
1239
+ "##ܐ": 1091,
1240
+ "##ナ": 1092,
1241
+ "##ミ": 1093,
1242
+ "##こ": 1094,
1243
+ "##を": 1095,
1244
+ "##ψ": 1096,
1245
+ "##サ": 1097,
1246
+ "##ォ": 1098,
1247
+ "##π": 1099,
1248
+ "##ト": 1100,
1249
+ "##у": 1101,
1250
+ "##ح": 1102,
1251
+ "##σ": 1103,
1252
+ "##เ": 1104,
1253
+ "##ป": 1105,
1254
+ "##ш": 1106,
1255
+ "##ゥ": 1107,
1256
+ "##ロ": 1108,
1257
+ "##া": 1109,
1258
+ "##হ": 1110,
1259
+ "##ɜ": 1111,
1260
+ "##ة": 1112,
1261
+ "##ص": 1113,
1262
+ "##ס": 1114,
1263
+ "##ث": 1115,
1264
+ "##ჳ": 1116,
1265
+ "##נ": 1117,
1266
+ "##ذ": 1118,
1267
+ "##ग": 1119,
1268
+ "##ɫ": 1120,
1269
+ "##ц": 1121,
1270
+ "##ь": 1122,
1271
+ "##ю": 1123
1272
+ }
1273
+ }
1274
+ }
tokenizer_config.json ADDED
@@ -0,0 +1,15 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "clean_up_tokenization_spaces": true,
3
+ "cls_token": "[CLS]",
4
+ "do_basic_tokenize": true,
5
+ "do_lower_case": true,
6
+ "mask_token": "[MASK]",
7
+ "model_max_length": 512,
8
+ "never_split": null,
9
+ "pad_token": "[PAD]",
10
+ "sep_token": "[SEP]",
11
+ "strip_accents": null,
12
+ "tokenize_chinese_chars": true,
13
+ "tokenizer_class": "BertTokenizer",
14
+ "unk_token": "[UNK]"
15
+ }
vocab.txt ADDED
@@ -0,0 +1,1124 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [PAD]
2
+ [UNK]
3
+ [CLS]
4
+ [SEP]
5
+ [MASK]
6
+ !
7
+ "
8
+ #
9
+ $
10
+ %
11
+ &
12
+ '
13
+ (
14
+ )
15
+ *
16
+ +
17
+ ,
18
+ -
19
+ .
20
+ /
21
+ 0
22
+ 1
23
+ 2
24
+ 3
25
+ 4
26
+ 5
27
+ 6
28
+ 7
29
+ 8
30
+ 9
31
+ :
32
+ ;
33
+ <
34
+ =
35
+ >
36
+ ?
37
+ @
38
+ [
39
+ \
40
+ ]
41
+ ^
42
+ _
43
+ `
44
+ a
45
+ b
46
+ c
47
+ d
48
+ e
49
+ f
50
+ g
51
+ h
52
+ i
53
+ j
54
+ k
55
+ l
56
+ m
57
+ n
58
+ o
59
+ p
60
+ q
61
+ r
62
+ s
63
+ t
64
+ u
65
+ v
66
+ w
67
+ x
68
+ y
69
+ z
70
+ |
71
+ }
72
+ ~
73
+ ¡
74
+ ¢
75
+ £
76
+ ¥
77
+ §
78
+ °
79
+ ±
80
+ ²
81
+ ³
82
+ ´
83
+ µ
84
+ ·
85
+ º
86
+ ½
87
+ ¿
88
+ ×
89
+ ß
90
+ æ
91
+ ð
92
+ ø
93
+ þ
94
+ đ
95
+ ħ
96
+ ı
97
+ ł
98
+ œ
99
+ ɐ
100
+ ɑ
101
+ ɒ
102
+ ɔ
103
+ ə
104
+ ɛ
105
+ ɜ
106
+ ɡ
107
+ ɢ
108
+ ɪ
109
+ ɫ
110
+ ɳ
111
+ ɽ
112
+ ɾ
113
+ ʁ
114
+ ʃ
115
+ ʊ
116
+ ʋ
117
+ ʒ
118
+ ʔ
119
+ ʕ
120
+ ʲ
121
+ ʻ
122
+ ʼ
123
+ ʾ
124
+ ʿ
125
+ ˈ
126
+ ˌ
127
+ ː
128
+ α
129
+ β
130
+ γ
131
+ δ
132
+ ε
133
+ η
134
+ θ
135
+ ι
136
+ κ
137
+ λ
138
+ μ
139
+ ν
140
+ ξ
141
+ ο
142
+ π
143
+ ρ
144
+ ς
145
+ σ
146
+ τ
147
+ υ
148
+ φ
149
+ χ
150
+ ψ
151
+ ω
152
+ а
153
+ б
154
+ в
155
+ г
156
+ д
157
+ е
158
+ ж
159
+ з
160
+ и
161
+ к
162
+ л
163
+ м
164
+ н
165
+ о
166
+ п
167
+ р
168
+ с
169
+ т
170
+ у
171
+ х
172
+ ц
173
+ ш
174
+ ъ
175
+ ы
176
+ ь
177
+ ю
178
+ я
179
+ є
180
+ א
181
+ ב
182
+ ג
183
+ ה
184
+ ו
185
+ ז
186
+ ח
187
+ י
188
+ ל
189
+ ם
190
+ מ
191
+ ן
192
+ נ
193
+ ס
194
+ ף
195
+ פ
196
+ צ
197
+ ר
198
+ ש
199
+ ת
200
+ ء
201
+ ا
202
+ ب
203
+ ة
204
+ ت
205
+ ث
206
+ ج
207
+ ح
208
+ خ
209
+ د
210
+ ذ
211
+ ر
212
+ س
213
+ ش
214
+ ص
215
+ ع
216
+ ف
217
+ ق
218
+ ك
219
+ ل
220
+ م
221
+ ن
222
+ ه
223
+ و
224
+ ي
225
+ ܐ
226
+ ܕ
227
+ ܗ
228
+ ܝ
229
+ ܠ
230
+ ܢ
231
+ ܬ
232
+
233
+
234
+
235
+
236
+
237
+
238
+
239
+
240
+
241
+
242
+
243
+
244
+
245
+
246
+
247
+
248
+
249
+
250
+ ि
251
+
252
+
253
+
254
+
255
+
256
+
257
+
258
+
259
+
260
+
261
+
262
+
263
+
264
+
265
+
266
+
267
+
268
+
269
+
270
+
271
+
272
+
273
+
274
+
275
+
276
+
277
+
278
+
279
+
280
+
281
+
282
+
283
+
284
+
285
+
286
+
287
+
288
+
289
+
290
+
291
+
292
+
293
+
294
+
295
+
296
+
297
+
298
+
299
+
300
+
301
+
302
+
303
+
304
+
305
+
306
+
307
+
308
+
309
+
310
+
311
+
312
+
313
+
314
+
315
+
316
+
317
+
318
+
319
+
320
+
321
+
322
+
323
+
324
+
325
+
326
+
327
+
328
+
329
+
330
+
331
+
332
+
333
+
334
+
335
+
336
+
337
+
338
+
339
+
340
+
341
+
342
+
343
+
344
+
345
+
346
+
347
+
348
+
349
+
350
+
351
+
352
+
353
+
354
+
355
+
356
+
357
+
358
+
359
+
360
+
361
+
362
+
363
+
364
+
365
+
366
+
367
+
368
+
369
+
370
+
371
+
372
+
373
+
374
+
375
+
376
+
377
+
378
+
379
+
380
+
381
+
382
+
383
+
384
+
385
+
386
+
387
+
388
+
389
+
390
+
391
+
392
+
393
+
394
+
395
+
396
+
397
+
398
+
399
+
400
+
401
+
402
+
403
+
404
+
405
+
406
+
407
+
408
+
409
+
410
+
411
+
412
+
413
+
414
+
415
+
416
+
417
+
418
+
419
+
420
+
421
+
422
+
423
+
424
+
425
+
426
+
427
+
428
+
429
+
430
+
431
+
432
+
433
+
434
+
435
+
436
+
437
+
438
+
439
+
440
+
441
+
442
+
443
+
444
+
445
+
446
+
447
+
448
+
449
+
450
+
451
+
452
+
453
+
454
+
455
+
456
+
457
+
458
+
459
+
460
+
461
+
462
+
463
+
464
+
465
+
466
+
467
+
468
+
469
+
470
+
471
+
472
+
473
+
474
+
475
+
476
+
477
+
478
+
479
+
480
+
481
+
482
+
483
+
484
+
485
+
486
+
487
+
488
+
489
+
490
+
491
+
492
+
493
+
494
+
495
+
496
+
497
+
498
+
499
+
500
+
501
+
502
+
503
+
504
+
505
+
506
+
507
+
508
+
509
+
510
+
511
+
512
+
513
+
514
+
515
+
516
+
517
+
518
+
519
+
520
+
521
+
522
+
523
+
524
+
525
+
526
+
527
+
528
+
529
+
530
+
531
+
532
+
533
+
534
+
535
+
536
+
537
+
538
+
539
+
540
+
541
+
542
+
543
+
544
+
545
+
546
+
547
+
548
+
549
+
550
+
551
+
552
+
553
+
554
+
555
+
556
+
557
+
558
+
559
+
560
+
561
+
562
+
563
+
564
+
565
+
566
+
567
+
568
+
569
+
570
+
571
+
572
+
573
+
574
+
575
+
576
+
577
+
578
+
579
+ 广
580
+
581
+
582
+
583
+
584
+
585
+
586
+
587
+
588
+
589
+
590
+
591
+
592
+
593
+
594
+
595
+
596
+
597
+
598
+
599
+
600
+
601
+
602
+
603
+
604
+
605
+
606
+
607
+
608
+
609
+
610
+
611
+
612
+
613
+
614
+
615
+
616
+
617
+
618
+
619
+
620
+
621
+
622
+
623
+
624
+
625
+
626
+
627
+
628
+
629
+
630
+
631
+
632
+
633
+
634
+
635
+
636
+
637
+
638
+
639
+
640
+
641
+
642
+
643
+
644
+ 殿
645
+
646
+
647
+
648
+
649
+
650
+
651
+
652
+
653
+
654
+
655
+
656
+
657
+
658
+
659
+
660
+
661
+
662
+
663
+
664
+
665
+
666
+
667
+
668
+
669
+
670
+
671
+
672
+
673
+
674
+
675
+
676
+
677
+
678
+
679
+
680
+
681
+
682
+
683
+
684
+
685
+
686
+
687
+
688
+
689
+
690
+
691
+
692
+
693
+
694
+
695
+
696
+
697
+
698
+
699
+
700
+
701
+
702
+
703
+
704
+
705
+
706
+
707
+
708
+
709
+
710
+
711
+
712
+
713
+
714
+
715
+
716
+
717
+
718
+
719
+
720
+
721
+
722
+
723
+
724
+
725
+
726
+
727
+
728
+
729
+
730
+
731
+
732
+
733
+
734
+
735
+
736
+
737
+
738
+
739
+
740
+
741
+
742
+
743
+
744
+
745
+
746
+
747
+
748
+
749
+
750
+
751
+
752
+
753
+
754
+
755
+
756
+
757
+
758
+
759
+
760
+
761
+
762
+
763
+
764
+
765
+
766
+
767
+
768
+
769
+
770
+
771
+
772
+
773
+
774
+
775
+
776
+
777
+
778
+
779
+
780
+
781
+
782
+
783
+
784
+
785
+
786
+
787
+
788
+
789
+
790
+
791
+ ##i
792
+ ##y
793
+ ##o
794
+ ##r
795
+ ##g
796
+ ##a
797
+ ##w
798
+ ##l
799
+ ##b
800
+ ##z
801
+ ##t
802
+ ##n
803
+ ##c
804
+ ##h
805
+ ##s
806
+ ##u
807
+ ##d
808
+ ##e
809
+ ##k
810
+ ##v
811
+ ##f
812
+ ##x
813
+ ##q
814
+ ##p
815
+ ##æ
816
+ ##0
817
+ ##5
818
+ ##m
819
+ ##8
820
+ ##4
821
+ ##س
822
+ ##ت
823
+ ##ا
824
+ ##ن
825
+ ##6
826
+ ##1
827
+ ##7
828
+ ##j
829
+ ##つ
830
+ ##う
831
+ ##2
832
+ ##9
833
+ ##3
834
+ ##ø
835
+ ##ล
836
+ ##ว
837
+ ##ง
838
+ ##พ
839
+ ##ไ
840
+ ##ช
841
+ ##ย
842
+ ##า
843
+ ##ร
844
+ ##თ
845
+ ##ა
846
+ ##ვ
847
+ ##რ
848
+ ##ი
849
+ ##ള
850
+ ##あ
851
+ ##ん
852
+ ##α
853
+ ##ν
854
+ ##τ
855
+ ##ο
856
+ ##κ
857
+ ##ρ
858
+ ##ω
859
+ ##ς
860
+ ##の
861
+ ##な
862
+ ##ら
863
+ ##ð
864
+ ##œ
865
+ ##ɛ
866
+ ##ł
867
+ ##η
868
+ ##μ
869
+ ##ซ
870
+ ##ル
871
+ ##シ
872
+ ##ア
873
+ ##リ
874
+ ##ス
875
+ ##ʔ
876
+ ##ल
877
+ ##ᄇ
878
+ ##ᅮ
879
+ ##ᄃ
880
+ ##ᅢ
881
+ ##β
882
+ ##ß
883
+ ##か
884
+ ##た
885
+ ##ə
886
+ ##ʻ
887
+ ##ι
888
+ ##χ
889
+ ##о
890
+ ##л
891
+ ##с
892
+ ##а
893
+ ##т
894
+ ##ы
895
+ ##и
896
+ ##в
897
+ ##к
898
+ ##з
899
+ ##ッ
900
+ ##ク
901
+ ##マ
902
+ ##ン
903
+ ##გ
904
+ ##ლ
905
+ ##ო
906
+ ##ნ
907
+ ##ː
908
+ ##ל
909
+ ##ה
910
+ ##א
911
+ ##く
912
+ ##み
913
+ ##ε
914
+ ##ξ
915
+ ##ল
916
+ ##ˈ
917
+ ##ɡ
918
+ ##ɑ
919
+ ##ɒ
920
+ ##し
921
+ ##す
922
+ ##き
923
+ ##ひ
924
+ ##と
925
+ ##đ
926
+ ##ъ
927
+ ##н
928
+ ##е
929
+ ##י
930
+ ##פ
931
+ ##イ
932
+ ##λ
933
+ ##ق
934
+ ##ع
935
+ ##د
936
+ ##ᅡ
937
+ ##ᆯ
938
+ ##ᄅ
939
+ ##ɪ
940
+ ##ค
941
+ ##ต
942
+ ##व
943
+ ##ा
944
+ ##द
945
+ ##は
946
+ ##り
947
+ ##レ
948
+ ##ー
949
+ ##ツ
950
+ ##ي
951
+ ##ش
952
+ ##و
953
+ ##م
954
+ ##º
955
+ ##ਲ
956
+ ##ਾ
957
+ ##ਹ
958
+ ##д
959
+ ##р
960
+ ##ل
961
+ ##ب
962
+ ##い
963
+ ##ち
964
+ ##ゃ
965
+ ##ʒ
966
+ ##ʃ
967
+ ##ɔ
968
+ ##ह
969
+ ##ニ
970
+ ##ウ
971
+ ##ァ
972
+ ##キ
973
+ ##ュ
974
+ ##3
975
+ ##ხ
976
+ ##ს
977
+ ##お
978
+ ##タ
979
+ ##ാ
980
+ ##ഹ
981
+ ##ɳ
982
+ ##ま
983
+ ##る
984
+ ##ะ
985
+ ##อ
986
+ ##น
987
+ ##ן
988
+ ##я
989
+ ##แ
990
+ ##ก
991
+ ##ɾ
992
+ ##ʲ
993
+ ##フ
994
+ ##უ
995
+ ##ภ
996
+ ##ด
997
+ ##ב
998
+ ##ת
999
+ ##خ
1000
+ ##ラ
1001
+ ##れ
1002
+ ##ण
1003
+ ##स
1004
+ ##न
1005
+ ##ه
1006
+ ##ف
1007
+ ##ر
1008
+ ##エ
1009
+ ##テ
1010
+ ##ษ
1011
+ ##ฐ
1012
+ ##ィ
1013
+ ##क
1014
+ ##ノ
1015
+ ##θ
1016
+ ##ネ
1017
+ ##��
1018
+ ##δ
1019
+ ##ɽ
1020
+ ##ʁ
1021
+ ##ტ
1022
+ ##ჱ
1023
+ ##ェ
1024
+ ##ハ
1025
+ ##υ
1026
+ ##र
1027
+ ##х
1028
+ ##も
1029
+ ##っ
1030
+ ##ょ
1031
+ ##に
1032
+ ##γ
1033
+ ##ც
1034
+ ##ე
1035
+ ##є
1036
+ ##м
1037
+ ##ܕ
1038
+ ##ܝ
1039
+ ##ܢ
1040
+ ##ܬ
1041
+ ##ณ
1042
+ ##ม
1043
+ ##ฮ
1044
+ ##ж
1045
+ ##ם
1046
+ ##ء
1047
+ ##ʊ
1048
+ ##ई
1049
+ ##め
1050
+ ##მ
1051
+ ##ム
1052
+ ##チ
1053
+ ##ᵻ
1054
+ ##ˌ
1055
+ ##ו
1056
+ ##ף
1057
+ ##წ
1058
+ ##ფ
1059
+ ##ャ
1060
+ ##モ
1061
+ ##ɐ
1062
+ ##ᅦ
1063
+ ##ᅩ
1064
+ ##ᆨ
1065
+ ##ᅵ
1066
+ ##ᆸ
1067
+ ##ᅧ
1068
+ ##ᆼ
1069
+ ##ᄋ
1070
+ ##ᆫ
1071
+ ##わ
1072
+ ##ı
1073
+ ##ქ
1074
+ ##დ
1075
+ ##ि
1076
+ ##ჲ
1077
+ ##ר
1078
+ ##セ
1079
+ ##オ
1080
+ ##ゆ
1081
+ ##せ
1082
+ ##ك
1083
+ ##ʿ
1084
+ ##ש
1085
+ ##מ
1086
+ ##צ
1087
+ ##п
1088
+ ##г
1089
+ ##カ
1090
+ ##ܠ
1091
+ ##ܗ
1092
+ ##ܐ
1093
+ ##ナ
1094
+ ##ミ
1095
+ ##こ
1096
+ ##を
1097
+ ##ψ
1098
+ ##サ
1099
+ ##ォ
1100
+ ##π
1101
+ ##ト
1102
+ ##у
1103
+ ##ح
1104
+ ##σ
1105
+ ##เ
1106
+ ##ป
1107
+ ##ш
1108
+ ##ゥ
1109
+ ##ロ
1110
+ ##া
1111
+ ##হ
1112
+ ##ɜ
1113
+ ##ة
1114
+ ##ص
1115
+ ##ס
1116
+ ##ث
1117
+ ##ჳ
1118
+ ##נ
1119
+ ##ذ
1120
+ ##ग
1121
+ ##ɫ
1122
+ ##ц
1123
+ ##ь
1124
+ ##ю