YuukiAsuna commited on
Commit
998698f
1 Parent(s): edd4e1e

Upload processor

Browse files
Files changed (3) hide show
  1. added_tokens.json +1146 -1146
  2. tokenizer.json +0 -0
  3. tokenizer_config.json +0 -0
added_tokens.json CHANGED
@@ -1,14 +1,14 @@
1
  {
2
- "!?": 58127,
3
- "',": 57701,
4
- "'.": 58325,
5
- ".1": 58501,
6
- "1": 57573,
7
- "4.": 57619,
8
- "49.": 58451,
9
- "6,": 58633,
10
- "6.": 57708,
11
- "7.": 58206,
12
  "</s_answer>": 58679,
13
  "</s_question>": 58677,
14
  "<no/>": 57526,
@@ -19,1143 +19,1143 @@
19
  "<s_synthdog>": 57524,
20
  "<sep/>": 57522,
21
  "<yes/>": 57525,
22
- "Bảo": 58075,
23
- "Chỉ": 58548,
24
- "Cảm": 58252,
25
- "Dương": 57686,
26
- "Hồ": 57598,
27
- "Kh": 58546,
28
- "Nguyễn": 58336,
29
- "Nh": 57724,
30
- "Như": 58527,
31
- "Phương": 57977,
32
- "Số": 58217,
33
- "Thu": 58591,
34
- "Từ": 57816,
35
- "Việt": 57913,
36
- "anh": 57700,
37
- "chỉ": 58034,
38
- "chị": 58380,
39
- "cả": 58505,
40
- "hiệu": 58087,
41
- "hoặc": 57952,
42
- "iếc": 58263,
43
- "iến": 58317,
44
- "iếng": 57581,
45
- "iếp": 58655,
46
- "iết": 57530,
47
- "iếu": 57908,
48
- "iềm": 57969,
49
- "iền": 57629,
50
- "iều": 57832,
51
- "iểm": 57559,
52
- "iển": 58351,
53
- "iểu": 58069,
54
- "iện": 58071,
55
- "iệp": 57932,
56
- "iệt": 57798,
57
- "iệu": 58596,
58
- "một": 57528,
59
- "ngh": 58352,
60
- "người": 58549,
61
- "năm": 57741,
62
- "số": 57587,
63
- "tiền": 57886,
64
- "trước": 58567,
65
- "trừ": 57888,
66
- "tuổi": 58581,
67
- "từ": 58481,
68
- "urn": 58373,
69
- "uyền": 57967,
70
- "uyển": 58564,
71
- "uyện": 57736,
72
- "và": 57749,
73
- "với": 58499,
74
- "Â": 58041,
75
- "Ô": 58258,
76
- "ành": 57819,
77
- "òm": 58311,
78
- "được": 57830,
79
- "để": 58216,
80
- "ơ": 57792,
81
- "ơi": 58123,
82
- "ơn": 58289,
83
- "Ư": 57790,
84
- "ư": 58215,
85
- "ưa": 58524,
86
- "ưng": 58617,
87
- "ưu": 58038,
88
- "ương": 58529,
89
- "ước": 58404,
90
- "ưới": 57547,
91
- "ướng": 57768,
92
- "ười": 57731,
93
- "ườm": 57813,
94
- "ườn": 58478,
95
- "ường": 57689,
96
- "ưỡi": 58674,
97
- "ưỡng": 57751,
98
- "ược": 57812,
99
- "ượn": 58437,
100
- "ượng": 57986,
101
- "ượt": 58484,
102
- "ại": 57750,
103
- "ạo": 58647,
104
- "ả": 57829,
105
- "ải": 58316,
106
- "ảm": 57818,
107
- "ản": 58134,
108
- "ảng": 58632,
109
- "ảo": 58598,
110
- "ảy": 58129,
111
- "Ẩ": 57529,
112
- "ẩu": 58324,
113
- "ậc": 58037,
114
- "ậm": 57567,
115
- "ận": 58608,
116
- "ập": 57885,
117
- "ật": 58145,
118
- "ậu": 57809,
119
- "ằn": 58138,
120
- "ằng": 57900,
121
- "ẳn": 57863,
122
- "ặng": 58618,
123
- "ặp": 58492,
124
- "ặt": 57702,
125
- "ẹn": 57845,
126
- "ẻ": 58193,
127
- "ẽ": 58231,
128
- "ế": 58190,
129
- "ết": 58114,
130
- "ề": 57640,
131
- "ền": 58209,
132
- "ển": 57806,
133
- "ễ": 58308,
134
- "ễn": 58000,
135
- "ệ": 58204,
136
- "ện": 58646,
137
- "ỉ": 57776,
138
- "ỉnh": 58218,
139
- "ị": 58601,
140
- "ịa": 58319,
141
- "ịch": 57670,
142
- "ịnh": 58292,
143
- "ỏa": 58439,
144
- "Ố": 58279,
145
- "ốc": 57773,
146
- "ối": 58307,
147
- "ốn": 58098,
148
- "ống": 58341,
149
- "ốt": 58270,
150
- "ồi": 57622,
151
- "ồn": 58636,
152
- "ồng": 57684,
153
- "ổ": 58490,
154
- "ổi": 57711,
155
- "ổng": 58665,
156
- "ỗ": 57600,
157
- "ỗng": 58503,
158
- "ộ": 57956,
159
- "ộc": 58614,
160
- "ội": 58081,
161
- "ộng": 57645,
162
- "ột": 58447,
163
- "ớ": 57630,
164
- "ới": 58284,
165
- "ời": 58036,
166
- "ở": 57814,
167
- "ởi": 58144,
168
- "ợ": 58303,
169
- "ợn": 58150,
170
- "ợp": 58485,
171
- "ủ": 58249,
172
- "ủi": 58326,
173
- "ủng": 58395,
174
- "ứ": 58495,
175
- "ứa": 57981,
176
- "ức": 58184,
177
- "ừng": 57985,
178
- "ử": 58009,
179
- "ửa": 58644,
180
- "ửu": 57738,
181
- "ữ": 57880,
182
- "ững": 57542,
183
- "ữu": 57616,
184
- "ự": 57532,
185
- "ựa": 57558,
186
- "ực": 57920,
187
- "ựu": 58532,
188
- "ỳ": 57878,
189
- "ỵ": 58537,
190
- "ỷ": 57786,
191
- "▁\"\"": 58142,
192
- "▁Biển": 58056,
193
- "▁Biểu": 57925,
194
- "▁Biệt": 57589,
195
- "▁Buồn": 57974,
196
- "▁Bản": 58569,
197
- "▁Bảng": 57661,
198
- "▁Bảy": 58020,
199
- "▁Bằng": 57709,
200
- "▁Bến": 58235,
201
- "▁Bệnh": 57548,
202
- "▁Bỉ": 58182,
203
- "▁Bốn": 57782,
204
- "▁Bồ": 57759,
205
- "▁Bổ": 57852,
206
- "▁Bộ": 58023,
207
- "▁Bờ": 57957,
208
- "▁Bức": 58588,
209
- "▁Bữa": 57595,
210
- "▁Chiếc": 58166,
211
- "▁Chiếu": 58277,
212
- "▁Chuyến": 57935,
213
- "▁Chuyện": 57696,
214
- "▁Chư": 58137,
215
- "▁Chưa": 58199,
216
- "▁Chương": 58333,
217
- "▁Chẳng": 58017,
218
- "▁Chế": 58412,
219
- "▁Chết": 57940,
220
- "▁Chỉ": 57723,
221
- "▁Chợ": 57704,
222
- "▁Chủ": 57716,
223
- "▁Chức": 57703,
224
- "▁Chứng": 58542,
225
- "▁Chữ": 57781,
226
- "▁Cuối": 57712,
227
- "▁Cuốn": 57755,
228
- "▁Cuộc": 57821,
229
- "▁Cơ": 58093,
230
- "▁Cơm": 57606,
231
- "▁Cơn": 57614,
232
- "▁Cương": 57644,
233
- "▁Cưới": 57906,
234
- "▁Cường": 58659,
235
- "▁Cả": 57911,
236
- "▁Cảm": 58425,
237
- "▁Cảnh": 58465,
238
- "▁Cẩm": 58214,
239
- "▁Cập": 57543,
240
- "▁Cậu": 58021,
241
- "▁Cặp": 58517,
242
- "▁Cỏ": 58264,
243
- "▁Cổ": 58155,
244
- "▁Cờ": 58332,
245
- "▁Của": 58146,
246
- "▁Cứng": 57676,
247
- "▁Cứu": 57673,
248
- "▁Cừ": 58595,
249
- "▁Cửu": 57609,
250
- "▁Cực": 58362,
251
- "▁Diễm": 57674,
252
- "▁Diện": 57666,
253
- "▁Diệp": 58136,
254
- "▁Diệu": 58402,
255
- "▁Dư": 58602,
256
- "▁Dương": 57843,
257
- "▁Dưới": 57766,
258
- "▁Dư��c": 58044,
259
- "▁Dị": 58399,
260
- "▁Dịch": 58097,
261
- "▁Dự": 58287,
262
- "▁Dựa": 58476,
263
- "▁Giả": 57693,
264
- "▁Giải": 57828,
265
- "▁Giảm": 57649,
266
- "▁Giới": 57706,
267
- "▁Giờ": 57679,
268
- "▁Giữa": 57601,
269
- "▁Gương": 57837,
270
- "▁Hiến": 57654,
271
- "▁Hiếu": 57810,
272
- "▁Hiền": 58053,
273
- "▁Hiển": 58205,
274
- "▁Hiểu": 58417,
275
- "▁Hiện": 58109,
276
- "▁Hiệp": 58299,
277
- "▁Hiệu": 57979,
278
- "▁Hoặc": 58563,
279
- "▁Huyền": 58315,
280
- "▁Huyện": 58520,
281
- "▁Huế": 58544,
282
- "▁Huệ": 58272,
283
- "▁Huỳnh": 58562,
284
- "▁Hơn": 58502,
285
- "▁Hư": 57866,
286
- "▁Hưng": 58610,
287
- "▁Hương": 57987,
288
- "▁Hải": 58464,
289
- "▁Hảo": 58078,
290
- "▁Hậu": 58257,
291
- "▁Hằng": 58415,
292
- "▁Hệ": 58648,
293
- "▁Hổ": 57937,
294
- "▁Hộ": 57761,
295
- "▁Hội": 58370,
296
- "▁Khuyến": 57682,
297
- "▁Khương": 57721,
298
- "▁Khải": 58340,
299
- "▁Khẩu": 57669,
300
- "▁Khủng": 57917,
301
- "▁Kiến": 57857,
302
- "▁Kiếp": 58322,
303
- "▁Kiều": 57860,
304
- "▁Kiểm": 58625,
305
- "▁Kiểu": 58467,
306
- "▁Kiện": 57588,
307
- "▁Kiệt": 58468,
308
- "▁Kẻ": 57949,
309
- "▁Kế": 57728,
310
- "▁Kết": 58042,
311
- "▁Kể": 58401,
312
- "▁Kịch": 57804,
313
- "▁Kỷ": 58515,
314
- "▁Liễu": 58673,
315
- "▁Luật": 58091,
316
- "▁Lưu": 58356,
317
- "▁Lương": 58461,
318
- "▁Lượng": 57988,
319
- "▁Lệ": 58558,
320
- "▁Lịch": 57678,
321
- "▁Lỗ": 58076,
322
- "▁Lỗi": 58300,
323
- "▁Lộ": 58561,
324
- "▁Lộc": 58245,
325
- "▁Lớn": 58658,
326
- "▁Lớp": 57844,
327
- "▁Lời": 58649,
328
- "▁Lợi": 57877,
329
- "▁Lựa": 58266,
330
- "▁Lực": 57840,
331
- "▁Mơ": 58409,
332
- "▁Mưa": 58509,
333
- "▁Mười": 58113,
334
- "▁Mật": 58111,
335
- "▁Mặc": 57770,
336
- "▁Mặt": 57780,
337
- "▁Mẹ": 58067,
338
- "▁Mễ": 57694,
339
- "▁Mộng": 58652,
340
- "▁Một": 58203,
341
- "▁Mới": 58147,
342
- "▁Mức": 58480,
343
- "▁Ngh": 57626,
344
- "▁Nghệ": 57540,
345
- "▁Nghị": 58454,
346
- "▁Nguyện": 58385,
347
- "▁Nguyệt": 57801,
348
- "▁Nguồn": 57578,
349
- "▁Ngư": 58019,
350
- "▁Ngưu": 57618,
351
- "▁Nhiều": 58318,
352
- "▁Nhiệt": 58427,
353
- "▁Nhu": 57753,
354
- "▁Nhuận": 58163,
355
- "▁Như": 58667,
356
- "▁Nhược": 58210,
357
- "▁Nhận": 58539,
358
- "▁Nhập": 58171,
359
- "▁Nhật": 58669,
360
- "▁Nhị": 57538,
361
- "▁Nhỏ": 58156,
362
- "▁Nhớ": 58354,
363
- "▁Những": 58207,
364
- "▁Niềm": 58185,
365
- "▁Nơi": 57873,
366
- "▁Nương": 58645,
367
- "▁Nước": 58531,
368
- "▁Nếu": 58194,
369
- "▁Nổi": 57909,
370
- "▁Nỗi": 57625,
371
- "▁Nội": 58589,
372
- "▁Nợ": 58382,
373
- "▁Nửa": 58535,
374
- "▁Nữ": 57961,
375
- "▁Phương": 57582,
376
- "▁Phước": 57604,
377
- "▁Phượng": 57748,
378
- "▁Phật": 58436,
379
- "▁Phủ": 57984,
380
- "▁Quyết": 58543,
381
- "▁Quyền": 58606,
382
- "▁Quả": 58102,
383
- "▁Quản": 57990,
384
- "▁Quận": 58112,
385
- "▁Quốc": 58301,
386
- "▁Quỳnh": 58115,
387
- "▁Rồi": 58384,
388
- "▁Rồng": 57807,
389
- "▁Rừng": 57778,
390
- "▁Sơ": 57544,
391
- "▁Sư": 58234,
392
- "▁Sản": 58390,
393
- "▁Số": 58106,
394
- "▁Sở": 58058,
395
- "▁Sức": 57592,
396
- "▁Sử": 58620,
397
- "▁Sự": 58253,
398
- "▁Thiết": 58259,
399
- "▁Thiếu": 57685,
400
- "▁Thiện": 57698,
401
- "▁Thuận": 58002,
402
- "▁Thư": 57739,
403
- "▁Thương": 58014,
404
- "▁Thường": 57996,
405
- "▁Thượng": 58247,
406
- "▁Thả": 58345,
407
- "▁Thảm": 57910,
408
- "▁Thảo": 58607,
409
- "▁Thẩm": 58556,
410
- "▁Thật": 57899,
411
- "▁Thế": 57680,
412
- "▁Thề": 57637,
413
- "▁Thể": 58536,
414
- "▁Thị": 58592,
415
- "▁Thịnh": 58012,
416
- "▁Thống": 58096,
417
- "▁Thổ": 58621,
418
- "▁Thủ": 58095,
419
- "▁Thủy": 57634,
420
- "▁Thứ": 58090,
421
- "▁Thừa": 58254,
422
- "▁Tiến": 58545,
423
- "▁Tiếng": 58063,
424
- "▁Tiết": 58157,
425
- "▁Tiền": 58177,
426
- "▁Tiểu": 58032,
427
- "▁Triệu": 58525,
428
- "▁Truyện": 58433,
429
- "▁Trước": 57695,
430
- "▁Trường": 57648,
431
- "▁Trưởng": 57683,
432
- "▁Trận": 57802,
433
- "▁Trẻ": 58232,
434
- "▁Trộm": 58057,
435
- "▁Trời": 58346,
436
- "▁Trở": 58349,
437
- "▁Trực": 57655,
438
- "▁Tuyến": 58565,
439
- "▁Tuyết": 58335,
440
- "▁Tuyền": 58179,
441
- "▁Tuyển": 58178,
442
- "▁Tuệ": 58381,
443
- "▁Tuổi": 58359,
444
- "▁TƯ": 57762,
445
- "▁Tư": 58294,
446
- "▁Tươi": 57903,
447
- "▁Tương": 58623,
448
- "▁Tường": 58423,
449
- "▁Tưởng": 58448,
450
- "▁Tải": 57729,
451
- "▁Tẩy": 58022,
452
- "▁Tập": 58240,
453
- "▁Tỉ": 57635,
454
- "▁Tỉnh": 57864,
455
- "▁Tịch": 58160,
456
- "▁Tịnh": 57905,
457
- "▁Tố": 57545,
458
- "▁Tốc": 57796,
459
- "▁Tống": 58180,
460
- "▁Tứ": 57898,
461
- "▁Tức": 58663,
462
- "▁Từ": 57767,
463
- "▁Tử": 57623,
464
- "▁Tự": 58552,
465
- "▁Tỷ": 58195,
466
- "▁VTV": 57919,
467
- "▁Viễn": 57639,
468
- "▁Việc": 57732,
469
- "▁Viện": 57579,
470
- "▁Vương": 57841,
471
- "▁Vượng": 58164,
472
- "▁Vật": 57624,
473
- "▁Vậy": 57939,
474
- "▁Về": 58314,
475
- "▁Vệ": 57575,
476
- "▁Vị": 57948,
477
- "▁Vịt": 58130,
478
- "▁Với": 57531,
479
- "▁Xương": 58305,
480
- "▁Xếp": 58213,
481
- "▁Yến": 58248,
482
- "▁Yếu": 57710,
483
- "▁biến": 58440,
484
- "▁biết": 58361,
485
- "▁biển": 58004,
486
- "▁biểu": 58585,
487
- "▁biệt": 58045,
488
- "▁buổi": 58170,
489
- "▁buộc": 58413,
490
- "▁bàn": 58587,
491
- "▁bưu": 57839,
492
- "▁bước": 58446,
493
- "▁bướm": 57533,
494
- "▁bản": 58061,
495
- "▁bảng": 58616,
496
- "▁bảo": 57566,
497
- "▁bậc": 58274,
498
- "▁bật": 57991,
499
- "▁bằng": 57787,
500
- "▁bến": 57760,
501
- "▁bề": 58286,
502
- "▁bền": 57963,
503
- "▁bệ": 58376,
504
- "▁bệnh": 58033,
505
- "▁bị": 57962,
506
- "▁bịp": 58483,
507
- "▁bỏ": 58378,
508
- "▁bố": 58141,
509
- "▁bối": 58656,
510
- "▁bốn": 57658,
511
- "▁bổ": 57699,
512
- "▁bộ": 58108,
513
- "▁bộc": 57855,
514
- "▁bởi": 57553,
515
- "▁bức": 57550,
516
- "▁chiếc": 57564,
517
- "▁chiến": 58222,
518
- "▁chiếu": 57989,
519
- "▁chiều": 57928,
520
- "▁chuyến": 58650,
521
- "▁chuyển": 57848,
522
- "▁chuyện": 57915,
523
- "▁chuẩn": 58079,
524
- "▁chuỗi": 57733,
525
- "▁chuộng": 58131,
526
- "▁chưa": 57722,
527
- "▁chương": 58441,
528
- "▁chậm": 58198,
529
- "▁chẳng": 58386,
530
- "▁chặt": 58631,
531
- "▁chẽ": 58475,
532
- "▁chế": 58604,
533
- "▁chết": 57896,
534
- "▁chỉ": 58538,
535
- "▁chỉnh": 57970,
536
- "▁chị": 57831,
537
- "▁chịu": 57597,
538
- "▁chống": 58029,
539
- "▁chốt": 57746,
540
- "▁chồng": 58149,
541
- "▁chỗ": 58534,
542
- "▁chở": 58593,
543
- "▁chủ": 58570,
544
- "▁chủng": 57653,
545
- "▁chứa": 58422,
546
- "▁chức": 58418,
547
- "▁chứng": 58428,
548
- "▁chữ": 58586,
549
- "▁chữa": 58074,
550
- "▁cuối": 57641,
551
- "▁cuốn": 58161,
552
- "▁cuộc": 58337,
553
- "▁cơ": 58463,
554
- "▁cơn": 58334,
555
- "▁cư": 58342,
556
- "▁cướp": 58400,
557
- "▁cường": 58302,
558
- "▁cược": 58140,
559
- "▁cả": 58511,
560
- "▁cải": 58251,
561
- "▁cảm": 57953,
562
- "▁cản": 58497,
563
- "▁cảng": 58285,
564
- "▁cảnh": 58528,
565
- "▁cận": 58496,
566
- "▁cập": 57617,
567
- "▁cậu": 58291,
568
- "▁cặp": 57727,
569
- "▁cỏ": 57765,
570
- "▁cố": 58117,
571
- "▁cống": 57612,
572
- "▁cổ": 57960,
573
- "▁cổng": 57594,
574
- "▁cộng": 57836,
575
- "▁cột": 58169,
576
- "▁cờ": 57827,
577
- "▁của": 57664,
578
- "▁củng": 58275,
579
- "▁cứ": 58255,
580
- "▁cứu": 57621,
581
- "▁cừu": 57643,
582
- "▁cử": 57854,
583
- "▁cửa": 58268,
584
- "▁cực": 57537,
585
- "▁danh": 58540,
586
- "▁diều": 58512,
587
- "▁diễn": 58572,
588
- "▁diện": 58269,
589
- "▁diệt": 57546,
590
- "▁diệu": 58407,
591
- "▁duyệt": 58429,
592
- "▁dương": 58088,
593
- "▁dưới": 58223,
594
- "▁dường": 57583,
595
- "▁dưỡng": 58575,
596
- "▁dải": 57968,
597
- "▁dậy": 57795,
598
- "▁dễ": 58188,
599
- "▁dị": 58068,
600
- "▁dịch": 58165,
601
- "▁dỡ": 58055,
602
- "▁dứt": 57838,
603
- "▁dừng": 57922,
604
- "▁dữ": 58553,
605
- "▁dự": 58551,
606
- "▁dựa": 58227,
607
- "▁dựng": 57992,
608
- "▁ghế": 58073,
609
- "▁giả": 58132,
610
- "▁giải": 57580,
611
- "▁giảm": 58201,
612
- "▁giản": 57976,
613
- "▁giếng": 57799,
614
- "▁giết": 58260,
615
- "▁giống": 58031,
616
- "▁giới": 58238,
617
- "▁giờ": 58456,
618
- "▁giời": 58438,
619
- "▁giữ": 57950,
620
- "▁giữa": 58629,
621
- "▁gậy": 57690,
622
- "▁gặp": 58411,
623
- "▁gốc": 58368,
624
- "▁gồm": 58358,
625
- "▁gỗ": 57713,
626
- "▁gộp": 57958,
627
- "▁gỡ": 57638,
628
- "▁gợi": 58635,
629
- "▁gửi": 58455,
630
- "▁hiến": 58243,
631
- "▁hiền": 58458,
632
- "▁hiểm": 58261,
633
- "▁hiển": 58119,
634
- "▁hiểu": 58035,
635
- "▁hiện": 57931,
636
- "▁hiệp": 57769,
637
- "▁hiệu": 57735,
638
  "▁hoảng": 58026,
639
- "▁hoặc": 57777,
640
- "▁huyết": 58366,
641
- "▁huyện": 57772,
642
- "▁huống": 57907,
643
- "▁huỳnh": 58283,
644
- "▁hư": 58449,
645
- "▁hương": 57557,
646
- "▁hước": 58579,
647
- "▁hướng": 58367,
648
- "▁hưởng": 58638,
649
- "▁hận": 58191,
650
- "▁hậu": 58276,
651
- "▁hẳn": 57870,
652
- "▁hẹn": 58278,
653
- "▁hết": 58330,
654
- "▁hệ": 58306,
655
- "▁hệt": 57971,
656
- "▁hỏa": 58320,
657
- "▁hỏi": 58560,
658
- "▁hỏng": 58470,
659
- "▁hố": 58388,
660
- "▁hồ": 57688,
661
- "▁hồi": 58312,
662
- "▁hồn": 57527,
663
- "▁hồng": 58208,
664
- "▁hỗ": 58627,
665
- "▁hộ": 57811,
666
- "▁hội": 57805,
667
- "▁hộp": 57646,
668
- "▁hợp": 58310,
669
- "▁hủy": 58233,
670
- "▁hứng": 57775,
671
- "▁hữu": 58116,
672
- "▁khiến": 58226,
673
- "▁khiếp": 57668,
674
- "▁khiển": 58664,
675
- "▁khoản": 58599,
676
- "▁khoảng": 58082,
677
- "▁khuyết": 58383,
678
- "▁khả": 57793,
679
- "▁khảo": 57955,
680
- "▁khẩu": 57628,
681
- "▁khẳng": 58230,
682
- "▁khỏi": 57883,
683
- "▁khối": 57611,
684
- "▁khốn": 58671,
685
- "▁khổ": 57882,
686
- "▁khổng": 57823,
687
- "▁khủng": 57995,
688
- "▁khứ": 58555,
689
- "▁kiến": 57535,
690
- "▁kiềm": 58392,
691
- "▁kiểm": 58084,
692
- "▁kiểu": 58613,
693
- "▁kiện": 57720,
694
- "▁kẻ": 58221,
695
- "▁kẻo": 57763,
696
- "▁kế": 58271,
697
- "▁kết": 58393,
698
- "▁kể": 57862,
699
- "▁kỉ": 57966,
700
- "▁kịch": 58220,
701
- "▁kỳ": 58414,
702
- "▁kỷ": 57631,
703
- "▁liền": 58640,
704
- "▁liệt": 57740,
705
- "▁liệu": 58162,
706
- "▁luyến": 57671,
707
- "▁luyện": 58143,
708
- "▁luận": 57662,
709
- "▁luật": 58387,
710
- "▁luồng": 58389,
711
- "▁lơ": 58435,
712
- "▁lưu": 58498,
713
- "▁lương": 58469,
714
- "▁lưới": 57972,
715
- "▁lưỡi": 58487,
716
- "▁lược": 58011,
717
- "▁lượng": 58426,
718
- "▁lượt": 58174,
719
- "▁lập": 57993,
720
- "▁lặn": 58590,
721
- "▁lặng": 58126,
722
- "▁lặp": 57613,
723
- "▁lẻ": 58574,
724
- "▁lễ": 57789,
725
- "▁lệ": 58296,
726
- "▁lệch": 57771,
727
- "▁lệnh": 58360,
728
- "▁lịch": 57861,
729
- "▁lốc": 57879,
730
- "▁lối": 58657,
731
- "▁lốp": 57577,
732
- "▁lồ": 58050,
733
- "▁lồng": 58003,
734
- "▁lỗ": 58128,
735
- "▁lỗi": 58241,
736
- "▁lộ": 58212,
737
- "▁lội": 57815,
738
- "▁lớn": 58557,
739
- "▁lớp": 58377,
740
- "▁lời": 58445,
741
- "▁lỡ": 58405,
742
- "▁lợi": 57744,
743
- "▁lừa": 58554,
744
- "▁lửa": 57803,
745
- "▁lựa": 57833,
746
- "▁lực": 57871,
747
- "▁miền": 57656,
748
- "▁miễn": 58573,
749
- "▁miện": 57876,
750
- "▁miệng": 57835,
751
- "▁muốn": 58641,
752
- "▁muộn": 57783,
753
- "▁mơ": 57785,
754
- "▁mưa": 57856,
755
- "▁mưu": 58265,
756
- "▁mười": 58350,
757
- "▁mượn": 57663,
758
- "▁mượt": 57921,
759
- "▁mảnh": 57980,
760
- "▁mập": 58488,
761
- "▁mật": 58086,
762
- "▁mặc": 57808,
763
- "▁mặt": 58104,
764
- "▁mẹ": 58133,
765
- "▁mẽ": 58347,
766
- "▁mệnh": 58051,
767
- "▁mỏng": 57563,
768
- "▁mốc": 58309,
769
- "▁mối": 58224,
770
- "▁mỗi": 57610,
771
- "▁mới": 58519,
772
- "▁mở": 58099,
773
- "▁mức": 58196,
774
- "▁mừng": 57797,
775
- "▁nghiệp": 58500,
776
- "▁nghề": 57752,
777
- "▁nghệ": 57894,
778
- "▁nghị": 58015,
779
- "▁nghịch": 58371,
780
- "▁ngoặc": 58506,
781
- "▁nguyền": 57672,
782
- "▁nguyện": 58186,
783
- "▁nguồn": 57904,
784
- "▁nguội": 58489,
785
- "▁người": 57534,
786
- "▁ngược": 58135,
787
- "▁ngập": 57994,
788
- "▁ngốc": 57756,
789
- "▁ngồi": 57552,
790
- "▁ngờ": 57869,
791
- "▁ngợi": 58121,
792
- "▁ngừng": 57605,
793
- "▁ngữ": 57975,
794
- "▁ngựa": 57562,
795
- "▁nh": 57788,
796
- "▁nhiều": 57929,
797
- "▁nhiệt": 58298,
798
- "▁nhuận": 58634,
799
- "▁như": 58571,
800
- "▁nhưng": 58048,
801
- "▁nhường": 57779,
802
- "▁nhượng": 57881,
803
- "▁nhảy": 58120,
804
- "▁nhận": 57569,
805
- "▁nhập": 57585,
806
- "▁nhật": 57758,
807
- "▁nhẹ": 57734,
808
- "▁nhện": 58228,
809
- "▁nhỏ": 58124,
810
- "▁nhớ": 58396,
811
- "▁những": 57554,
812
- "▁niềm": 58192,
813
- "▁nơi": 57947,
814
- "▁nước": 58626,
815
- "▁nản": 57591,
816
- "▁nặng": 57884,
817
- "▁nếu": 58288,
818
- "▁nền": 58419,
819
- "▁nối": 57794,
820
- "▁nổi": 58662,
821
- "▁nỗ": 57825,
822
- "▁nội": 58357,
823
- "▁nợ": 58651,
824
- "▁nửa": 57730,
825
- "▁nữ": 58583,
826
- "▁nữa": 58052,
827
- "▁phiếu": 57946,
828
- "▁phương": 58060,
829
- "▁phường": 58039,
830
- "▁phượng": 58444,
831
- "▁phải": 58472,
832
- "▁phản": 58219,
833
- "▁phẩm": 57941,
834
- "▁phẩy": 58001,
835
- "▁phận": 57902,
836
- "▁phỏng": 57561,
837
- "▁phố": 57715,
838
- "▁phối": 58280,
839
- "▁phổ": 58049,
840
- "▁phủ": 58459,
841
- "▁phức": 58516,
842
- "▁quyết": 58006,
843
- "▁quyền": 58297,
844
- "▁quyển": 58600,
845
- "▁quả": 58518,
846
- "▁quản": 57551,
847
- "▁quảng": 57964,
848
- "▁quận": 57868,
849
- "▁quốc": 58027,
850
- "▁quỷ": 57930,
851
- "▁rơi": 58453,
852
- "▁rước": 57927,
853
- "▁rưỡi": 57853,
854
- "▁rải": 58344,
855
- "▁rằng": 57565,
856
- "▁rệt": 57754,
857
- "▁rối": 57954,
858
- "▁rồi": 58514,
859
- "▁rồng": 57633,
860
- "▁rổ": 58338,
861
- "▁rỗng": 58577,
862
- "▁rộng": 58584,
863
- "▁rời": 57742,
864
- "▁rủi": 58197,
865
- "▁suốt": 58391,
866
- "▁sơ": 58064,
867
- "▁sơn": 58295,
868
- "▁sư": 57714,
869
- "▁sản": 57657,
870
- "▁sẻ": 58122,
871
- "▁sẽ": 58107,
872
- "▁sỏi": 58406,
873
- "▁số": 58609,
874
- "▁sốc": 58374,
875
- "▁sống": 57642,
876
- "▁sốt": 58397,
877
- "▁sớm": 57757,
878
- "▁sở": 58183,
879
- "▁sợ": 58007,
880
- "▁sợi": 57536,
881
- "▁sứ": 58568,
882
- "▁sức": 57820,
883
- "▁sử": 58158,
884
- "▁sửa": 58290,
885
- "▁sự": 57539,
886
- "▁thiết": 58605,
887
- "▁thiếu": 58450,
888
- "▁thiểu": 57867,
889
- "▁thiện": 58151,
890
  "▁thiệt": 57998,
891
- "▁thiệu": 58244,
892
- "▁thuyết": 57620,
893
- "▁thuyền": 57817,
894
- "▁thuận": 58070,
895
- "▁thuật": 58493,
896
- "▁thuế": 57842,
897
- "▁thuốc": 58491,
898
- "▁thuộc": 58477,
899
- "▁thư": 57997,
900
- "▁thương": 58462,
901
- "▁thước": 57846,
902
- "▁thường": 57945,
903
- "▁thưởng": 58092,
904
- "▁thượng": 57632,
905
- "▁thả": 58432,
906
- "▁thải": 57717,
907
- "▁thảm": 58030,
908
- "▁thảo": 57747,
909
- "▁thập": 58343,
910
- "▁thật": 58080,
911
- "▁thắng": 58013,
912
- "▁thẳng": 58047,
913
- "▁thẻ": 58474,
914
- "▁thế": 58355,
915
- "▁thể": 57887,
916
- "▁thị": 58416,
917
- "▁thịnh": 57872,
918
- "▁thống": 57593,
919
- "▁thổ": 58661,
920
- "▁thợ": 57933,
921
- "▁thủ": 57800,
922
- "▁thủng": 57865,
923
- "▁thủy": 58018,
924
- "▁thứ": 57636,
925
- "▁thức": 57926,
926
- "▁thừa": 58094,
927
- "▁thử": 57774,
928
- "▁tiến": 57942,
929
- "▁tiếng": 57719,
930
- "▁tiếp": 58139,
931
- "▁tiết": 57650,
932
- "▁tiềm": 58369,
933
- "▁tiền": 58494,
934
- "▁tiểu": 58024,
935
- "▁tiễn": 58666,
936
- "▁tiệc": 57549,
937
- "▁tiện": 57851,
938
- "▁toả": 57590,
939
- "▁triều": 57764,
940
- "▁triển": 58100,
941
- "▁triệu": 58153,
942
- "▁truyền": 58473,
943
- "▁truyện": 58442,
944
- "▁trưa": 58457,
945
- "▁trưng": 57586,
946
- "▁trước": 58576,
947
- "▁trường": 58282,
948
- "▁trưởng": 58566,
949
- "▁trả": 58622,
950
- "▁trải": 58016,
951
- "▁trận": 58313,
952
- "▁trẻ": 58670,
953
- "▁trị": 57834,
954
- "▁trồng": 58101,
955
- "▁trội": 58612,
956
- "▁trời": 57849,
957
- "▁trở": 58008,
958
- "▁trợ": 57859,
959
- "▁trừ": 58273,
960
- "▁trữ": 58353,
961
- "▁trực": 57627,
962
- "▁tuyến": 58654,
963
- "▁tuyển": 58239,
964
- "▁tuyệt": 57681,
965
- "▁tuổi": 57726,
966
- "▁tăng": 58420,
967
- "▁tư": 57647,
968
- "▁tương": 57892,
969
- "▁tước": 58394,
970
- "▁tướng": 58471,
971
- "▁tường": 58421,
972
- "▁tưởng": 58293,
973
- "▁tượng": 58103,
974
- "▁tả": 57850,
975
- "▁tải": 58615,
976
- "▁tảng": 58443,
977
- "▁tấn": 58167,
978
- "▁tẩy": 58321,
979
- "▁tập": 58175,
980
- "▁tặng": 58424,
981
- "▁tế": 58065,
982
- "▁tệ": 57737,
983
- "▁tỉ": 58046,
984
- "▁tỉnh": 58085,
985
- "▁tị": 58202,
986
- "▁tịch": 57901,
987
  "▁tố": 58148,
988
- "▁tốc": 57965,
989
- "▁tối": 58364,
990
- "▁tốn": 58339,
991
- "▁tốt": 57889,
992
- "▁tồn": 57918,
993
- "▁tổ": 58675,
994
- "▁tổn": 58225,
995
- "▁tổng": 58025,
996
- "▁tộc": 58643,
997
- "▁tội": 58323,
998
- "▁tờ": 58267,
999
- "▁tứ": 57602,
1000
- "▁tức": 58611,
1001
- "▁từ": 58582,
1002
- "▁từng": 58375,
1003
- "▁tử": 58403,
1004
- "▁tự": 57745,
1005
- "▁tựa": 58482,
1006
- "▁tỷ": 57914,
1007
- "▁viết": 57924,
1008
- "▁viễn": 58408,
1009
- "▁việc": 58005,
1010
- "▁viện": 58040,
1011
- "▁vượng": 57584,
1012
- "▁vượt": 58486,
1013
- "▁vận": 58028,
1014
- "▁vật": 58125,
1015
- "▁vậy": 58168,
1016
- "▁vẹn": 58398,
1017
- "▁vẻ": 57718,
1018
- "▁về": 57983,
1019
- "▁vệ": 58504,
1020
- "▁vị": 58105,
1021
- "▁vỏ": 58460,
1022
- "▁vốn": 57705,
1023
- "▁vỗ": 58668,
1024
- "▁với": 57999,
1025
- "▁vời": 58372,
1026
- "▁vở": 57677,
1027
- "▁vợ": 57596,
1028
- "▁vợt": 57725,
1029
- "▁vừa": 57572,
1030
- "▁vững": 58328,
1031
- "▁vực": 57875,
1032
- "▁vựng": 58660,
1033
- "▁xuống": 57934,
1034
- "▁xưa": 58513,
1035
- "▁xưng": 58072,
1036
- "▁xưởng": 58533,
1037
- "▁xảy": 57560,
1038
- "▁xếp": 58624,
1039
- "▁xỉ": 57687,
1040
- "▁xứ": 58043,
1041
- "▁xử": 57784,
1042
- "▁yếu": 58619,
1043
- "▁Âm": 58154,
1044
- "▁Ân": 58452,
1045
- "▁Âu": 57923,
1046
- "▁Ô": 58250,
1047
- "▁Ông": 57936,
1048
- "▁Ý": 58329,
1049
- "▁Điền": 58521,
1050
- "▁Điều": 57660,
1051
- "▁Điểm": 57691,
1052
- "▁Điển": 57555,
1053
- "▁Đơn": 58597,
1054
- "▁Đường": 57912,
1055
- "▁Được": 58176,
1056
- "▁Đảng": 57938,
1057
- "▁Đảo": 58110,
1058
- "▁Đập": 58066,
1059
- "▁Đậu": 58173,
1060
- "▁Đằng": 57959,
1061
- "▁Đặc": 57916,
1062
- "▁Đặng": 58507,
1063
- "▁Đế": 57978,
1064
- "▁Đến": 58348,
1065
- "▁Đề": 58256,
1066
- "▁Để": 58578,
1067
- "▁Đệ": 57943,
1068
- "▁Địa": 57603,
1069
- "▁Đống": 58430,
1070
- "▁Đồ": 57576,
1071
- "▁Đồng": 57697,
1072
- "▁Đổi": 58522,
1073
- "▁Đỗ": 57692,
1074
- "▁Độ": 58304,
1075
- "▁Đội": 58172,
1076
- "▁Động": 58242,
1077
- "▁Đời": 57667,
1078
- "▁Đứa": 58281,
1079
- "▁Đừng": 57895,
1080
- "▁điền": 58010,
1081
- "▁điều": 57541,
1082
- "▁điểm": 58594,
1083
- "▁điển": 58510,
1084
- "▁điện": 57891,
1085
- "▁điệp": 58062,
1086
- "▁điệu": 57599,
1087
- "▁đu": 58550,
1088
- "▁đơn": 57826,
1089
- "▁đưa": 57824,
1090
- "▁đương": 58181,
1091
- "▁đường": 57574,
1092
- "▁được": 58054,
1093
- "▁đảm": 57858,
1094
- "▁đảng": 57607,
1095
- "▁đảo": 58580,
1096
- "▁đẩy": 58331,
1097
- "▁đập": 57651,
1098
- "▁đẳng": 58189,
1099
- "▁đặc": 58327,
1100
- "▁đặn": 57556,
1101
- "▁đặt": 57890,
1102
- "▁đẹp": 57652,
1103
- "▁đế": 57951,
1104
- "▁đếm": 58089,
1105
- "▁đến": 58200,
1106
- "▁đề": 58637,
1107
- "▁đều": 58547,
1108
- "▁để": 58236,
1109
- "▁đệ": 57568,
1110
- "▁đệm": 57659,
1111
- "▁đỉnh": 58508,
1112
- "▁địa": 57973,
1113
- "▁địch": 57608,
1114
- "▁định": 58526,
1115
- "▁đỏ": 57615,
1116
- "▁đốc": 57944,
1117
- "▁đối": 57675,
1118
- "▁đồ": 58159,
1119
- "▁đồn": 58379,
1120
- "▁đồng": 57791,
1121
- "▁đổ": 57571,
1122
- "▁đổi": 58639,
1123
- "▁độ": 58410,
1124
- "▁độc": 58523,
1125
- "▁đội": 58365,
1126
- "▁động": 58118,
1127
- "▁đột": 58628,
1128
- "▁đới": 57847,
1129
- "▁đời": 58653,
1130
- "▁đợi": 58363,
1131
- "▁đợt": 58642,
1132
- "▁đủ": 58211,
1133
- "▁đứa": 58262,
1134
- "▁đức": 58672,
1135
- "▁đứng": 58246,
1136
- "▁đừng": 58630,
1137
- "▁đực": 58229,
1138
- "▁Ơi": 57743,
1139
- "▁Ơn": 58479,
1140
- "▁ơn": 58059,
1141
- "▁Ước": 58434,
1142
- "▁ưa": 57570,
1143
- "▁ưng": 57893,
1144
- "▁ưu": 57822,
1145
- "▁ước": 58077,
1146
- "▁ướt": 57707,
1147
- "▁Ả": 58152,
1148
- "▁ải": 58083,
1149
- "▁ảnh": 58187,
1150
- "▁ẩm": 57665,
1151
- "▁ẩn": 58559,
1152
- "▁ỏi": 57874,
1153
- "▁ốc": 57982,
1154
- "▁ống": 57897,
1155
- "▁ồn": 58530,
1156
- "▁ổn": 58541,
1157
- "▁ở": 58237,
1158
- "▁ủng": 58431,
1159
- "▁ủy": 58603,
1160
- "▁ứng": 58466
1161
  }
 
1
  {
2
+ "!?": 57900,
3
+ "',": 58294,
4
+ "'.": 58483,
5
+ ".1": 57739,
6
+ "1": 58036,
7
+ "4.": 58078,
8
+ "49.": 57624,
9
+ "6,": 58472,
10
+ "6.": 57959,
11
+ "7.": 58608,
12
  "</s_answer>": 58679,
13
  "</s_question>": 58677,
14
  "<no/>": 57526,
 
19
  "<s_synthdog>": 57524,
20
  "<sep/>": 57522,
21
  "<yes/>": 57525,
22
+ "Bảo": 57752,
23
+ "Chỉ": 58636,
24
+ "Cảm": 58587,
25
+ "Dương": 58355,
26
+ "Hồ": 58458,
27
+ "Kh": 58506,
28
+ "Nguyễn": 58011,
29
+ "Nh": 58065,
30
+ "Như": 58301,
31
+ "Phương": 57706,
32
+ "Số": 58637,
33
+ "Thu": 57827,
34
+ "Từ": 58278,
35
+ "Việt": 57874,
36
+ "anh": 58293,
37
+ "chỉ": 57567,
38
+ "chị": 58445,
39
+ "cả": 57650,
40
+ "hiệu": 58187,
41
+ "hoặc": 58451,
42
+ "iếc": 57629,
43
+ "iến": 57789,
44
+ "iếng": 57546,
45
+ "iếp": 58326,
46
+ "iết": 58625,
47
+ "iếu": 57795,
48
+ "iềm": 58532,
49
+ "iền": 58119,
50
+ "iều": 58160,
51
+ "iểm": 57983,
52
+ "iển": 57790,
53
+ "iểu": 57685,
54
+ "iện": 57802,
55
+ "iệp": 58335,
56
+ "iệt": 58163,
57
+ "iệu": 58176,
58
+ "một": 57601,
59
+ "ngh": 58408,
60
+ "người": 57639,
61
+ "năm": 58415,
62
+ "số": 58552,
63
+ "tiền": 58182,
64
+ "trước": 58604,
65
+ "trừ": 57538,
66
+ "tuổi": 58207,
67
+ "từ": 58615,
68
+ "urn": 57664,
69
+ "uyền": 57780,
70
+ "uyển": 57763,
71
+ "uyện": 58000,
72
+ "và": 57960,
73
+ "với": 57937,
74
+ "Â": 57895,
75
+ "Ô": 58268,
76
+ "ành": 58588,
77
+ "òm": 57555,
78
+ "được": 58514,
79
+ "để": 58307,
80
+ "ơ": 58520,
81
+ "ơi": 57608,
82
+ "ơn": 58440,
83
+ "Ư": 58631,
84
+ "ư": 58419,
85
+ "ưa": 57774,
86
+ "ưng": 57907,
87
+ "ưu": 58602,
88
+ "ương": 58049,
89
+ "ước": 58253,
90
+ "ưới": 58675,
91
+ "ướng": 57637,
92
+ "ười": 58432,
93
+ "ườm": 57758,
94
+ "ườn": 58490,
95
+ "ường": 58425,
96
+ "ưỡi": 57730,
97
+ "ưỡng": 58457,
98
+ "ược": 57896,
99
+ "ượn": 58511,
100
+ "ượng": 57653,
101
+ "ượt": 57617,
102
+ "ại": 57644,
103
+ "ạo": 58118,
104
+ "ả": 57912,
105
+ "ải": 58667,
106
+ "ảm": 57813,
107
+ "ản": 58620,
108
+ "ảng": 58390,
109
+ "ảo": 58296,
110
+ "ảy": 57999,
111
+ "Ẩ": 57692,
112
+ "ẩu": 57536,
113
+ "ậc": 57600,
114
+ "ậm": 58058,
115
+ "ận": 58614,
116
+ "ập": 57908,
117
+ "ật": 58672,
118
+ "ậu": 58468,
119
+ "ằn": 57683,
120
+ "ằng": 58407,
121
+ "ẳn": 58147,
122
+ "ặng": 57760,
123
+ "ặp": 57884,
124
+ "ặt": 58257,
125
+ "ẹn": 57669,
126
+ "ẻ": 57860,
127
+ "ẽ": 58561,
128
+ "ế": 58035,
129
+ "ết": 58172,
130
+ "ề": 58484,
131
+ "ền": 58334,
132
+ "ển": 58101,
133
+ "ễ": 58213,
134
+ "ễn": 58384,
135
+ "ệ": 58427,
136
+ "ện": 58341,
137
+ "ỉ": 57599,
138
+ "ỉnh": 58453,
139
+ "ị": 58662,
140
+ "ịa": 58649,
141
+ "ịch": 57930,
142
+ "ịnh": 57835,
143
+ "ỏa": 57973,
144
+ "Ố": 58158,
145
+ "ốc": 58275,
146
+ "ối": 58272,
147
+ "ốn": 57543,
148
+ "ống": 57865,
149
+ "ốt": 58110,
150
+ "ồi": 58071,
151
+ "ồn": 58610,
152
+ "ồng": 58593,
153
+ "ổ": 58141,
154
+ "ổi": 57841,
155
+ "ổng": 57805,
156
+ "ỗ": 57654,
157
+ "ỗng": 57549,
158
+ "ộ": 58349,
159
+ "ộc": 58017,
160
+ "ội": 58459,
161
+ "ộng": 58034,
162
+ "ột": 57972,
163
+ "ớ": 58421,
164
+ "ới": 58337,
165
+ "ời": 58664,
166
+ "ở": 57740,
167
+ "ởi": 58579,
168
+ "ợ": 58315,
169
+ "ợn": 58201,
170
+ "ợp": 58449,
171
+ "ủ": 58238,
172
+ "ủi": 58409,
173
+ "ủng": 58063,
174
+ "ứ": 58651,
175
+ "ứa": 58448,
176
+ "ức": 58367,
177
+ "ừng": 57982,
178
+ "ử": 57994,
179
+ "ửa": 58153,
180
+ "ửu": 58324,
181
+ "ữ": 57967,
182
+ "ững": 58496,
183
+ "ữu": 58389,
184
+ "ự": 58053,
185
+ "ựa": 58040,
186
+ "ực": 57991,
187
+ "ựu": 58443,
188
+ "ỳ": 57595,
189
+ "ỵ": 58622,
190
+ "ỷ": 57852,
191
+ "▁\"\"": 58582,
192
+ "▁Biển": 57680,
193
+ "▁Biểu": 57954,
194
+ "▁Biệt": 58051,
195
+ "▁Buồn": 58089,
196
+ "▁Bản": 58611,
197
+ "▁Bảng": 57951,
198
+ "▁Bảy": 58666,
199
+ "▁Bằng": 57945,
200
+ "▁Bến": 57804,
201
+ "▁Bệnh": 57709,
202
+ "▁Bỉ": 58232,
203
+ "▁Bốn": 57800,
204
+ "▁Bồ": 57859,
205
+ "▁Bổ": 58167,
206
+ "▁Bộ": 57881,
207
+ "▁Bờ": 58545,
208
+ "▁Bức": 58181,
209
+ "▁Bữa": 57971,
210
+ "▁Chiếc": 57722,
211
+ "▁Chiếu": 58168,
212
+ "▁Chuyến": 58193,
213
+ "▁Chuyện": 57736,
214
+ "▁Chư": 58070,
215
+ "▁Chưa": 58467,
216
+ "▁Chương": 58279,
217
+ "▁Chẳng": 58043,
218
+ "▁Chế": 57993,
219
+ "▁Chết": 57751,
220
+ "▁Chỉ": 57564,
221
+ "▁Chợ": 58067,
222
+ "▁Chủ": 58222,
223
+ "▁Chức": 58184,
224
+ "▁Chứng": 57585,
225
+ "▁Chữ": 58383,
226
+ "▁Cuối": 58670,
227
+ "▁Cuốn": 58535,
228
+ "▁Cuộc": 58385,
229
+ "▁Cơ": 58350,
230
+ "▁Cơm": 58143,
231
+ "▁Cơn": 57943,
232
+ "▁Cương": 57643,
233
+ "▁Cưới": 57949,
234
+ "▁Cường": 58452,
235
+ "▁Cả": 57938,
236
+ "▁Cảm": 58473,
237
+ "▁Cảnh": 58126,
238
+ "▁Cẩm": 58501,
239
+ "▁Cập": 58185,
240
+ "▁Cậu": 58247,
241
+ "▁Cặp": 58308,
242
+ "▁Cỏ": 58513,
243
+ "▁Cổ": 58647,
244
+ "▁Cờ": 58006,
245
+ "▁Của": 58331,
246
+ "▁Cứng": 58332,
247
+ "▁Cứu": 57623,
248
+ "▁Cừ": 58586,
249
+ "▁Cửu": 58085,
250
+ "▁Cực": 58124,
251
+ "▁Diễm": 57646,
252
+ "▁Diện": 58450,
253
+ "▁Diệp": 58236,
254
+ "▁Diệu": 58344,
255
+ "▁Dư": 58629,
256
+ "▁Dương": 57955,
257
+ "▁Dưới": 58567,
258
+ "▁Dược": 57718,
259
+ "▁Dị": 58155,
260
+ "▁Dịch": 58336,
261
+ "▁Dự": 58038,
262
+ "▁Dựa": 57621,
263
+ "▁Giả": 58534,
264
+ "▁Giải": 58304,
265
+ "▁Giảm": 58117,
266
+ "▁Giới": 57670,
267
+ "▁Giờ": 57818,
268
+ "▁Giữa": 58583,
269
+ "▁Gương": 58539,
270
+ "▁Hiến": 57704,
271
+ "▁Hiếu": 58487,
272
+ "▁Hiền": 58269,
273
+ "▁Hiển": 57528,
274
+ "▁Hiểu": 57985,
275
+ "▁Hiện": 57819,
276
+ "▁Hiệp": 57723,
277
+ "▁Hiệu": 57539,
278
+ "▁Hoặc": 57731,
279
+ "▁Huyền": 57724,
280
+ "▁Huyện": 58088,
281
+ "▁Huế": 58392,
282
+ "▁Huệ": 58288,
283
+ "▁Huỳnh": 57902,
284
+ "▁Hơn": 57589,
285
+ "▁Hư": 58068,
286
+ "▁Hưng": 57767,
287
+ "▁Hương": 57824,
288
+ "▁Hải": 58378,
289
+ "▁Hảo": 57796,
290
+ "▁Hậu": 57591,
291
+ "▁Hằng": 58617,
292
+ "▁Hệ": 57771,
293
+ "▁Hổ": 58423,
294
+ "▁Hộ": 57569,
295
+ "▁Hội": 57810,
296
+ "▁Khuyến": 57605,
297
+ "▁Khương": 57783,
298
+ "▁Khải": 57689,
299
+ "▁Khẩu": 57786,
300
+ "▁Khủng": 58569,
301
+ "▁Kiến": 58627,
302
+ "▁Kiếp": 58280,
303
+ "▁Kiều": 58357,
304
+ "▁Kiểm": 57584,
305
+ "▁Kiểu": 58618,
306
+ "▁Kiện": 58476,
307
+ "▁Kiệt": 58248,
308
+ "▁Kẻ": 57537,
309
+ "▁Kế": 58645,
310
+ "▁Kết": 57742,
311
+ "▁Kể": 57866,
312
+ "▁Kịch": 58624,
313
+ "▁Kỷ": 57593,
314
+ "▁Liễu": 57889,
315
+ "▁Luật": 57941,
316
+ "▁Lưu": 57839,
317
+ "▁Lương": 58211,
318
+ "▁Lượng": 57684,
319
+ "▁Lệ": 57662,
320
+ "▁Lịch": 57777,
321
+ "▁Lỗ": 58025,
322
+ "▁Lỗi": 58190,
323
+ "▁Lộ": 58576,
324
+ "▁Lộc": 57888,
325
+ "▁Lớn": 58224,
326
+ "▁Lớp": 57834,
327
+ "▁Lời": 57568,
328
+ "▁Lợi": 58027,
329
+ "▁Lựa": 58333,
330
+ "▁Lực": 57616,
331
+ "▁Mơ": 57883,
332
+ "▁Mưa": 57996,
333
+ "▁Mười": 58083,
334
+ "▁Mật": 58556,
335
+ "▁Mặc": 57688,
336
+ "▁Mặt": 58054,
337
+ "▁Mẹ": 58482,
338
+ "▁Mễ": 57986,
339
+ "▁Mộng": 57712,
340
+ "▁Một": 57870,
341
+ "▁Mới": 57798,
342
+ "▁Mức": 57953,
343
+ "▁Ngh": 57821,
344
+ "▁Nghệ": 58076,
345
+ "▁Nghị": 57992,
346
+ "▁Nguyện": 58214,
347
+ "▁Nguyệt": 57541,
348
+ "▁Nguồn": 58359,
349
+ "▁Ngư": 58103,
350
+ "▁Ngưu": 58634,
351
+ "▁Nhiều": 58183,
352
+ "▁Nhiệt": 57649,
353
+ "▁Nhu": 58235,
354
+ "▁Nhuận": 57611,
355
+ "▁Như": 57913,
356
+ "▁Nhược": 57527,
357
+ "▁Nhận": 58100,
358
+ "▁Nhập": 57677,
359
+ "▁Nhật": 58524,
360
+ "▁Nhị": 58073,
361
+ "▁Nhỏ": 57701,
362
+ "▁Nhớ": 58507,
363
+ "▁Những": 58137,
364
+ "▁Niềm": 58260,
365
+ "▁Nơi": 57532,
366
+ "▁Nương": 57948,
367
+ "▁Nước": 58162,
368
+ "▁Nếu": 57784,
369
+ "▁Nổi": 58460,
370
+ "▁Nỗi": 57814,
371
+ "▁Nội": 58454,
372
+ "▁Nợ": 57836,
373
+ "▁Nửa": 57792,
374
+ "▁Nữ": 58486,
375
+ "▁Phương": 58456,
376
+ "▁Phước": 58197,
377
+ "▁Phượng": 58144,
378
+ "▁Phật": 57759,
379
+ "▁Phủ": 57812,
380
+ "▁Quyết": 57911,
381
+ "▁Quyền": 58657,
382
+ "▁Quả": 58256,
383
+ "▁Quản": 58305,
384
+ "▁Quận": 57634,
385
+ "▁Quốc": 58391,
386
+ "▁Quỳnh": 57901,
387
+ "▁Rồi": 57602,
388
+ "▁Rồng": 57940,
389
+ "▁Rừng": 58523,
390
+ "▁Sơ": 58131,
391
+ "▁Sư": 57939,
392
+ "▁Sản": 57976,
393
+ "▁Số": 57726,
394
+ "▁Sở": 58339,
395
+ "▁Sức": 57935,
396
+ "▁Sử": 57632,
397
+ "▁Sự": 57797,
398
+ "▁Thiết": 58640,
399
+ "▁Thiếu": 57863,
400
+ "▁Thiện": 57918,
401
+ "▁Thuận": 58479,
402
+ "▁Thư": 58105,
403
+ "▁Thương": 57582,
404
+ "▁Thường": 58531,
405
+ "▁Thượng": 58471,
406
+ "▁Thả": 57641,
407
+ "▁Thảm": 58422,
408
+ "▁Thảo": 57782,
409
+ "▁Thẩm": 57801,
410
+ "▁Thật": 58042,
411
+ "▁Thế": 58373,
412
+ "▁Thề": 58218,
413
+ "▁Thể": 57551,
414
+ "▁Thị": 57681,
415
+ "▁Thịnh": 58663,
416
+ "▁Thống": 58434,
417
+ "▁Thổ": 57579,
418
+ "▁Thủ": 57877,
419
+ "▁Thủy": 57581,
420
+ "▁Thứ": 58151,
421
+ "▁Thừa": 57958,
422
+ "▁Tiến": 58123,
423
+ "▁Tiếng": 58283,
424
+ "▁Tiết": 58555,
425
+ "▁Tiền": 57676,
426
+ "▁Tiểu": 58528,
427
+ "▁Triệu": 58022,
428
+ "▁Truyện": 58430,
429
+ "▁Trước": 58574,
430
+ "▁Trường": 57586,
431
+ "▁Trưởng": 58139,
432
+ "▁Trận": 57857,
433
+ "▁Trẻ": 57698,
434
+ "▁Trộm": 57947,
435
+ "▁Trời": 58656,
436
+ "▁Trở": 57592,
437
+ "▁Trực": 57944,
438
+ "▁Tuyến": 58114,
439
+ "▁Tuyết": 58474,
440
+ "▁Tuyền": 58492,
441
+ "▁Tuyển": 57606,
442
+ "▁Tuệ": 58199,
443
+ "▁Tuổi": 58370,
444
+ "▁TƯ": 58084,
445
+ "▁Tư": 58414,
446
+ "▁Tươi": 58097,
447
+ "▁Tương": 58439,
448
+ "▁Tường": 58072,
449
+ "▁Tưởng": 57769,
450
+ "▁Tải": 58032,
451
+ "▁Tẩy": 58028,
452
+ "▁Tập": 57840,
453
+ "▁Tỉ": 57552,
454
+ "▁Tỉnh": 58493,
455
+ "▁Tịch": 58016,
456
+ "▁Tịnh": 58560,
457
+ "▁Tố": 58464,
458
+ "▁Tốc": 58652,
459
+ "▁Tống": 58134,
460
+ "▁Tứ": 58154,
461
+ "▁Tức": 57558,
462
+ "▁Từ": 58505,
463
+ "▁Tử": 57710,
464
+ "▁Tự": 58598,
465
+ "▁Tỷ": 58609,
466
+ "▁VTV": 58031,
467
+ "▁Viễn": 58039,
468
+ "▁Việc": 58398,
469
+ "▁Viện": 57987,
470
+ "▁Vương": 57843,
471
+ "▁Vượng": 57570,
472
+ "▁Vật": 57822,
473
+ "▁Vậy": 58536,
474
+ "▁Về": 57975,
475
+ "▁Vệ": 58330,
476
+ "▁Vị": 58381,
477
+ "▁Vịt": 57590,
478
+ "▁Với": 57612,
479
+ "▁Xương": 58205,
480
+ "▁Xếp": 58225,
481
+ "▁Yến": 57957,
482
+ "▁Yếu": 58226,
483
+ "▁biến": 57828,
484
+ "▁biết": 57594,
485
+ "▁biển": 58111,
486
+ "▁biểu": 57697,
487
+ "▁biệt": 58056,
488
+ "▁buổi": 58621,
489
+ "▁buộc": 57892,
490
+ "▁bàn": 58179,
491
+ "▁bưu": 57749,
492
+ "▁bước": 58547,
493
+ "▁bướm": 57530,
494
+ "▁bản": 58551,
495
+ "▁bảng": 58203,
496
+ "▁bảo": 58488,
497
+ "▁bậc": 57533,
498
+ "▁bật": 58630,
499
+ "▁bằng": 58619,
500
+ "▁bến": 57872,
501
+ "▁bề": 57575,
502
+ "▁bền": 57535,
503
+ "▁bệ": 58276,
504
+ "▁bệnh": 58264,
505
+ "▁bị": 58475,
506
+ "▁bịp": 58461,
507
+ "▁bỏ": 57628,
508
+ "▁bố": 58431,
509
+ "▁bối": 58204,
510
+ "▁bốn": 58376,
511
+ "▁bổ": 58266,
512
+ "▁bộ": 58060,
513
+ "▁bộc": 57673,
514
+ "▁bởi": 58446,
515
+ "▁bức": 57596,
516
+ "▁chiếc": 58661,
517
+ "▁chiến": 58470,
518
+ "▁chiếu": 58298,
519
+ "▁chiều": 58328,
520
+ "▁chuyến": 58395,
521
+ "▁chuyển": 57640,
522
+ "▁chuyện": 57548,
523
+ "▁chuẩn": 58087,
524
+ "▁chuỗi": 58189,
525
+ "▁chuộng": 58107,
526
+ "▁chưa": 57909,
527
+ "▁chương": 58597,
528
+ "▁chậm": 58212,
529
+ "▁chẳng": 58387,
530
+ "▁chặt": 57672,
531
+ "▁chẽ": 58230,
532
+ "▁chế": 57540,
533
+ "▁chết": 58411,
534
+ "▁chỉ": 58410,
535
+ "▁chỉnh": 58044,
536
+ "▁chị": 58544,
537
+ "▁chịu": 57545,
538
+ "▁chống": 58237,
539
+ "▁chốt": 57932,
540
+ "▁chồng": 57659,
541
+ "▁chỗ": 58127,
542
+ "▁chở": 57725,
543
+ "▁chủ": 58311,
544
+ "▁chủng": 57695,
545
+ "▁chứa": 57604,
546
+ "▁chức": 58365,
547
+ "▁chứng": 58263,
548
+ "▁chữ": 57868,
549
+ "▁chữa": 57962,
550
+ "▁cuối": 57547,
551
+ "▁cuốn": 57631,
552
+ "▁cuộc": 58525,
553
+ "▁cơ": 58342,
554
+ "▁cơn": 58562,
555
+ "▁cư": 58518,
556
+ "▁cướp": 57690,
557
+ "▁cường": 58380,
558
+ "▁cược": 57894,
559
+ "▁cả": 57732,
560
+ "▁cải": 58174,
561
+ "▁cảm": 58113,
562
+ "▁cản": 58196,
563
+ "▁cảng": 57715,
564
+ "▁cảnh": 57614,
565
+ "▁cận": 58500,
566
+ "▁cập": 58515,
567
+ "▁cậu": 58442,
568
+ "▁cặp": 58091,
569
+ "▁cỏ": 58412,
570
+ "▁cố": 58120,
571
+ "▁cống": 58314,
572
+ "▁cổ": 58302,
573
+ "▁cổng": 58360,
574
+ "▁cộng": 57711,
575
+ "▁cột": 57686,
576
+ "▁cờ": 57635,
577
+ "▁của": 58258,
578
+ "▁củng": 58648,
579
+ "▁cứ": 58102,
580
+ "▁cứu": 58178,
581
+ "▁cừu": 57619,
582
+ "▁cử": 58312,
583
+ "▁cửa": 58188,
584
+ "▁cực": 57980,
585
+ "▁danh": 57778,
586
+ "▁diều": 57968,
587
+ "▁diễn": 57920,
588
+ "▁diện": 58194,
589
+ "▁diệt": 58517,
590
+ "▁diệu": 58125,
591
+ "▁duyệt": 58426,
592
+ "▁dương": 58220,
593
+ "▁dưới": 57964,
594
+ "▁dường": 58012,
595
+ "▁dưỡng": 57844,
596
+ "▁dải": 57919,
597
+ "▁dậy": 58558,
598
+ "▁dễ": 57620,
599
+ "▁dị": 58165,
600
+ "▁dịch": 58371,
601
+ "▁dỡ": 57648,
602
+ "▁dứt": 58227,
603
+ "▁dừng": 57699,
604
+ "▁dữ": 57529,
605
+ "▁dự": 57691,
606
+ "▁dựa": 58310,
607
+ "▁dựng": 57929,
608
+ "▁ghế": 58499,
609
+ "▁giả": 58014,
610
+ "▁giải": 58529,
611
+ "▁giảm": 58115,
612
+ "▁giản": 58612,
613
+ "▁giếng": 58003,
614
+ "▁giết": 57651,
615
+ "▁giống": 58368,
616
+ "▁giới": 57633,
617
+ "▁giờ": 58573,
618
+ "▁giời": 57717,
619
+ "▁giữ": 58023,
620
+ "▁giữa": 58571,
621
+ "▁gậy": 58156,
622
+ "▁gặp": 58138,
623
+ "▁gốc": 57583,
624
+ "▁gồm": 58209,
625
+ "▁gỗ": 57816,
626
+ "▁gộp": 57820,
627
+ "▁gỡ": 57652,
628
+ "▁gợi": 58086,
629
+ "▁gửi": 58270,
630
+ "▁hiến": 57636,
631
+ "▁hiền": 57729,
632
+ "▁hiểm": 57979,
633
+ "▁hiển": 58145,
634
+ "▁hiểu": 57873,
635
+ "▁hiện": 58570,
636
+ "▁hiệp": 57924,
637
+ "▁hiệu": 57610,
638
  "▁hoảng": 58026,
639
+ "▁hoặc": 57806,
640
+ "▁huyết": 58009,
641
+ "▁huyện": 58106,
642
+ "▁huống": 57625,
643
+ "▁huỳnh": 57833,
644
+ "▁hư": 57660,
645
+ "▁hương": 57925,
646
+ "▁hước": 57853,
647
+ "▁hướng": 57765,
648
+ "▁hưởng": 58358,
649
+ "▁hận": 58526,
650
+ "▁hậu": 58267,
651
+ "▁hẳn": 58382,
652
+ "▁hẹn": 58169,
653
+ "▁hết": 57842,
654
+ "▁hệ": 58064,
655
+ "▁hệt": 58104,
656
+ "▁hỏa": 58286,
657
+ "▁hỏi": 58140,
658
+ "▁hỏng": 58402,
659
+ "▁hố": 57745,
660
+ "▁hồ": 57876,
661
+ "▁hồi": 58508,
662
+ "▁hồn": 58216,
663
+ "▁hồng": 57668,
664
+ "▁hỗ": 57961,
665
+ "▁hộ": 58128,
666
+ "▁hội": 57794,
667
+ "▁hộp": 57934,
668
+ "▁hợp": 57942,
669
+ "▁hủy": 58173,
670
+ "▁hứng": 58297,
671
+ "▁hữu": 58568,
672
+ "▁khiến": 58290,
673
+ "▁khiếp": 58418,
674
+ "▁khiển": 58377,
675
+ "▁khoản": 57734,
676
+ "▁khoảng": 58550,
677
+ "▁khuyết": 58399,
678
+ "▁khả": 58469,
679
+ "▁khảo": 57571,
680
+ "▁khẩu": 58243,
681
+ "▁khẳng": 57848,
682
+ "▁khỏi": 58228,
683
+ "▁khối": 58600,
684
+ "▁khốn": 57875,
685
+ "▁khổ": 58082,
686
+ "▁khổng": 58585,
687
+ "▁khủng": 58285,
688
+ "▁khứ": 57997,
689
+ "▁kiến": 58632,
690
+ "▁kiềm": 57903,
691
+ "▁kiểm": 58353,
692
+ "▁kiểu": 57837,
693
+ "▁kiện": 57607,
694
+ "▁kẻ": 58037,
695
+ "▁kẻo": 57984,
696
+ "▁kế": 57855,
697
+ "▁kết": 58548,
698
+ "▁kể": 57851,
699
+ "▁kỉ": 57762,
700
+ "▁kịch": 57556,
701
+ "▁kỳ": 57981,
702
+ "▁kỷ": 58057,
703
+ "▁liền": 57910,
704
+ "▁liệt": 58540,
705
+ "▁liệu": 58052,
706
+ "▁luyến": 57879,
707
+ "▁luyện": 58069,
708
+ "▁luận": 57743,
709
+ "▁luật": 58537,
710
+ "▁luồng": 58164,
711
+ "▁lơ": 57665,
712
+ "▁lưu": 57714,
713
+ "▁lương": 57721,
714
+ "▁lưới": 58521,
715
+ "▁lưỡi": 58429,
716
+ "▁lược": 58478,
717
+ "▁lượng": 58327,
718
+ "▁lượt": 58435,
719
+ "▁lập": 58616,
720
+ "▁lặn": 58061,
721
+ "▁lặng": 58240,
722
+ "▁lặp": 58010,
723
+ "▁lẻ": 58099,
724
+ "▁lễ": 58404,
725
+ "▁lệ": 57661,
726
+ "▁lệch": 57770,
727
+ "▁lệnh": 58094,
728
+ "▁lịch": 57531,
729
+ "▁lốc": 58180,
730
+ "▁lối": 58489,
731
+ "▁lốp": 58406,
732
+ "▁lồ": 58029,
733
+ "▁lồng": 58564,
734
+ "▁lỗ": 57977,
735
+ "▁lỗi": 57915,
736
+ "▁lộ": 58208,
737
+ "▁lội": 58239,
738
+ "▁lớn": 57561,
739
+ "▁lớp": 58599,
740
+ "▁lời": 58613,
741
+ "▁lỡ": 58309,
742
+ "▁lợi": 57916,
743
+ "▁lừa": 58455,
744
+ "▁lửa": 57741,
745
+ "▁lựa": 58066,
746
+ "▁lực": 58195,
747
+ "▁miền": 57663,
748
+ "▁miễn": 58136,
749
+ "▁miện": 58660,
750
+ "▁miệng": 58494,
751
+ "▁muốn": 58626,
752
+ "▁muộn": 58503,
753
+ "▁mơ": 57693,
754
+ "▁mưa": 58090,
755
+ "▁mưu": 58347,
756
+ "▁mười": 57562,
757
+ "▁mượn": 58047,
758
+ "▁mượt": 58575,
759
+ "▁mảnh": 57550,
760
+ "▁mập": 58242,
761
+ "▁mật": 58149,
762
+ "▁mặc": 58265,
763
+ "▁mặt": 57862,
764
+ "▁mẹ": 58018,
765
+ "▁mẽ": 58374,
766
+ "▁mệnh": 58646,
767
+ "▁mỏng": 58639,
768
+ "▁mốc": 58465,
769
+ "▁mối": 57580,
770
+ "▁mỗi": 57893,
771
+ "▁mới": 57898,
772
+ "▁mở": 58481,
773
+ "▁mức": 57890,
774
+ "▁mừng": 58674,
775
+ "▁nghiệp": 58405,
776
+ "▁nghề": 57785,
777
+ "▁nghệ": 57923,
778
+ "▁nghị": 58289,
779
+ "▁nghịch": 58438,
780
+ "▁ngoặc": 57572,
781
+ "▁nguyền": 57588,
782
+ "▁nguyện": 57864,
783
+ "▁nguồn": 58642,
784
+ "▁nguội": 57799,
785
+ "▁người": 58048,
786
+ "▁ngược": 57727,
787
+ "▁ngập": 57573,
788
+ "▁ngốc": 57995,
789
+ "▁ngồi": 58673,
790
+ "▁ngờ": 57931,
791
+ "▁ngợi": 58233,
792
+ "▁ngừng": 57613,
793
+ "▁ngữ": 58364,
794
+ "▁ngựa": 57823,
795
+ "▁nh": 58249,
796
+ "▁nhiều": 58300,
797
+ "▁nhiệt": 57787,
798
+ "▁nhuận": 58059,
799
+ "▁như": 58142,
800
+ "▁nhưng": 57966,
801
+ "▁nhường": 58077,
802
+ "▁nhượng": 57846,
803
+ "▁nhảy": 57630,
804
+ "▁nhận": 58546,
805
+ "▁nhập": 57559,
806
+ "▁nhật": 58271,
807
+ "▁nhẹ": 58369,
808
+ "▁nhện": 58363,
809
+ "▁nhỏ": 58403,
810
+ "▁nhớ": 58217,
811
+ "▁những": 58303,
812
+ "▁niềm": 58252,
813
+ "▁nơi": 58581,
814
+ "▁nước": 58292,
815
+ "▁nản": 58200,
816
+ "▁nặng": 57682,
817
+ "▁nếu": 58512,
818
+ "▁nền": 57803,
819
+ "▁nối": 58317,
820
+ "▁nổi": 57756,
821
+ "▁nỗ": 58157,
822
+ "▁nội": 58522,
823
+ "▁nợ": 58306,
824
+ "▁nửa": 58584,
825
+ "▁nữ": 57845,
826
+ "▁nữa": 58244,
827
+ "▁phiếu": 58388,
828
+ "▁phương": 58019,
829
+ "▁phường": 58413,
830
+ "▁phượng": 58541,
831
+ "▁phải": 58401,
832
+ "▁phản": 58050,
833
+ "▁phẩm": 57618,
834
+ "▁phẩy": 58516,
835
+ "▁phận": 58329,
836
+ "▁phỏng": 58563,
837
+ "▁phố": 57656,
838
+ "▁phối": 58644,
839
+ "▁phổ": 58497,
840
+ "▁phủ": 57768,
841
+ "▁phức": 57899,
842
+ "▁quyết": 58348,
843
+ "▁quyền": 57667,
844
+ "▁quyển": 57956,
845
+ "▁quả": 58509,
846
+ "▁quản": 58020,
847
+ "▁quảng": 58219,
848
+ "▁quận": 58393,
849
+ "▁quốc": 57829,
850
+ "▁quỷ": 57826,
851
+ "▁rơi": 57854,
852
+ "▁rước": 57838,
853
+ "▁rưỡi": 57775,
854
+ "▁rải": 57755,
855
+ "▁rằng": 57808,
856
+ "▁rệt": 57642,
857
+ "▁rối": 58417,
858
+ "▁rồi": 58510,
859
+ "▁rồng": 57587,
860
+ "▁rổ": 58079,
861
+ "▁rỗng": 58274,
862
+ "▁rộng": 58108,
863
+ "▁rời": 58319,
864
+ "▁rủi": 58554,
865
+ "▁suốt": 58055,
866
+ "▁sơ": 58530,
867
+ "▁sơn": 57542,
868
+ "▁sư": 58323,
869
+ "▁sản": 57675,
870
+ "▁sẻ": 58671,
871
+ "▁sẽ": 57781,
872
+ "▁sỏi": 58231,
873
+ "▁số": 57707,
874
+ "▁sốc": 58095,
875
+ "▁sống": 57746,
876
+ "▁sốt": 58362,
877
+ "▁sớm": 57791,
878
+ "▁sở": 57963,
879
+ "▁sợ": 58396,
880
+ "▁sợi": 58132,
881
+ "▁sứ": 57658,
882
+ "▁sức": 57946,
883
+ "▁sử": 58592,
884
+ "▁sửa": 58603,
885
+ "▁sự": 57831,
886
+ "▁thiết": 58030,
887
+ "▁thiếu": 58463,
888
+ "▁thiểu": 57926,
889
+ "▁thiện": 58394,
890
  "▁thiệt": 57998,
891
+ "▁thiệu": 57702,
892
+ "▁thuyết": 57757,
893
+ "▁thuyền": 57811,
894
+ "▁thuận": 58041,
895
+ "▁thuật": 58177,
896
+ "▁thuế": 58210,
897
+ "▁thuốc": 57779,
898
+ "▁thuộc": 57776,
899
+ "▁thư": 57696,
900
+ "▁thương": 58428,
901
+ "▁thước": 57988,
902
+ "▁thường": 58001,
903
+ "▁thưởng": 57733,
904
+ "▁thượng": 57705,
905
+ "▁thả": 57609,
906
+ "▁thải": 58325,
907
+ "▁thảm": 58655,
908
+ "▁thảo": 58287,
909
+ "▁thập": 58591,
910
+ "▁thật": 58504,
911
+ "▁thắng": 57880,
912
+ "▁thẳng": 57885,
913
+ "▁thẻ": 57914,
914
+ "▁thế": 58606,
915
+ "▁thể": 58046,
916
+ "▁thị": 57989,
917
+ "▁thịnh": 58013,
918
+ "▁thống": 57666,
919
+ "▁thổ": 58146,
920
+ "▁thợ": 57565,
921
+ "▁thủ": 58441,
922
+ "▁thủng": 58262,
923
+ "▁thủy": 58320,
924
+ "▁thứ": 58623,
925
+ "▁thức": 58480,
926
+ "▁thừa": 57626,
927
+ "▁thử": 57719,
928
+ "▁tiến": 58255,
929
+ "▁tiếng": 57809,
930
+ "▁tiếp": 58081,
931
+ "▁tiết": 58605,
932
+ "▁tiềm": 57578,
933
+ "▁tiền": 57744,
934
+ "▁tiểu": 57576,
935
+ "▁tiễn": 58416,
936
+ "▁tiệc": 57766,
937
+ "▁tiện": 57928,
938
+ "▁toả": 58366,
939
+ "▁triều": 58109,
940
+ "▁triển": 58024,
941
+ "▁triệu": 57906,
942
+ "▁truyền": 58150,
943
+ "▁truyện": 58590,
944
+ "▁trưa": 58170,
945
+ "▁trưng": 57905,
946
+ "▁trước": 58658,
947
+ "▁trường": 57748,
948
+ "▁trưởng": 57574,
949
+ "▁trả": 58171,
950
+ "▁trải": 58549,
951
+ "▁trận": 57847,
952
+ "▁trẻ": 58519,
953
+ "▁trị": 57603,
954
+ "▁trồng": 58246,
955
+ "▁trội": 57687,
956
+ "▁trời": 58121,
957
+ "▁trở": 58538,
958
+ "▁trợ": 58557,
959
+ "▁trừ": 58351,
960
+ "▁trữ": 58447,
961
+ "▁trực": 58245,
962
+ "▁tuyến": 57566,
963
+ "▁tuyển": 58633,
964
+ "▁tuyệt": 58372,
965
+ "▁tuổi": 58080,
966
+ "▁tăng": 58005,
967
+ "▁tư": 58021,
968
+ "▁tương": 58527,
969
+ "▁tước": 58133,
970
+ "▁tướng": 58477,
971
+ "▁tường": 57645,
972
+ "▁tưởng": 58542,
973
+ "▁tượng": 58166,
974
+ "▁tả": 57753,
975
+ "▁tải": 57773,
976
+ "▁tảng": 58259,
977
+ "▁tấn": 57978,
978
+ "▁tẩy": 58553,
979
+ "▁tập": 58299,
980
+ "▁tặng": 58346,
981
+ "▁tế": 58491,
982
+ "▁tệ": 58122,
983
+ "▁tỉ": 57861,
984
+ "▁tỉnh": 58192,
985
+ "▁tị": 57671,
986
+ "▁tịch": 58284,
987
  "▁tố": 58148,
988
+ "▁tốc": 57793,
989
+ "▁tối": 57534,
990
+ "▁tốn": 57674,
991
+ "▁tốt": 58594,
992
+ "▁tồn": 58340,
993
+ "▁tổ": 58572,
994
+ "▁tổn": 57750,
995
+ "▁tổng": 58659,
996
+ "▁tộc": 58241,
997
+ "▁tội": 58635,
998
+ "▁tờ": 58281,
999
+ "▁tứ": 57647,
1000
+ "▁tức": 57703,
1001
+ "▁từ": 57598,
1002
+ "▁từng": 58354,
1003
+ "▁tử": 58595,
1004
+ "▁tự": 57638,
1005
+ "▁tựa": 57917,
1006
+ "▁tỷ": 57950,
1007
+ "▁viết": 57788,
1008
+ "▁viễn": 57708,
1009
+ "▁việc": 58338,
1010
+ "▁viện": 58092,
1011
+ "▁vượng": 58485,
1012
+ "▁vượt": 58343,
1013
+ "▁vận": 58062,
1014
+ "▁vật": 58250,
1015
+ "▁vậy": 57869,
1016
+ "▁vẹn": 58159,
1017
+ "▁vẻ": 57969,
1018
+ "▁về": 58223,
1019
+ "▁vệ": 58282,
1020
+ "▁vị": 57871,
1021
+ "▁vỏ": 58668,
1022
+ "▁vốn": 58313,
1023
+ "▁vỗ": 58221,
1024
+ "▁với": 57700,
1025
+ "▁vời": 58580,
1026
+ "▁vở": 57878,
1027
+ "▁vợ": 58653,
1028
+ "▁vợt": 58316,
1029
+ "▁vừa": 57850,
1030
+ "▁vững": 57936,
1031
+ "▁vực": 58665,
1032
+ "▁vựng": 58566,
1033
+ "▁xuống": 57560,
1034
+ "▁xưa": 57716,
1035
+ "▁xưng": 57679,
1036
+ "▁xưởng": 58654,
1037
+ "▁xảy": 58186,
1038
+ "▁xếp": 58116,
1039
+ "▁xỉ": 57627,
1040
+ "▁xứ": 58375,
1041
+ "▁xử": 58596,
1042
+ "▁yếu": 58273,
1043
+ "▁Âm": 57554,
1044
+ "▁Ân": 57738,
1045
+ "▁Âu": 58352,
1046
+ "▁Ô": 58462,
1047
+ "▁Ông": 57747,
1048
+ "▁Ý": 57856,
1049
+ "▁Điền": 58641,
1050
+ "▁Điều": 58495,
1051
+ "▁Điểm": 57897,
1052
+ "▁Điển": 58420,
1053
+ "▁Đơn": 58386,
1054
+ "▁Đường": 57720,
1055
+ "▁Được": 57858,
1056
+ "▁Đảng": 57728,
1057
+ "▁Đảo": 58215,
1058
+ "▁Đập": 58318,
1059
+ "▁Đậu": 58321,
1060
+ "▁Đằng": 58444,
1061
+ "▁Đặc": 57694,
1062
+ "▁Đặng": 58291,
1063
+ "▁Đế": 58607,
1064
+ "▁Đến": 57887,
1065
+ "▁Đề": 58466,
1066
+ "▁Để": 58433,
1067
+ "▁Đệ": 58601,
1068
+ "▁Địa": 57891,
1069
+ "▁Đống": 57965,
1070
+ "▁Đồ": 58015,
1071
+ "▁Đồng": 58191,
1072
+ "▁Đổi": 58074,
1073
+ "▁Đỗ": 57927,
1074
+ "▁Độ": 57904,
1075
+ "▁Đội": 58437,
1076
+ "▁Động": 57922,
1077
+ "▁Đời": 58643,
1078
+ "▁Đứa": 58098,
1079
+ "▁Đừng": 58007,
1080
+ "▁điền": 58436,
1081
+ "▁điều": 57713,
1082
+ "▁điểm": 57952,
1083
+ "▁điển": 58075,
1084
+ "▁điện": 57544,
1085
+ "▁điệp": 57807,
1086
+ "▁điệu": 58397,
1087
+ "▁đu": 57990,
1088
+ "▁đơn": 57832,
1089
+ "▁đưa": 58578,
1090
+ "▁đương": 57970,
1091
+ "▁đường": 58356,
1092
+ "▁được": 58295,
1093
+ "▁đảm": 58234,
1094
+ "▁đảng": 57655,
1095
+ "▁đảo": 58277,
1096
+ "▁đẩy": 57557,
1097
+ "▁đập": 58533,
1098
+ "▁đẳng": 58565,
1099
+ "▁đặc": 57577,
1100
+ "▁đặn": 58669,
1101
+ "▁đặt": 58093,
1102
+ "▁đẹp": 58202,
1103
+ "▁đế": 57772,
1104
+ "▁đếm": 57597,
1105
+ "▁đến": 58638,
1106
+ "▁đề": 58322,
1107
+ "▁đều": 58112,
1108
+ "▁để": 58008,
1109
+ "▁đệ": 58130,
1110
+ "▁đệm": 58229,
1111
+ "▁đỉnh": 57933,
1112
+ "▁địa": 58650,
1113
+ "▁địch": 57553,
1114
+ "▁định": 57921,
1115
+ "▁đỏ": 58577,
1116
+ "▁đốc": 58033,
1117
+ "▁đối": 57754,
1118
+ "▁đồ": 57849,
1119
+ "▁đồn": 58498,
1120
+ "▁đồng": 57830,
1121
+ "▁đổ": 57622,
1122
+ "▁đổi": 58400,
1123
+ "▁độ": 57825,
1124
+ "▁độc": 57886,
1125
+ "▁đội": 58175,
1126
+ "▁động": 58361,
1127
+ "▁đột": 58424,
1128
+ "▁đới": 57817,
1129
+ "▁đời": 58129,
1130
+ "▁đợi": 58251,
1131
+ "▁đợt": 58261,
1132
+ "▁đủ": 58002,
1133
+ "▁đứa": 57764,
1134
+ "▁đức": 58502,
1135
+ "▁đứng": 58096,
1136
+ "▁đừng": 57678,
1137
+ "▁đực": 58628,
1138
+ "▁Ơi": 57563,
1139
+ "▁Ơn": 58135,
1140
+ "▁ơn": 58045,
1141
+ "▁Ước": 57615,
1142
+ "▁ưa": 58559,
1143
+ "▁ưng": 57657,
1144
+ "▁ưu": 57815,
1145
+ "▁ước": 57737,
1146
+ "▁ướt": 57867,
1147
+ "▁Ả": 58254,
1148
+ "▁ải": 58161,
1149
+ "▁ảnh": 57735,
1150
+ "▁ẩm": 58543,
1151
+ "▁ẩn": 58004,
1152
+ "▁ỏi": 57882,
1153
+ "▁ốc": 58589,
1154
+ "▁ống": 58379,
1155
+ "▁ồn": 57761,
1156
+ "▁ổn": 57974,
1157
+ "▁ở": 58206,
1158
+ "▁ủng": 58345,
1159
+ "▁ủy": 58152,
1160
+ "▁ứng": 58198
1161
  }
tokenizer.json CHANGED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json CHANGED
The diff for this file is too large to render. See raw diff