anhdt-dsai-02 commited on
Commit
1b641a9
1 Parent(s): 8a98b91

End of training

Browse files
Files changed (49) hide show
  1. .config/.last_opt_in_prompt.yaml +1 -0
  2. .config/.last_survey_prompt.yaml +1 -0
  3. .config/.last_update_check.json +1 -0
  4. .config/active_config +1 -0
  5. .config/config_sentinel +0 -0
  6. .config/configurations/config_default +6 -0
  7. .config/default_configs.db +0 -0
  8. .config/gce +1 -0
  9. .config/logs/2023.12.19/14.19.39.750127.log +596 -0
  10. .config/logs/2023.12.19/14.20.06.327238.log +5 -0
  11. .config/logs/2023.12.19/14.20.16.265569.log +169 -0
  12. .config/logs/2023.12.19/14.20.25.266295.log +5 -0
  13. .config/logs/2023.12.19/14.20.35.154355.log +8 -0
  14. .config/logs/2023.12.19/14.20.35.996145.log +8 -0
  15. .gitattributes +4 -0
  16. CustomerReviewSentiment/README.md +6 -0
  17. CustomerReviewSentiment/XGBooost.ipynb +0 -0
  18. CustomerReviewSentiment/data/clean_data.csv +3 -0
  19. CustomerReviewSentiment/data/clean_data_v2.csv +0 -0
  20. CustomerReviewSentiment/data/clean_data_v3.csv +0 -0
  21. CustomerReviewSentiment/data/clean_data_v4.csv +0 -0
  22. CustomerReviewSentiment/data/rawdata.csv +3 -0
  23. CustomerReviewSentiment/data/spell_corrected_data.csv +0 -0
  24. CustomerReviewSentiment/process/300to50.ipynb +931 -0
  25. CustomerReviewSentiment/process/spell_correction.ipynb +535 -0
  26. CustomerReviewSentiment/test/test_cleaner.ipynb +421 -0
  27. CustomerReviewSentiment/utils/__pycache__/cleaner.cpython-311.pyc +0 -0
  28. CustomerReviewSentiment/utils/cleaner.py +15 -0
  29. CustomerReviewSentiment/vietnamese-stopwords.txt +1942 -0
  30. README.md +69 -0
  31. config.json +32 -0
  32. generation_config.json +6 -0
  33. model.safetensors +3 -0
  34. runs/Dec25_09-03-37_2e2d09babfa5/events.out.tfevents.1703495031.2e2d09babfa5.550.0 +3 -0
  35. runs/Dec25_09-03-37_2e2d09babfa5/events.out.tfevents.1703497791.2e2d09babfa5.550.1 +3 -0
  36. runs/Dec25_09-59-23_2e2d09babfa5/events.out.tfevents.1703498384.2e2d09babfa5.14497.0 +3 -0
  37. runs/Dec25_10-01-30_2e2d09babfa5/events.out.tfevents.1703498512.2e2d09babfa5.15098.0 +3 -0
  38. runs/Dec25_11-08-14_2e2d09babfa5/events.out.tfevents.1703502509.2e2d09babfa5.31685.0 +3 -0
  39. runs/Dec25_11-08-14_2e2d09babfa5/events.out.tfevents.1703505074.2e2d09babfa5.31685.1 +3 -0
  40. sample_data/README.md +19 -0
  41. sample_data/anscombe.json +49 -0
  42. sample_data/california_housing_test.csv +0 -0
  43. sample_data/california_housing_train.csv +0 -0
  44. sample_data/mnist_test.csv +3 -0
  45. sample_data/mnist_train_small.csv +3 -0
  46. special_tokens_map.json +103 -0
  47. tokenizer.json +0 -0
  48. tokenizer_config.json +902 -0
  49. training_args.bin +3 -0
.config/.last_opt_in_prompt.yaml ADDED
@@ -0,0 +1 @@
 
 
1
+ {}
.config/.last_survey_prompt.yaml ADDED
@@ -0,0 +1 @@
 
 
1
+ last_prompt_time: 1702995615.4104285
.config/.last_update_check.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {"last_update_check_time": 1702995624.560697, "last_update_check_revision": 20231208151900, "notifications": [], "last_nag_times": {}}
.config/active_config ADDED
@@ -0,0 +1 @@
 
 
1
+ default
.config/config_sentinel ADDED
File without changes
.config/configurations/config_default ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ [component_manager]
2
+ disable_update_check = true
3
+
4
+ [compute]
5
+ gce_metadata_read_timeout_sec = 0
6
+
.config/default_configs.db ADDED
Binary file (12.3 kB). View file
 
.config/gce ADDED
@@ -0,0 +1 @@
 
 
1
+ False
.config/logs/2023.12.19/14.19.39.750127.log ADDED
@@ -0,0 +1,596 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 2023-12-19 14:19:39,755 DEBUG root Loaded Command Group: ['gcloud', 'components']
2
+ 2023-12-19 14:19:39,759 DEBUG root Loaded Command Group: ['gcloud', 'components', 'update']
3
+ 2023-12-19 14:19:39,762 DEBUG root Running [gcloud.components.update] with arguments: [--allow-no-backup: "True", --compile-python: "True", --quiet: "True", COMPONENT-IDS:7: "['core', 'gcloud-deps', 'bq', 'gcloud', 'gcloud-crc32c', 'gsutil', 'anthoscli']"]
4
+ 2023-12-19 14:19:39,763 INFO ___FILE_ONLY___ Beginning update. This process may take several minutes.
5
+
6
+ 2023-12-19 14:19:51,811 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
7
+ 2023-12-19 14:19:51,895 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components-2.json HTTP/1.1" 200 214441
8
+ 2023-12-19 14:19:51,915 INFO ___FILE_ONLY___
9
+
10
+ 2023-12-19 14:19:51,916 INFO ___FILE_ONLY___
11
+ Your current Google Cloud CLI version is: 457.0.0
12
+
13
+ 2023-12-19 14:19:51,916 INFO ___FILE_ONLY___ Installing components from version: 457.0.0
14
+
15
+ 2023-12-19 14:19:51,916 INFO ___FILE_ONLY___
16
+
17
+ 2023-12-19 14:19:51,916 DEBUG root Chosen display Format:table[box,title="These components will be removed."](details.display_name:label=Name:align=left,version.version_string:label=Version:align=right,data.size.size(zero="",min=1048576):label=Size:align=right)
18
+ 2023-12-19 14:19:51,917 DEBUG root Chosen display Format:table[box,title="These components will be updated."](details.display_name:label=Name:align=left,version.version_string:label=Version:align=right,data.size.size(zero="",min=1048576):label=Size:align=right)
19
+ 2023-12-19 14:19:51,918 DEBUG root Chosen display Format:table[box,title="These components will be installed."](details.display_name:label=Name:align=left,version.version_string:label=Version:align=right,data.size.size(zero="",min=1048576):label=Size:align=right)
20
+ 2023-12-19 14:19:51,926 INFO ___FILE_ONLY___ ┌─────────────────────────────────────────────────────────────────────────────┐
21
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___
22
+
23
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___ │ These components will be installed. │
24
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___
25
+
26
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___ ├─────────────────────────────────────────────────────┬────────────┬──────────┤
27
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___
28
+
29
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___ │ Name │ Version │ Size │
30
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___
31
+
32
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___ ├─────────────────────────────────────────────────────┼────────────┼──────────┤
33
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___
34
+
35
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___ │
36
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___ BigQuery Command Line Tool
37
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___
38
+ 2023-12-19 14:19:51,927 INFO ___FILE_ONLY___ │
39
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___ 2.0.100
40
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___
41
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___ │
42
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___ 1.6 MiB
43
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___
44
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___ │
45
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___
46
+
47
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___ │
48
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___ BigQuery Command Line Tool (Platform Specific)
49
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___
50
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___ │
51
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___ 2.0.98
52
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___
53
+ 2023-12-19 14:19:51,928 INFO ___FILE_ONLY___ │
54
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___ < 1 MiB
55
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___
56
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___ │
57
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___
58
+
59
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___ │
60
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___ Bundled Python 3.11
61
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___
62
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___ │
63
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___ 3.11.6
64
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___
65
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___ │
66
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___ 73.7 MiB
67
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___
68
+ 2023-12-19 14:19:51,929 INFO ___FILE_ONLY___ │
69
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___
70
+
71
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___ │
72
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___ Cloud Storage Command Line Tool
73
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___
74
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___ │
75
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___ 5.27
76
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___
77
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___ │
78
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___ 11.3 MiB
79
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___
80
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___ │
81
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___
82
+
83
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___ │
84
+ 2023-12-19 14:19:51,930 INFO ___FILE_ONLY___ Cloud Storage Command Line Tool (Platform Specific)
85
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___
86
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___ │
87
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___ 5.27
88
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___
89
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___ │
90
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___ < 1 MiB
91
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___
92
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___ │
93
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___
94
+
95
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___ │
96
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___ Google Cloud CLI Core Libraries (Platform Specific)
97
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___
98
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___ │
99
+ 2023-12-19 14:19:51,931 INFO ___FILE_ONLY___ 2023.10.25
100
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___
101
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___ │
102
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___ < 1 MiB
103
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___
104
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___ │
105
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___
106
+
107
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___ │
108
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___ Google Cloud CRC32C Hash Tool
109
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___
110
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___ │
111
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___ 1.0.0
112
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___
113
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___ │
114
+ 2023-12-19 14:19:51,932 INFO ___FILE_ONLY___ 1.2 MiB
115
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___
116
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___ │
117
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___
118
+
119
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___ │
120
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___ anthoscli
121
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___
122
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___ │
123
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___ 0.2.45
124
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___
125
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___ │
126
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___ 68.9 MiB
127
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___
128
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___ │
129
+ 2023-12-19 14:19:51,933 INFO ___FILE_ONLY___
130
+
131
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___ │
132
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___ gcloud cli dependencies
133
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___
134
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___ │
135
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___ 2021.04.16
136
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___
137
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___ │
138
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___ < 1 MiB
139
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___
140
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___ │
141
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___
142
+
143
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___ └─────────────────────────────────────────────────────┴────────────┴──────────┘
144
+ 2023-12-19 14:19:51,934 INFO ___FILE_ONLY___
145
+
146
+ 2023-12-19 14:19:51,935 INFO ___FILE_ONLY___
147
+
148
+ 2023-12-19 14:19:51,939 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
149
+ 2023-12-19 14:19:52,025 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/RELEASE_NOTES HTTP/1.1" 200 1126280
150
+ 2023-12-19 14:19:52,096 INFO ___FILE_ONLY___ For the latest full release notes, please visit:
151
+ https://cloud.google.com/sdk/release_notes
152
+
153
+
154
+ 2023-12-19 14:19:52,099 INFO ___FILE_ONLY___ ╔═════════════════════════════════════════���══════════════════╗
155
+
156
+ 2023-12-19 14:19:52,099 INFO ___FILE_ONLY___ ╠═ Creating update staging area ═╣
157
+
158
+ 2023-12-19 14:19:52,099 INFO ___FILE_ONLY___ ╚
159
+ 2023-12-19 14:19:52,099 INFO ___FILE_ONLY___ ══════
160
+ 2023-12-19 14:19:52,099 INFO ___FILE_ONLY___ ══════
161
+ 2023-12-19 14:19:52,099 INFO ___FILE_ONLY___ ══════
162
+ 2023-12-19 14:19:52,441 INFO ___FILE_ONLY___ ═
163
+ 2023-12-19 14:19:52,499 INFO ___FILE_ONLY___ ═
164
+ 2023-12-19 14:19:52,553 INFO ___FILE_ONLY___ ═
165
+ 2023-12-19 14:19:52,621 INFO ___FILE_ONLY___ ═
166
+ 2023-12-19 14:19:52,684 INFO ___FILE_ONLY___ ═
167
+ 2023-12-19 14:19:52,741 INFO ___FILE_ONLY___ ═
168
+ 2023-12-19 14:19:52,810 INFO ___FILE_ONLY___ ═
169
+ 2023-12-19 14:19:52,885 INFO ___FILE_ONLY___ ═
170
+ 2023-12-19 14:19:52,950 INFO ___FILE_ONLY___ ═
171
+ 2023-12-19 14:19:53,010 INFO ___FILE_ONLY___ ═
172
+ 2023-12-19 14:19:53,058 INFO ___FILE_ONLY___ ═
173
+ 2023-12-19 14:19:53,119 INFO ___FILE_ONLY___ ═
174
+ 2023-12-19 14:19:53,178 INFO ___FILE_ONLY___ ═
175
+ 2023-12-19 14:19:53,239 INFO ___FILE_ONLY___ ═
176
+ 2023-12-19 14:19:53,297 INFO ___FILE_ONLY___ ═
177
+ 2023-12-19 14:19:53,462 INFO ___FILE_ONLY___ ═
178
+ 2023-12-19 14:19:53,532 INFO ___FILE_ONLY___ ═
179
+ 2023-12-19 14:19:53,588 INFO ___FILE_ONLY___ ═
180
+ 2023-12-19 14:19:53,705 INFO ___FILE_ONLY___ ═
181
+ 2023-12-19 14:19:53,734 INFO ___FILE_ONLY___ ═
182
+ 2023-12-19 14:19:53,765 INFO ___FILE_ONLY___ ═
183
+ 2023-12-19 14:19:53,811 INFO ___FILE_ONLY___ ═
184
+ 2023-12-19 14:19:53,844 INFO ___FILE_ONLY___ ═
185
+ 2023-12-19 14:19:53,874 INFO ___FILE_ONLY___ ═
186
+ 2023-12-19 14:19:53,933 INFO ___FILE_ONLY___ ═
187
+ 2023-12-19 14:19:54,009 INFO ___FILE_ONLY___ ═
188
+ 2023-12-19 14:19:54,142 INFO ___FILE_ONLY___ ═
189
+ 2023-12-19 14:19:54,270 INFO ___FILE_ONLY___ ═
190
+ 2023-12-19 14:19:54,318 INFO ___FILE_ONLY___ ═
191
+ 2023-12-19 14:19:54,368 INFO ___FILE_ONLY___ ═
192
+ 2023-12-19 14:19:54,433 INFO ___FILE_ONLY___ ═
193
+ 2023-12-19 14:19:54,485 INFO ___FILE_ONLY___ ═
194
+ 2023-12-19 14:19:54,534 INFO ___FILE_ONLY___ ═
195
+ 2023-12-19 14:19:54,584 INFO ___FILE_ONLY___ ═
196
+ 2023-12-19 14:19:54,642 INFO ___FILE_ONLY___ ═
197
+ 2023-12-19 14:19:54,694 INFO ___FILE_ONLY___ ═
198
+ 2023-12-19 14:19:54,743 INFO ___FILE_ONLY___ ═
199
+ 2023-12-19 14:19:54,829 INFO ___FILE_ONLY___ ═
200
+ 2023-12-19 14:19:54,892 INFO ___FILE_ONLY___ ═
201
+ 2023-12-19 14:19:54,949 INFO ___FILE_ONLY___ ═
202
+ 2023-12-19 14:19:54,994 INFO ___FILE_ONLY___ ═
203
+ 2023-12-19 14:19:55,044 INFO ___FILE_ONLY___ ═
204
+ 2023-12-19 14:19:55,044 INFO ___FILE_ONLY___ ╝
205
+
206
+ 2023-12-19 14:19:55,140 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
207
+
208
+ 2023-12-19 14:19:55,140 INFO ___FILE_ONLY___ ╠═ Installing: BigQuery Command Line Tool ═╣
209
+
210
+ 2023-12-19 14:19:55,140 INFO ___FILE_ONLY___ ╚
211
+ 2023-12-19 14:19:55,144 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
212
+ 2023-12-19 14:19:55,232 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-bq-20231208151900.tar.gz HTTP/1.1" 200 1676192
213
+ 2023-12-19 14:19:55,242 INFO ___FILE_ONLY___ ═
214
+ 2023-12-19 14:19:55,243 INFO ___FILE_ONLY___ ═
215
+ 2023-12-19 14:19:55,243 INFO ___FILE_ONLY___ ═
216
+ 2023-12-19 14:19:55,243 INFO ___FILE_ONLY___ ═
217
+ 2023-12-19 14:19:55,243 INFO ___FILE_ONLY___ ═
218
+ 2023-12-19 14:19:55,243 INFO ___FILE_ONLY___ ═
219
+ 2023-12-19 14:19:55,244 INFO ___FILE_ONLY___ ═
220
+ 2023-12-19 14:19:55,244 INFO ___FILE_ONLY___ ═
221
+ 2023-12-19 14:19:55,244 INFO ___FILE_ONLY___ ═
222
+ 2023-12-19 14:19:55,244 INFO ___FILE_ONLY___ ═
223
+ 2023-12-19 14:19:55,244 INFO ___FILE_ONLY___ ═
224
+ 2023-12-19 14:19:55,244 INFO ___FILE_ONLY___ ═
225
+ 2023-12-19 14:19:55,244 INFO ___FILE_ONLY___ ═
226
+ 2023-12-19 14:19:55,245 INFO ___FILE_ONLY___ ═
227
+ 2023-12-19 14:19:55,245 INFO ___FILE_ONLY___ ═
228
+ 2023-12-19 14:19:55,245 INFO ___FILE_ONLY___ ═
229
+ 2023-12-19 14:19:55,245 INFO ___FILE_ONLY___ ═
230
+ 2023-12-19 14:19:55,245 INFO ___FILE_ONLY___ ═
231
+ 2023-12-19 14:19:55,245 INFO ___FILE_ONLY___ ═
232
+ 2023-12-19 14:19:55,246 INFO ___FILE_ONLY___ ═
233
+ 2023-12-19 14:19:55,246 INFO ___FILE_ONLY___ ═
234
+ 2023-12-19 14:19:55,246 INFO ___FILE_ONLY___ ═
235
+ 2023-12-19 14:19:55,246 INFO ___FILE_ONLY___ ═
236
+ 2023-12-19 14:19:55,246 INFO ___FILE_ONLY___ ═
237
+ 2023-12-19 14:19:55,246 INFO ___FILE_ONLY___ ═
238
+ 2023-12-19 14:19:55,246 INFO ___FILE_ONLY___ ═
239
+ 2023-12-19 14:19:55,247 INFO ___FILE_ONLY___ ═
240
+ 2023-12-19 14:19:55,247 INFO ___FILE_ONLY___ ═
241
+ 2023-12-19 14:19:55,247 INFO ___FILE_ONLY___ ═
242
+ 2023-12-19 14:19:55,247 INFO ___FILE_ONLY___ ═
243
+ 2023-12-19 14:19:55,377 INFO ___FILE_ONLY___ ═
244
+ 2023-12-19 14:19:55,381 INFO ___FILE_ONLY___ ═
245
+ 2023-12-19 14:19:55,385 INFO ___FILE_ONLY___ ═
246
+ 2023-12-19 14:19:55,389 INFO ___FILE_ONLY___ ═
247
+ 2023-12-19 14:19:55,393 INFO ___FILE_ONLY___ ═
248
+ 2023-12-19 14:19:55,397 INFO ___FILE_ONLY___ ═
249
+ 2023-12-19 14:19:55,403 INFO ___FILE_ONLY___ ═
250
+ 2023-12-19 14:19:55,407 INFO ___FILE_ONLY___ ═
251
+ 2023-12-19 14:19:55,412 INFO ___FILE_ONLY___ ═
252
+ 2023-12-19 14:19:55,415 INFO ___FILE_ONLY___ ═
253
+ 2023-12-19 14:19:55,420 INFO ___FILE_ONLY___ ═
254
+ 2023-12-19 14:19:55,424 INFO ___FILE_ONLY___ ═
255
+ 2023-12-19 14:19:55,428 INFO ___FILE_ONLY___ ═
256
+ 2023-12-19 14:19:55,434 INFO ___FILE_ONLY___ ═
257
+ 2023-12-19 14:19:55,438 INFO ___FILE_ONLY___ ═
258
+ 2023-12-19 14:19:55,442 INFO ___FILE_ONLY___ ═
259
+ 2023-12-19 14:19:55,447 INFO ___FILE_ONLY___ ═
260
+ 2023-12-19 14:19:55,451 INFO ___FILE_ONLY___ ═
261
+ 2023-12-19 14:19:55,457 INFO ___FILE_ONLY___ ═
262
+ 2023-12-19 14:19:55,461 INFO ___FILE_ONLY___ ═
263
+ 2023-12-19 14:19:55,466 INFO ___FILE_ONLY___ ═
264
+ 2023-12-19 14:19:55,473 INFO ___FILE_ONLY___ ═
265
+ 2023-12-19 14:19:55,479 INFO ___FILE_ONLY___ ═
266
+ 2023-12-19 14:19:55,483 INFO ___FILE_ONLY___ ═
267
+ 2023-12-19 14:19:55,487 INFO ___FILE_ONLY___ ═
268
+ 2023-12-19 14:19:55,492 INFO ___FILE_ONLY___ ═
269
+ 2023-12-19 14:19:55,496 INFO ___FILE_ONLY___ ═
270
+ 2023-12-19 14:19:55,500 INFO ___FILE_ONLY___ ═
271
+ 2023-12-19 14:19:55,504 INFO ___FILE_ONLY___ ═
272
+ 2023-12-19 14:19:55,508 INFO ___FILE_ONLY___ ═
273
+ 2023-12-19 14:19:55,508 INFO ___FILE_ONLY___ ╝
274
+
275
+ 2023-12-19 14:19:55,524 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
276
+
277
+ 2023-12-19 14:19:55,524 INFO ___FILE_ONLY___ ╠═ Installing: BigQuery Command Line Tool (Platform Spec... ═╣
278
+
279
+ 2023-12-19 14:19:55,525 INFO ___FILE_ONLY___ ╚
280
+ 2023-12-19 14:19:55,529 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
281
+ 2023-12-19 14:19:55,611 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-bq-nix-20231025210228.tar.gz HTTP/1.1" 200 2019
282
+ 2023-12-19 14:19:55,611 INFO ___FILE_ONLY___ ══════════════════════════════
283
+ 2023-12-19 14:19:55,612 INFO ___FILE_ONLY___ ══════════════════════════════
284
+ 2023-12-19 14:19:55,613 INFO ___FILE_ONLY___ ╝
285
+
286
+ 2023-12-19 14:19:55,657 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
287
+
288
+ 2023-12-19 14:19:55,657 INFO ___FILE_ONLY___ ╠═ Installing: Bundled Python 3.11 ═╣
289
+
290
+ 2023-12-19 14:19:55,657 INFO ___FILE_ONLY___ ╚
291
+ 2023-12-19 14:19:55,661 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
292
+ 2023-12-19 14:19:55,747 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-bundled-python3-unix-linux-x86_64-20231110155547.tar.gz HTTP/1.1" 200 77282043
293
+ 2023-12-19 14:19:56,044 INFO ___FILE_ONLY___ ═
294
+ 2023-12-19 14:19:56,047 INFO ___FILE_ONLY___ ═
295
+ 2023-12-19 14:19:56,051 INFO ___FILE_ONLY___ ═
296
+ 2023-12-19 14:19:56,054 INFO ___FILE_ONLY___ ═
297
+ 2023-12-19 14:19:56,057 INFO ___FILE_ONLY___ ═
298
+ 2023-12-19 14:19:56,061 INFO ___FILE_ONLY___ ═
299
+ 2023-12-19 14:19:56,064 INFO ___FILE_ONLY___ ═
300
+ 2023-12-19 14:19:56,067 INFO ___FILE_ONLY___ ═
301
+ 2023-12-19 14:19:56,071 INFO ___FILE_ONLY___ ═
302
+ 2023-12-19 14:19:56,074 INFO ___FILE_ONLY___ ═
303
+ 2023-12-19 14:19:56,077 INFO ___FILE_ONLY___ ═
304
+ 2023-12-19 14:19:56,081 INFO ___FILE_ONLY___ ═
305
+ 2023-12-19 14:19:56,084 INFO ___FILE_ONLY___ ═
306
+ 2023-12-19 14:19:56,087 INFO ___FILE_ONLY___ ═
307
+ 2023-12-19 14:19:56,091 INFO ___FILE_ONLY___ ═
308
+ 2023-12-19 14:19:56,094 INFO ___FILE_ONLY___ ═
309
+ 2023-12-19 14:19:56,097 INFO ___FILE_ONLY___ ═
310
+ 2023-12-19 14:19:56,101 INFO ___FILE_ONLY___ ═
311
+ 2023-12-19 14:19:56,104 INFO ___FILE_ONLY___ ═
312
+ 2023-12-19 14:19:56,108 INFO ___FILE_ONLY___ ═
313
+ 2023-12-19 14:19:56,111 INFO ___FILE_ONLY___ ═
314
+ 2023-12-19 14:19:56,115 INFO ___FILE_ONLY___ ═
315
+ 2023-12-19 14:19:56,118 INFO ___FILE_ONLY___ ═
316
+ 2023-12-19 14:19:56,122 INFO ___FILE_ONLY___ ═
317
+ 2023-12-19 14:19:56,126 INFO ___FILE_ONLY___ ═
318
+ 2023-12-19 14:19:56,129 INFO ___FILE_ONLY___ ═
319
+ 2023-12-19 14:19:56,133 INFO ___FILE_ONLY___ ═
320
+ 2023-12-19 14:19:56,136 INFO ___FILE_ONLY___ ═
321
+ 2023-12-19 14:19:56,140 INFO ___FILE_ONLY___ ═
322
+ 2023-12-19 14:19:56,143 INFO ___FILE_ONLY___ ═
323
+ 2023-12-19 14:19:58,390 INFO ___FILE_ONLY___ ═
324
+ 2023-12-19 14:19:58,413 INFO ___FILE_ONLY___ ═
325
+ 2023-12-19 14:19:58,429 INFO ___FILE_ONLY___ ═
326
+ 2023-12-19 14:19:58,446 INFO ___FILE_ONLY___ ═
327
+ 2023-12-19 14:19:58,467 INFO ___FILE_ONLY___ ═
328
+ 2023-12-19 14:19:58,487 INFO ___FILE_ONLY___ ═
329
+ 2023-12-19 14:19:58,516 INFO ___FILE_ONLY___ ═
330
+ 2023-12-19 14:19:58,536 INFO ___FILE_ONLY___ ═
331
+ 2023-12-19 14:19:58,556 INFO ___FILE_ONLY___ ═
332
+ 2023-12-19 14:19:58,576 INFO ___FILE_ONLY___ ═
333
+ 2023-12-19 14:19:58,705 INFO ___FILE_ONLY___ ═
334
+ 2023-12-19 14:19:58,721 INFO ___FILE_ONLY___ ═
335
+ 2023-12-19 14:19:58,844 INFO ___FILE_ONLY___ ═
336
+ 2023-12-19 14:19:58,861 INFO ___FILE_ONLY___ ═
337
+ 2023-12-19 14:19:58,878 INFO ___FILE_ONLY___ ═
338
+ 2023-12-19 14:19:58,898 INFO ___FILE_ONLY___ ═
339
+ 2023-12-19 14:19:58,916 INFO ___FILE_ONLY___ ═
340
+ 2023-12-19 14:19:58,937 INFO ___FILE_ONLY___ ═
341
+ 2023-12-19 14:19:58,961 INFO ___FILE_ONLY___ ═
342
+ 2023-12-19 14:19:58,982 INFO ___FILE_ONLY___ ═
343
+ 2023-12-19 14:19:59,024 INFO ___FILE_ONLY___ ═
344
+ 2023-12-19 14:19:59,042 INFO ___FILE_ONLY___ ═
345
+ 2023-12-19 14:19:59,058 INFO ___FILE_ONLY___ ═
346
+ 2023-12-19 14:19:59,079 INFO ___FILE_ONLY___ ═
347
+ 2023-12-19 14:19:59,100 INFO ___FILE_ONLY___ ═
348
+ 2023-12-19 14:19:59,124 INFO ___FILE_ONLY___ ═
349
+ 2023-12-19 14:19:59,891 INFO ___FILE_ONLY___ ═
350
+ 2023-12-19 14:20:00,275 INFO ___FILE_ONLY___ ═
351
+ 2023-12-19 14:20:00,290 INFO ___FILE_ONLY___ ═
352
+ 2023-12-19 14:20:00,303 INFO ___FILE_ONLY___ ═
353
+ 2023-12-19 14:20:00,304 INFO ___FILE_ONLY___ ╝
354
+
355
+ 2023-12-19 14:20:00,372 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
356
+
357
+ 2023-12-19 14:20:00,372 INFO ___FILE_ONLY___ ╠═ Installing: Bundled Python 3.11 ═╣
358
+
359
+ 2023-12-19 14:20:00,372 INFO ___FILE_ONLY___ ╚
360
+ 2023-12-19 14:20:00,377 INFO ___FILE_ONLY___ ════════════════════════════════════════════════════════════
361
+ 2023-12-19 14:20:00,378 INFO ___FILE_ONLY___ ╝
362
+
363
+ 2023-12-19 14:20:00,380 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
364
+
365
+ 2023-12-19 14:20:00,380 INFO ___FILE_ONLY___ ╠═ Installing: Cloud Storage Command Line Tool ═╣
366
+
367
+ 2023-12-19 14:20:00,380 INFO ___FILE_ONLY___ ╚
368
+ 2023-12-19 14:20:00,384 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
369
+ 2023-12-19 14:20:00,471 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-gsutil-20231025210228.tar.gz HTTP/1.1" 200 11833901
370
+ 2023-12-19 14:20:00,513 INFO ___FILE_ONLY___ ═
371
+ 2023-12-19 14:20:00,514 INFO ___FILE_ONLY___ ═
372
+ 2023-12-19 14:20:00,514 INFO ___FILE_ONLY___ ═
373
+ 2023-12-19 14:20:00,515 INFO ___FILE_ONLY___ ═
374
+ 2023-12-19 14:20:00,516 INFO ___FILE_ONLY___ ═
375
+ 2023-12-19 14:20:00,516 INFO ___FILE_ONLY___ ═
376
+ 2023-12-19 14:20:00,517 INFO ___FILE_ONLY___ ═
377
+ 2023-12-19 14:20:00,517 INFO ___FILE_ONLY___ ═
378
+ 2023-12-19 14:20:00,518 INFO ___FILE_ONLY___ ═
379
+ 2023-12-19 14:20:00,519 INFO ___FILE_ONLY___ ═
380
+ 2023-12-19 14:20:00,519 INFO ___FILE_ONLY___ ═
381
+ 2023-12-19 14:20:00,520 INFO ___FILE_ONLY___ ═
382
+ 2023-12-19 14:20:00,520 INFO ___FILE_ONLY___ ═
383
+ 2023-12-19 14:20:00,521 INFO ___FILE_ONLY___ ═
384
+ 2023-12-19 14:20:00,522 INFO ___FILE_ONLY___ ═
385
+ 2023-12-19 14:20:00,522 INFO ___FILE_ONLY___ ═
386
+ 2023-12-19 14:20:00,523 INFO ___FILE_ONLY___ ═
387
+ 2023-12-19 14:20:00,523 INFO ___FILE_ONLY___ ═
388
+ 2023-12-19 14:20:00,524 INFO ___FILE_ONLY___ ═
389
+ 2023-12-19 14:20:00,525 INFO ___FILE_ONLY___ ═
390
+ 2023-12-19 14:20:00,525 INFO ___FILE_ONLY___ ═
391
+ 2023-12-19 14:20:00,526 INFO ___FILE_ONLY___ ═
392
+ 2023-12-19 14:20:00,526 INFO ___FILE_ONLY___ ═
393
+ 2023-12-19 14:20:00,527 INFO ___FILE_ONLY___ ═
394
+ 2023-12-19 14:20:00,528 INFO ___FILE_ONLY___ ═
395
+ 2023-12-19 14:20:00,528 INFO ___FILE_ONLY___ ═
396
+ 2023-12-19 14:20:00,529 INFO ___FILE_ONLY___ ═
397
+ 2023-12-19 14:20:00,530 INFO ___FILE_ONLY___ ═
398
+ 2023-12-19 14:20:00,530 INFO ___FILE_ONLY___ ═
399
+ 2023-12-19 14:20:00,531 INFO ___FILE_ONLY___ ═
400
+ 2023-12-19 14:20:01,318 INFO ___FILE_ONLY___ ═
401
+ 2023-12-19 14:20:01,358 INFO ___FILE_ONLY___ ═
402
+ 2023-12-19 14:20:01,389 INFO ___FILE_ONLY___ ═
403
+ 2023-12-19 14:20:01,421 INFO ___FILE_ONLY___ ═
404
+ 2023-12-19 14:20:01,450 INFO ___FILE_ONLY___ ═
405
+ 2023-12-19 14:20:01,479 INFO ___FILE_ONLY___ ═
406
+ 2023-12-19 14:20:01,501 INFO ___FILE_ONLY___ ═
407
+ 2023-12-19 14:20:01,522 INFO ___FILE_ONLY___ ═
408
+ 2023-12-19 14:20:01,546 INFO ___FILE_ONLY___ ═
409
+ 2023-12-19 14:20:01,569 INFO ___FILE_ONLY___ ═
410
+ 2023-12-19 14:20:01,593 INFO ___FILE_ONLY___ ═
411
+ 2023-12-19 14:20:01,614 INFO ___FILE_ONLY___ ═
412
+ 2023-12-19 14:20:01,647 INFO ___FILE_ONLY___ ═
413
+ 2023-12-19 14:20:01,671 INFO ___FILE_ONLY___ ═
414
+ 2023-12-19 14:20:01,706 INFO ___FILE_ONLY___ ═
415
+ 2023-12-19 14:20:01,737 INFO ___FILE_ONLY___ ═
416
+ 2023-12-19 14:20:01,770 INFO ___FILE_ONLY___ ═
417
+ 2023-12-19 14:20:01,803 INFO ___FILE_ONLY___ ═
418
+ 2023-12-19 14:20:01,825 INFO ___FILE_ONLY___ ═
419
+ 2023-12-19 14:20:01,850 INFO ___FILE_ONLY___ ═
420
+ 2023-12-19 14:20:01,874 INFO ___FILE_ONLY___ ═
421
+ 2023-12-19 14:20:01,898 INFO ___FILE_ONLY___ ═
422
+ 2023-12-19 14:20:01,922 INFO ___FILE_ONLY___ ═
423
+ 2023-12-19 14:20:01,948 INFO ___FILE_ONLY___ ═
424
+ 2023-12-19 14:20:01,970 INFO ___FILE_ONLY___ ═
425
+ 2023-12-19 14:20:02,023 INFO ___FILE_ONLY___ ═
426
+ 2023-12-19 14:20:02,052 INFO ___FILE_ONLY___ ═
427
+ 2023-12-19 14:20:02,080 INFO ___FILE_ONLY___ ═
428
+ 2023-12-19 14:20:02,112 INFO ___FILE_ONLY___ ═
429
+ 2023-12-19 14:20:02,135 INFO ___FILE_ONLY___ ═
430
+ 2023-12-19 14:20:02,135 INFO ___FILE_ONLY___ ╝
431
+
432
+ 2023-12-19 14:20:02,217 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
433
+
434
+ 2023-12-19 14:20:02,217 INFO ___FILE_ONLY___ ╠═ Installing: Cloud Storage Command Line Tool (Platform... ═╣
435
+
436
+ 2023-12-19 14:20:02,218 INFO ___FILE_ONLY___ ╚
437
+ 2023-12-19 14:20:02,222 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
438
+ 2023-12-19 14:20:02,308 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-gsutil-nix-20231025210228.tar.gz HTTP/1.1" 200 2035
439
+ 2023-12-19 14:20:02,309 INFO ___FILE_ONLY___ ══════════════════════════════
440
+ 2023-12-19 14:20:02,310 INFO ___FILE_ONLY___ ══════════════════════════════
441
+ 2023-12-19 14:20:02,310 INFO ___FILE_ONLY___ ╝
442
+
443
+ 2023-12-19 14:20:02,320 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
444
+
445
+ 2023-12-19 14:20:02,321 INFO ___FILE_ONLY___ ╠═ Installing: Default set of gcloud commands ═╣
446
+
447
+ 2023-12-19 14:20:02,321 INFO ___FILE_ONLY___ ╚
448
+ 2023-12-19 14:20:02,326 INFO ___FILE_ONLY___ ════════════════════════════════════════════════════════════
449
+ 2023-12-19 14:20:02,327 INFO ___FILE_ONLY___ ╝
450
+
451
+ 2023-12-19 14:20:02,329 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
452
+
453
+ 2023-12-19 14:20:02,329 INFO ___FILE_ONLY___ ╠═ Installing: Google Cloud CLI Core Libraries (Platform... ═╣
454
+
455
+ 2023-12-19 14:20:02,329 INFO ___FILE_ONLY___ ╚
456
+ 2023-12-19 14:20:02,333 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
457
+ 2023-12-19 14:20:02,427 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-core-nix-20231025210228.tar.gz HTTP/1.1" 200 2402
458
+ 2023-12-19 14:20:02,428 INFO ___FILE_ONLY___ ══════════════════════════════
459
+ 2023-12-19 14:20:02,429 INFO ___FILE_ONLY___ ═══════════════
460
+ 2023-12-19 14:20:02,429 INFO ___FILE_ONLY___ ═══════════════
461
+ 2023-12-19 14:20:02,429 INFO ___FILE_ONLY___ ╝
462
+
463
+ 2023-12-19 14:20:02,440 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
464
+
465
+ 2023-12-19 14:20:02,440 INFO ___FILE_ONLY___ ╠═ Installing: Google Cloud CRC32C Hash Tool ═╣
466
+
467
+ 2023-12-19 14:20:02,440 INFO ___FILE_ONLY___ ╚
468
+ 2023-12-19 14:20:02,444 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
469
+ 2023-12-19 14:20:02,531 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-gcloud-crc32c-linux-x86_64-20231023224440.tar.gz HTTP/1.1" 200 1289207
470
+ 2023-12-19 14:20:02,542 INFO ___FILE_ONLY___ ═
471
+ 2023-12-19 14:20:02,542 INFO ___FILE_ONLY___ ═
472
+ 2023-12-19 14:20:02,542 INFO ___FILE_ONLY___ ═
473
+ 2023-12-19 14:20:02,542 INFO ___FILE_ONLY___ ═
474
+ 2023-12-19 14:20:02,542 INFO ___FILE_ONLY___ ═
475
+ 2023-12-19 14:20:02,542 INFO ___FILE_ONLY___ ═
476
+ 2023-12-19 14:20:02,543 INFO ___FILE_ONLY___ ═
477
+ 2023-12-19 14:20:02,543 INFO ___FILE_ONLY___ ═
478
+ 2023-12-19 14:20:02,543 INFO ___FILE_ONLY___ ═
479
+ 2023-12-19 14:20:02,543 INFO ___FILE_ONLY___ ═
480
+ 2023-12-19 14:20:02,543 INFO ___FILE_ONLY___ ═
481
+ 2023-12-19 14:20:02,543 INFO ___FILE_ONLY___ ═
482
+ 2023-12-19 14:20:02,543 INFO ___FILE_ONLY___ ═
483
+ 2023-12-19 14:20:02,544 INFO ___FILE_ONLY___ ═
484
+ 2023-12-19 14:20:02,544 INFO ___FILE_ONLY___ ═
485
+ 2023-12-19 14:20:02,544 INFO ___FILE_ONLY___ ═
486
+ 2023-12-19 14:20:02,544 INFO ___FILE_ONLY___ ═
487
+ 2023-12-19 14:20:02,544 INFO ___FILE_ONLY___ ═
488
+ 2023-12-19 14:20:02,544 INFO ___FILE_ONLY___ ═
489
+ 2023-12-19 14:20:02,544 INFO ___FILE_ONLY___ ═
490
+ 2023-12-19 14:20:02,544 INFO ___FILE_ONLY___ ═
491
+ 2023-12-19 14:20:02,545 INFO ___FILE_ONLY___ ═
492
+ 2023-12-19 14:20:02,545 INFO ___FILE_ONLY___ ═
493
+ 2023-12-19 14:20:02,545 INFO ___FILE_ONLY___ ═
494
+ 2023-12-19 14:20:02,545 INFO ___FILE_ONLY___ ═
495
+ 2023-12-19 14:20:02,545 INFO ___FILE_ONLY___ ═
496
+ 2023-12-19 14:20:02,545 INFO ___FILE_ONLY___ ═
497
+ 2023-12-19 14:20:02,545 INFO ___FILE_ONLY___ ═
498
+ 2023-12-19 14:20:02,546 INFO ___FILE_ONLY___ ═
499
+ 2023-12-19 14:20:02,546 INFO ___FILE_ONLY___ ═
500
+ 2023-12-19 14:20:02,581 INFO ___FILE_ONLY___ ═══════════════
501
+ 2023-12-19 14:20:02,582 INFO ___FILE_ONLY___ ═══════════════
502
+ 2023-12-19 14:20:02,582 INFO ___FILE_ONLY___ ╝
503
+
504
+ 2023-12-19 14:20:02,593 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
505
+
506
+ 2023-12-19 14:20:02,593 INFO ___FILE_ONLY___ ╠═ Installing: Google Cloud CRC32C Hash Tool ═╣
507
+
508
+ 2023-12-19 14:20:02,593 INFO ___FILE_ONLY___ ╚
509
+ 2023-12-19 14:20:02,599 INFO ___FILE_ONLY___ ════════════════════════════════════════════════════════════
510
+ 2023-12-19 14:20:02,599 INFO ___FILE_ONLY___ ╝
511
+
512
+ 2023-12-19 14:20:02,601 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
513
+
514
+ 2023-12-19 14:20:02,601 INFO ___FILE_ONLY___ ╠═ Installing: anthoscli ═╣
515
+
516
+ 2023-12-19 14:20:02,601 INFO ___FILE_ONLY___ ╚
517
+ 2023-12-19 14:20:02,606 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
518
+ 2023-12-19 14:20:02,694 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-anthoscli-linux-x86_64-20231201141418.tar.gz HTTP/1.1" 200 72274029
519
+ 2023-12-19 14:20:02,975 INFO ___FILE_ONLY___ ═
520
+ 2023-12-19 14:20:02,978 INFO ___FILE_ONLY___ ═
521
+ 2023-12-19 14:20:02,981 INFO ___FILE_ONLY___ ═
522
+ 2023-12-19 14:20:02,985 INFO ___FILE_ONLY___ ═
523
+ 2023-12-19 14:20:02,988 INFO ___FILE_ONLY___ ═
524
+ 2023-12-19 14:20:02,991 INFO ___FILE_ONLY___ ═
525
+ 2023-12-19 14:20:02,994 INFO ___FILE_ONLY___ ═
526
+ 2023-12-19 14:20:02,997 INFO ___FILE_ONLY___ ═
527
+ 2023-12-19 14:20:03,000 INFO ___FILE_ONLY___ ═
528
+ 2023-12-19 14:20:03,004 INFO ___FILE_ONLY___ ═
529
+ 2023-12-19 14:20:03,007 INFO ___FILE_ONLY___ ═
530
+ 2023-12-19 14:20:03,010 INFO ___FILE_ONLY___ ═
531
+ 2023-12-19 14:20:03,013 INFO ___FILE_ONLY___ ═
532
+ 2023-12-19 14:20:03,016 INFO ___FILE_ONLY___ ═
533
+ 2023-12-19 14:20:03,019 INFO ___FILE_ONLY___ ═
534
+ 2023-12-19 14:20:03,023 INFO ___FILE_ONLY___ ═
535
+ 2023-12-19 14:20:03,026 INFO ___FILE_ONLY___ ═
536
+ 2023-12-19 14:20:03,029 INFO ___FILE_ONLY___ ═
537
+ 2023-12-19 14:20:03,033 INFO ___FILE_ONLY___ ═
538
+ 2023-12-19 14:20:03,036 INFO ___FILE_ONLY___ ═
539
+ 2023-12-19 14:20:03,039 INFO ___FILE_ONLY___ ═
540
+ 2023-12-19 14:20:03,043 INFO ___FILE_ONLY___ ═
541
+ 2023-12-19 14:20:03,046 INFO ___FILE_ONLY___ ═
542
+ 2023-12-19 14:20:03,049 INFO ___FILE_ONLY___ ═
543
+ 2023-12-19 14:20:03,053 INFO ___FILE_ONLY___ ═
544
+ 2023-12-19 14:20:03,056 INFO ___FILE_ONLY___ ═
545
+ 2023-12-19 14:20:03,059 INFO ___FILE_ONLY___ ═
546
+ 2023-12-19 14:20:03,063 INFO ___FILE_ONLY___ ═
547
+ 2023-12-19 14:20:03,066 INFO ___FILE_ONLY___ ═
548
+ 2023-12-19 14:20:03,069 INFO ___FILE_ONLY___ ═
549
+ 2023-12-19 14:20:05,451 INFO ___FILE_ONLY___ ══════════
550
+ 2023-12-19 14:20:05,457 INFO ___FILE_ONLY___ ═════════
551
+ 2023-12-19 14:20:05,487 INFO ___FILE_ONLY___ ═══════════
552
+ 2023-12-19 14:20:05,487 INFO ___FILE_ONLY___ ╝
553
+
554
+ 2023-12-19 14:20:05,514 INFO ___FILE_ONLY___ ╔═════════════════════════════════��══════════════════════════╗
555
+
556
+ 2023-12-19 14:20:05,514 INFO ___FILE_ONLY___ ╠═ Installing: anthoscli ═╣
557
+
558
+ 2023-12-19 14:20:05,514 INFO ___FILE_ONLY___ ╚
559
+ 2023-12-19 14:20:05,520 INFO ___FILE_ONLY___ ════════════════════════════════════════════════════════════
560
+ 2023-12-19 14:20:05,520 INFO ___FILE_ONLY___ ╝
561
+
562
+ 2023-12-19 14:20:05,522 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
563
+
564
+ 2023-12-19 14:20:05,522 INFO ___FILE_ONLY___ ╠═ Installing: gcloud cli dependencies ═╣
565
+
566
+ 2023-12-19 14:20:05,522 INFO ___FILE_ONLY___ ╚
567
+ 2023-12-19 14:20:05,527 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
568
+ 2023-12-19 14:20:05,619 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-gcloud-deps-linux-x86_64-20210416153011.tar.gz HTTP/1.1" 200 104
569
+ 2023-12-19 14:20:05,620 INFO ___FILE_ONLY___ ══════════════════════════════
570
+ 2023-12-19 14:20:05,620 INFO ___FILE_ONLY___ ══════════════════════════════
571
+ 2023-12-19 14:20:05,620 INFO ___FILE_ONLY___ ╝
572
+
573
+ 2023-12-19 14:20:05,631 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
574
+
575
+ 2023-12-19 14:20:05,631 INFO ___FILE_ONLY___ ╠═ Creating backup and activating new installation ═╣
576
+
577
+ 2023-12-19 14:20:05,631 INFO ___FILE_ONLY___ ╚
578
+ 2023-12-19 14:20:05,631 DEBUG root Attempting to move directory [/tools/google-cloud-sdk] to [/tools/google-cloud-sdk.staging/.install/.backup]
579
+ 2023-12-19 14:20:05,631 INFO ___FILE_ONLY___ ══════════════════════════════
580
+ 2023-12-19 14:20:05,631 DEBUG root Attempting to move directory [/tools/google-cloud-sdk.staging] to [/tools/google-cloud-sdk]
581
+ 2023-12-19 14:20:05,631 INFO ___FILE_ONLY___ ══════════════════════════════
582
+ 2023-12-19 14:20:05,631 INFO ___FILE_ONLY___ ╝
583
+
584
+ 2023-12-19 14:20:05,636 DEBUG root Updating notification cache...
585
+ 2023-12-19 14:20:05,637 INFO ___FILE_ONLY___
586
+
587
+ 2023-12-19 14:20:05,639 INFO ___FILE_ONLY___ Performing post processing steps...
588
+ 2023-12-19 14:20:05,639 DEBUG root Executing command: ['python3', '-S', '/tools/google-cloud-sdk/lib/gcloud.py', 'components', 'post-process']
589
+ 2023-12-19 14:20:15,322 DEBUG ___FILE_ONLY___
590
+ 2023-12-19 14:20:15,322 DEBUG ___FILE_ONLY___
591
+ 2023-12-19 14:20:15,404 INFO ___FILE_ONLY___
592
+ Update done!
593
+
594
+
595
+ 2023-12-19 14:20:15,409 DEBUG root Chosen display Format:none
596
+ 2023-12-19 14:20:15,409 INFO root Display format: "none"
.config/logs/2023.12.19/14.20.06.327238.log ADDED
@@ -0,0 +1,5 @@
 
 
 
 
 
 
1
+ 2023-12-19 14:20:06,328 DEBUG root Loaded Command Group: ['gcloud', 'components']
2
+ 2023-12-19 14:20:06,330 DEBUG root Loaded Command Group: ['gcloud', 'components', 'post_process']
3
+ 2023-12-19 14:20:06,333 DEBUG root Running [gcloud.components.post-process] with arguments: []
4
+ 2023-12-19 14:20:15,176 DEBUG root Chosen display Format:none
5
+ 2023-12-19 14:20:15,177 INFO root Display format: "none"
.config/logs/2023.12.19/14.20.16.265569.log ADDED
@@ -0,0 +1,169 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 2023-12-19 14:20:16,266 DEBUG root Loaded Command Group: ['gcloud', 'components']
2
+ 2023-12-19 14:20:16,269 DEBUG root Loaded Command Group: ['gcloud', 'components', 'update']
3
+ 2023-12-19 14:20:16,272 DEBUG root Running [gcloud.components.update] with arguments: [--quiet: "True", COMPONENT-IDS:8: "['gcloud', 'core', 'bq', 'gsutil', 'compute', 'preview', 'alpha', 'beta']"]
4
+ 2023-12-19 14:20:16,273 INFO ___FILE_ONLY___ Beginning update. This process may take several minutes.
5
+
6
+ 2023-12-19 14:20:16,279 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
7
+ 2023-12-19 14:20:16,368 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components-2.json HTTP/1.1" 200 214441
8
+ 2023-12-19 14:20:16,391 WARNING root Component [compute] no longer exists.
9
+ 2023-12-19 14:20:16,391 WARNING root Component [preview] no longer exists.
10
+ 2023-12-19 14:20:16,392 INFO ___FILE_ONLY___
11
+
12
+ 2023-12-19 14:20:16,393 INFO ___FILE_ONLY___
13
+ Your current Google Cloud CLI version is: 457.0.0
14
+
15
+ 2023-12-19 14:20:16,393 INFO ___FILE_ONLY___ Installing components from version: 457.0.0
16
+
17
+ 2023-12-19 14:20:16,393 INFO ___FILE_ONLY___
18
+
19
+ 2023-12-19 14:20:16,393 DEBUG root Chosen display Format:table[box,title="These components will be removed."](details.display_name:label=Name:align=left,version.version_string:label=Version:align=right,data.size.size(zero="",min=1048576):label=Size:align=right)
20
+ 2023-12-19 14:20:16,394 DEBUG root Chosen display Format:table[box,title="These components will be updated."](details.display_name:label=Name:align=left,version.version_string:label=Version:align=right,data.size.size(zero="",min=1048576):label=Size:align=right)
21
+ 2023-12-19 14:20:16,395 DEBUG root Chosen display Format:table[box,title="These components will be installed."](details.display_name:label=Name:align=left,version.version_string:label=Version:align=right,data.size.size(zero="",min=1048576):label=Size:align=right)
22
+ 2023-12-19 14:20:16,397 INFO ___FILE_ONLY___ ┌──────────────────────────────────────────────┐
23
+ 2023-12-19 14:20:16,397 INFO ___FILE_ONLY___
24
+
25
+ 2023-12-19 14:20:16,397 INFO ___FILE_ONLY___ │ These components will be installed. │
26
+ 2023-12-19 14:20:16,397 INFO ___FILE_ONLY___
27
+
28
+ 2023-12-19 14:20:16,397 INFO ___FILE_ONLY___ ├───────────────────────┬────────────┬─────────┤
29
+ 2023-12-19 14:20:16,397 INFO ___FILE_ONLY___
30
+
31
+ 2023-12-19 14:20:16,397 INFO ___FILE_ONLY___ │ Name │ Version │ Size │
32
+ 2023-12-19 14:20:16,397 INFO ___FILE_ONLY___
33
+
34
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___ ├───────────────────────┼────────────┼─────────┤
35
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___
36
+
37
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___ │
38
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___ gcloud Alpha Commands
39
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___
40
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___ │
41
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___ 2023.12.08
42
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___
43
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___ │
44
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___ < 1 MiB
45
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___
46
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___ │
47
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___
48
+
49
+ 2023-12-19 14:20:16,398 INFO ___FILE_ONLY___ │
50
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___ gcloud Beta Commands
51
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___
52
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___ │
53
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___ 2023.12.08
54
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___
55
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___ │
56
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___ < 1 MiB
57
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___
58
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___ │
59
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___
60
+
61
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___ └───────────────────────┴────────────┴─────────┘
62
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___
63
+
64
+ 2023-12-19 14:20:16,399 INFO ___FILE_ONLY___
65
+
66
+ 2023-12-19 14:20:16,404 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
67
+ 2023-12-19 14:20:16,492 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/RELEASE_NOTES HTTP/1.1" 200 1126280
68
+ 2023-12-19 14:20:16,566 INFO ___FILE_ONLY___ For the latest full release notes, please visit:
69
+ https://cloud.google.com/sdk/release_notes
70
+
71
+
72
+ 2023-12-19 14:20:16,568 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
73
+
74
+ 2023-12-19 14:20:16,568 INFO ___FILE_ONLY___ ╠═ Creating update staging area ═╣
75
+
76
+ 2023-12-19 14:20:16,569 INFO ___FILE_ONLY___ ╚
77
+ 2023-12-19 14:20:16,569 INFO ___FILE_ONLY___ ══════
78
+ 2023-12-19 14:20:17,291 INFO ___FILE_ONLY___ ══════
79
+ 2023-12-19 14:20:17,292 INFO ___FILE_ONLY___ ══════
80
+ 2023-12-19 14:20:17,731 INFO ___FILE_ONLY___ ═
81
+ 2023-12-19 14:20:17,809 INFO ___FILE_ONLY___ ═
82
+ 2023-12-19 14:20:17,871 INFO ___FILE_ONLY___ ═
83
+ 2023-12-19 14:20:17,930 INFO ___FILE_ONLY___ ═
84
+ 2023-12-19 14:20:18,000 INFO ___FILE_ONLY___ ═
85
+ 2023-12-19 14:20:18,077 INFO ___FILE_ONLY___ ═
86
+ 2023-12-19 14:20:18,142 INFO ___FILE_ONLY___ ═
87
+ 2023-12-19 14:20:18,215 INFO ___FILE_ONLY___ ═
88
+ 2023-12-19 14:20:18,273 INFO ___FILE_ONLY___ ═
89
+ 2023-12-19 14:20:18,348 INFO ___FILE_ONLY___ ═
90
+ 2023-12-19 14:20:18,421 INFO ___FILE_ONLY___ ═
91
+ 2023-12-19 14:20:18,502 INFO ___FILE_ONLY___ ═
92
+ 2023-12-19 14:20:18,596 INFO ___FILE_ONLY___ ═
93
+ 2023-12-19 14:20:18,667 INFO ___FILE_ONLY___ ═
94
+ 2023-12-19 14:20:18,733 INFO ___FILE_ONLY___ ═
95
+ 2023-12-19 14:20:18,790 INFO ___FILE_ONLY___ ═
96
+ 2023-12-19 14:20:18,849 INFO ___FILE_ONLY___ ═
97
+ 2023-12-19 14:20:18,897 INFO ___FILE_ONLY___ ═
98
+ 2023-12-19 14:20:18,962 INFO ___FILE_ONLY___ ═
99
+ 2023-12-19 14:20:19,022 INFO ___FILE_ONLY___ ═
100
+ 2023-12-19 14:20:19,092 INFO ___FILE_ONLY___ ═
101
+ 2023-12-19 14:20:19,173 INFO ___FILE_ONLY___ ═
102
+ 2023-12-19 14:20:19,236 INFO ___FILE_ONLY___ ═
103
+ 2023-12-19 14:20:19,307 INFO ___FILE_ONLY___ ═
104
+ 2023-12-19 14:20:19,370 INFO ___FILE_ONLY___ ═
105
+ 2023-12-19 14:20:19,745 INFO ___FILE_ONLY___ ═
106
+ 2023-12-19 14:20:19,839 INFO ___FILE_ONLY___ ═
107
+ 2023-12-19 14:20:19,918 INFO ___FILE_ONLY___ ═
108
+ 2023-12-19 14:20:20,054 INFO ___FILE_ONLY___ ═
109
+ 2023-12-19 14:20:20,088 INFO ___FILE_ONLY___ ═
110
+ 2023-12-19 14:20:20,134 INFO ___FILE_ONLY___ ═
111
+ 2023-12-19 14:20:20,181 INFO ___FILE_ONLY___ ═
112
+ 2023-12-19 14:20:20,218 INFO ___FILE_ONLY___ ═
113
+ 2023-12-19 14:20:20,282 INFO ___FILE_ONLY___ ═
114
+ 2023-12-19 14:20:20,393 INFO ___FILE_ONLY___ ═
115
+ 2023-12-19 14:20:20,484 INFO ___FILE_ONLY___ ═
116
+ 2023-12-19 14:20:20,760 INFO ___FILE_ONLY___ ═
117
+ 2023-12-19 14:20:20,827 INFO ___FILE_ONLY___ ═
118
+ 2023-12-19 14:20:20,891 INFO ___FILE_ONLY___ ═
119
+ 2023-12-19 14:20:20,951 INFO ___FILE_ONLY___ ═
120
+ 2023-12-19 14:20:21,013 INFO ___FILE_ONLY___ ═
121
+ 2023-12-19 14:20:21,075 INFO ___FILE_ONLY___ ═
122
+ 2023-12-19 14:20:21,075 INFO ___FILE_ONLY___ ╝
123
+
124
+ 2023-12-19 14:20:24,353 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
125
+
126
+ 2023-12-19 14:20:24,353 INFO ___FILE_ONLY___ ╠═ Installing: gcloud Alpha Commands ═╣
127
+
128
+ 2023-12-19 14:20:24,353 INFO ___FILE_ONLY___ ╚
129
+ 2023-12-19 14:20:24,358 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
130
+ 2023-12-19 14:20:24,441 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-alpha-20231208151900.tar.gz HTTP/1.1" 200 800
131
+ 2023-12-19 14:20:24,442 INFO ___FILE_ONLY___ ══════════════════════════════
132
+ 2023-12-19 14:20:24,444 INFO ___FILE_ONLY___ ══════════════════════════════
133
+ 2023-12-19 14:20:24,444 INFO ___FILE_ONLY___ ╝
134
+
135
+ 2023-12-19 14:20:24,453 INFO ___FILE_ONLY___ ╔════════════════════════════════════════════════════════════╗
136
+
137
+ 2023-12-19 14:20:24,453 INFO ___FILE_ONLY___ ╠═ Installing: gcloud Beta Commands ═╣
138
+
139
+ 2023-12-19 14:20:24,453 INFO ___FILE_ONLY___ ╚
140
+ 2023-12-19 14:20:24,457 DEBUG urllib3.connectionpool Starting new HTTPS connection (1): dl.google.com:443
141
+ 2023-12-19 14:20:24,544 DEBUG urllib3.connectionpool https://dl.google.com:443 "GET /dl/cloudsdk/channels/rapid/components/google-cloud-sdk-beta-20231208151900.tar.gz HTTP/1.1" 200 797
142
+ 2023-12-19 14:20:24,545 INFO ___FILE_ONLY___ ══════════════════════════════
143
+ 2023-12-19 14:20:24,546 INFO ___FILE_ONLY___ ══════════════════════════════
144
+ 2023-12-19 14:20:24,546 INFO ___FILE_ONLY___ ╝
145
+
146
+ 2023-12-19 14:20:24,555 INFO ___FILE_ONLY___ ��════════════════════════════════════════════════════════════╗
147
+
148
+ 2023-12-19 14:20:24,555 INFO ___FILE_ONLY___ ╠═ Creating backup and activating new installation ═╣
149
+
150
+ 2023-12-19 14:20:24,555 INFO ___FILE_ONLY___ ╚
151
+ 2023-12-19 14:20:24,555 DEBUG root Attempting to move directory [/tools/google-cloud-sdk] to [/tools/google-cloud-sdk.staging/.install/.backup]
152
+ 2023-12-19 14:20:24,555 INFO ___FILE_ONLY___ ══════════════════════════════
153
+ 2023-12-19 14:20:24,555 DEBUG root Attempting to move directory [/tools/google-cloud-sdk.staging] to [/tools/google-cloud-sdk]
154
+ 2023-12-19 14:20:24,555 INFO ___FILE_ONLY___ ══════════════════════════════
155
+ 2023-12-19 14:20:24,555 INFO ___FILE_ONLY___ ╝
156
+
157
+ 2023-12-19 14:20:24,560 DEBUG root Updating notification cache...
158
+ 2023-12-19 14:20:24,561 INFO ___FILE_ONLY___
159
+
160
+ 2023-12-19 14:20:24,563 INFO ___FILE_ONLY___ Performing post processing steps...
161
+ 2023-12-19 14:20:24,563 DEBUG root Executing command: ['python3', '-S', '/tools/google-cloud-sdk/lib/gcloud.py', 'components', 'post-process']
162
+ 2023-12-19 14:20:34,281 DEBUG ___FILE_ONLY___
163
+ 2023-12-19 14:20:34,282 DEBUG ___FILE_ONLY___
164
+ 2023-12-19 14:20:34,327 INFO ___FILE_ONLY___
165
+ Update done!
166
+
167
+
168
+ 2023-12-19 14:20:34,331 DEBUG root Chosen display Format:none
169
+ 2023-12-19 14:20:34,331 INFO root Display format: "none"
.config/logs/2023.12.19/14.20.25.266295.log ADDED
@@ -0,0 +1,5 @@
 
 
 
 
 
 
1
+ 2023-12-19 14:20:25,267 DEBUG root Loaded Command Group: ['gcloud', 'components']
2
+ 2023-12-19 14:20:25,269 DEBUG root Loaded Command Group: ['gcloud', 'components', 'post_process']
3
+ 2023-12-19 14:20:25,272 DEBUG root Running [gcloud.components.post-process] with arguments: []
4
+ 2023-12-19 14:20:34,156 DEBUG root Chosen display Format:none
5
+ 2023-12-19 14:20:34,157 INFO root Display format: "none"
.config/logs/2023.12.19/14.20.35.154355.log ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ 2023-12-19 14:20:35,156 DEBUG root Loaded Command Group: ['gcloud', 'config']
2
+ 2023-12-19 14:20:35,187 DEBUG root Loaded Command Group: ['gcloud', 'config', 'set']
3
+ 2023-12-19 14:20:35,190 DEBUG root Running [gcloud.config.set] with arguments: [SECTION/PROPERTY: "component_manager/disable_update_check", VALUE: "true"]
4
+ 2023-12-19 14:20:35,191 INFO ___FILE_ONLY___ Updated property [component_manager/disable_update_check].
5
+
6
+ 2023-12-19 14:20:35,191 DEBUG root Chosen display Format:default
7
+ 2023-12-19 14:20:35,192 INFO root Display format: "default"
8
+ 2023-12-19 14:20:35,193 DEBUG root SDK update checks are disabled.
.config/logs/2023.12.19/14.20.35.996145.log ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ 2023-12-19 14:20:35,998 DEBUG root Loaded Command Group: ['gcloud', 'config']
2
+ 2023-12-19 14:20:36,026 DEBUG root Loaded Command Group: ['gcloud', 'config', 'set']
3
+ 2023-12-19 14:20:36,029 DEBUG root Running [gcloud.config.set] with arguments: [SECTION/PROPERTY: "compute/gce_metadata_read_timeout_sec", VALUE: "0"]
4
+ 2023-12-19 14:20:36,030 INFO ___FILE_ONLY___ Updated property [compute/gce_metadata_read_timeout_sec].
5
+
6
+ 2023-12-19 14:20:36,031 DEBUG root Chosen display Format:default
7
+ 2023-12-19 14:20:36,032 INFO root Display format: "default"
8
+ 2023-12-19 14:20:36,033 DEBUG root SDK update checks are disabled.
.gitattributes CHANGED
@@ -33,3 +33,7 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ CustomerReviewSentiment/data/clean_data.csv filter=lfs diff=lfs merge=lfs -text
37
+ CustomerReviewSentiment/data/rawdata.csv filter=lfs diff=lfs merge=lfs -text
38
+ sample_data/mnist_test.csv filter=lfs diff=lfs merge=lfs -text
39
+ sample_data/mnist_train_small.csv filter=lfs diff=lfs merge=lfs -text
CustomerReviewSentiment/README.md ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ # CustomerReviewSentiment
2
+ ## Data
3
+ * rawdata.csv: Raw data
4
+ * clean_data.csv: After cleaning text by regex
5
+ * clean_data_2.csv: After dropping data by regex and removing sentences which have multiple sentiment score by users
6
+ * spell_corrected_data.csv: After using spell correction API
CustomerReviewSentiment/XGBooost.ipynb ADDED
The diff for this file is too large to render. See raw diff
 
CustomerReviewSentiment/data/clean_data.csv ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8f11c5627f0faf7daf824b0d40a2d658267c28429c8a1e5008be64b82c979a1f
3
+ size 18733734
CustomerReviewSentiment/data/clean_data_v2.csv ADDED
The diff for this file is too large to render. See raw diff
 
CustomerReviewSentiment/data/clean_data_v3.csv ADDED
The diff for this file is too large to render. See raw diff
 
CustomerReviewSentiment/data/clean_data_v4.csv ADDED
The diff for this file is too large to render. See raw diff
 
CustomerReviewSentiment/data/rawdata.csv ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c55efbd2d904e3fede3f559804f703b4068e03ddcd06f0d8b24b69502374223d
3
+ size 19152357
CustomerReviewSentiment/data/spell_corrected_data.csv ADDED
The diff for this file is too large to render. See raw diff
 
CustomerReviewSentiment/process/300to50.ipynb ADDED
@@ -0,0 +1,931 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cells": [
3
+ {
4
+ "cell_type": "code",
5
+ "execution_count": 194,
6
+ "metadata": {},
7
+ "outputs": [],
8
+ "source": [
9
+ "import pandas as pd\n",
10
+ "data = pd.read_csv(\"../data/rawdata.csv\")\n",
11
+ "data.drop(columns=\"Unnamed: 0\", inplace=True)"
12
+ ]
13
+ },
14
+ {
15
+ "cell_type": "code",
16
+ "execution_count": 195,
17
+ "metadata": {},
18
+ "outputs": [
19
+ {
20
+ "data": {
21
+ "text/html": [
22
+ "<div>\n",
23
+ "<style scoped>\n",
24
+ " .dataframe tbody tr th:only-of-type {\n",
25
+ " vertical-align: middle;\n",
26
+ " }\n",
27
+ "\n",
28
+ " .dataframe tbody tr th {\n",
29
+ " vertical-align: top;\n",
30
+ " }\n",
31
+ "\n",
32
+ " .dataframe thead th {\n",
33
+ " text-align: right;\n",
34
+ " }\n",
35
+ "</style>\n",
36
+ "<table border=\"1\" class=\"dataframe\">\n",
37
+ " <thead>\n",
38
+ " <tr style=\"text-align: right;\">\n",
39
+ " <th></th>\n",
40
+ " <th>content</th>\n",
41
+ " <th>score</th>\n",
42
+ " <th>thumbsUpCount</th>\n",
43
+ " <th>Application</th>\n",
44
+ " </tr>\n",
45
+ " </thead>\n",
46
+ " <tbody>\n",
47
+ " <tr>\n",
48
+ " <th>0</th>\n",
49
+ " <td>Rất thuận tiện, có lợi ích.</td>\n",
50
+ " <td>5</td>\n",
51
+ " <td>2</td>\n",
52
+ " <td>Messenger</td>\n",
53
+ " </tr>\n",
54
+ " <tr>\n",
55
+ " <th>1</th>\n",
56
+ " <td>Tốt</td>\n",
57
+ " <td>4</td>\n",
58
+ " <td>213</td>\n",
59
+ " <td>Messenger</td>\n",
60
+ " </tr>\n",
61
+ " <tr>\n",
62
+ " <th>2</th>\n",
63
+ " <td>Ok</td>\n",
64
+ " <td>5</td>\n",
65
+ " <td>1</td>\n",
66
+ " <td>Messenger</td>\n",
67
+ " </tr>\n",
68
+ " <tr>\n",
69
+ " <th>3</th>\n",
70
+ " <td>Xài rất tốt , nên tải nha</td>\n",
71
+ " <td>5</td>\n",
72
+ " <td>8</td>\n",
73
+ " <td>Messenger</td>\n",
74
+ " </tr>\n",
75
+ " <tr>\n",
76
+ " <th>4</th>\n",
77
+ " <td>gútttt</td>\n",
78
+ " <td>5</td>\n",
79
+ " <td>1</td>\n",
80
+ " <td>Messenger</td>\n",
81
+ " </tr>\n",
82
+ " <tr>\n",
83
+ " <th>...</th>\n",
84
+ " <td>...</td>\n",
85
+ " <td>...</td>\n",
86
+ " <td>...</td>\n",
87
+ " <td>...</td>\n",
88
+ " </tr>\n",
89
+ " <tr>\n",
90
+ " <th>310741</th>\n",
91
+ " <td>Ok</td>\n",
92
+ " <td>5</td>\n",
93
+ " <td>0</td>\n",
94
+ " <td>Instagram</td>\n",
95
+ " </tr>\n",
96
+ " <tr>\n",
97
+ " <th>310742</th>\n",
98
+ " <td>G o o d</td>\n",
99
+ " <td>5</td>\n",
100
+ " <td>0</td>\n",
101
+ " <td>Instagram</td>\n",
102
+ " </tr>\n",
103
+ " <tr>\n",
104
+ " <th>310743</th>\n",
105
+ " <td>Có</td>\n",
106
+ " <td>5</td>\n",
107
+ " <td>0</td>\n",
108
+ " <td>Instagram</td>\n",
109
+ " </tr>\n",
110
+ " <tr>\n",
111
+ " <th>310744</th>\n",
112
+ " <td>Nhiều lúc tôi k lấy đc hiệu ứng</td>\n",
113
+ " <td>1</td>\n",
114
+ " <td>0</td>\n",
115
+ " <td>Instagram</td>\n",
116
+ " </tr>\n",
117
+ " <tr>\n",
118
+ " <th>310745</th>\n",
119
+ " <td>Tui chưa chơi ko biết có hay ko ??????</td>\n",
120
+ " <td>3</td>\n",
121
+ " <td>0</td>\n",
122
+ " <td>Instagram</td>\n",
123
+ " </tr>\n",
124
+ " </tbody>\n",
125
+ "</table>\n",
126
+ "<p>310746 rows × 4 columns</p>\n",
127
+ "</div>"
128
+ ],
129
+ "text/plain": [
130
+ " content score thumbsUpCount \\\n",
131
+ "0 Rất thuận tiện, có lợi ích. 5 2 \n",
132
+ "1 Tốt 4 213 \n",
133
+ "2 Ok 5 1 \n",
134
+ "3 Xài rất tốt , nên tải nha 5 8 \n",
135
+ "4 gútttt 5 1 \n",
136
+ "... ... ... ... \n",
137
+ "310741 Ok 5 0 \n",
138
+ "310742 G o o d 5 0 \n",
139
+ "310743 Có 5 0 \n",
140
+ "310744 Nhiều lúc tôi k lấy đc hiệu ứng 1 0 \n",
141
+ "310745 Tui chưa chơi ko biết có hay ko ?????? 3 0 \n",
142
+ "\n",
143
+ " Application \n",
144
+ "0 Messenger \n",
145
+ "1 Messenger \n",
146
+ "2 Messenger \n",
147
+ "3 Messenger \n",
148
+ "4 Messenger \n",
149
+ "... ... \n",
150
+ "310741 Instagram \n",
151
+ "310742 Instagram \n",
152
+ "310743 Instagram \n",
153
+ "310744 Instagram \n",
154
+ "310745 Instagram \n",
155
+ "\n",
156
+ "[310746 rows x 4 columns]"
157
+ ]
158
+ },
159
+ "execution_count": 195,
160
+ "metadata": {},
161
+ "output_type": "execute_result"
162
+ }
163
+ ],
164
+ "source": [
165
+ "data"
166
+ ]
167
+ },
168
+ {
169
+ "cell_type": "code",
170
+ "execution_count": 3,
171
+ "metadata": {},
172
+ "outputs": [
173
+ {
174
+ "data": {
175
+ "application/vnd.jupyter.widget-view+json": {
176
+ "model_id": "77738c473504417bad502941cdd4d650",
177
+ "version_major": 2,
178
+ "version_minor": 0
179
+ },
180
+ "text/plain": [
181
+ "Downloading data files: 0%| | 0/3 [00:00<?, ?it/s]"
182
+ ]
183
+ },
184
+ "metadata": {},
185
+ "output_type": "display_data"
186
+ },
187
+ {
188
+ "data": {
189
+ "application/vnd.jupyter.widget-view+json": {
190
+ "model_id": "a7f0c7c61a974aa9ac036a9460258775",
191
+ "version_major": 2,
192
+ "version_minor": 0
193
+ },
194
+ "text/plain": [
195
+ "Downloading data: 0%| | 0.00/898k [00:00<?, ?B/s]"
196
+ ]
197
+ },
198
+ "metadata": {},
199
+ "output_type": "display_data"
200
+ },
201
+ {
202
+ "data": {
203
+ "application/vnd.jupyter.widget-view+json": {
204
+ "model_id": "195e0ff0a44d4286b59687835f4a4816",
205
+ "version_major": 2,
206
+ "version_minor": 0
207
+ },
208
+ "text/plain": [
209
+ "Downloading data: 0%| | 0.00/22.9k [00:00<?, ?B/s]"
210
+ ]
211
+ },
212
+ "metadata": {},
213
+ "output_type": "display_data"
214
+ },
215
+ {
216
+ "data": {
217
+ "application/vnd.jupyter.widget-view+json": {
218
+ "model_id": "a2fbcf7b23204998b8531c50c9e9a209",
219
+ "version_major": 2,
220
+ "version_minor": 0
221
+ },
222
+ "text/plain": [
223
+ "Downloading data: 0%| | 0.00/22.9k [00:00<?, ?B/s]"
224
+ ]
225
+ },
226
+ "metadata": {},
227
+ "output_type": "display_data"
228
+ },
229
+ {
230
+ "data": {
231
+ "application/vnd.jupyter.widget-view+json": {
232
+ "model_id": "2fafdbbcbf1c4f6e8d5cba4832ece377",
233
+ "version_major": 2,
234
+ "version_minor": 0
235
+ },
236
+ "text/plain": [
237
+ "Downloading data: 0%| | 0.00/119k [00:00<?, ?B/s]"
238
+ ]
239
+ },
240
+ "metadata": {},
241
+ "output_type": "display_data"
242
+ },
243
+ {
244
+ "data": {
245
+ "application/vnd.jupyter.widget-view+json": {
246
+ "model_id": "1cc733c39cee4265822fd4c6a315a51d",
247
+ "version_major": 2,
248
+ "version_minor": 0
249
+ },
250
+ "text/plain": [
251
+ "Downloading data: 0%| | 0.00/3.17k [00:00<?, ?B/s]"
252
+ ]
253
+ },
254
+ "metadata": {},
255
+ "output_type": "display_data"
256
+ },
257
+ {
258
+ "data": {
259
+ "application/vnd.jupyter.widget-view+json": {
260
+ "model_id": "5f62e29136ad4de4a370212da4a8656c",
261
+ "version_major": 2,
262
+ "version_minor": 0
263
+ },
264
+ "text/plain": [
265
+ "Downloading data: 0%| | 0.00/3.17k [00:00<?, ?B/s]"
266
+ ]
267
+ },
268
+ "metadata": {},
269
+ "output_type": "display_data"
270
+ },
271
+ {
272
+ "data": {
273
+ "application/vnd.jupyter.widget-view+json": {
274
+ "model_id": "ea64b5f432b34fc3a6b8348a2e4ac4fd",
275
+ "version_major": 2,
276
+ "version_minor": 0
277
+ },
278
+ "text/plain": [
279
+ "Downloading data: 0%| | 0.00/248k [00:00<?, ?B/s]"
280
+ ]
281
+ },
282
+ "metadata": {},
283
+ "output_type": "display_data"
284
+ },
285
+ {
286
+ "data": {
287
+ "application/vnd.jupyter.widget-view+json": {
288
+ "model_id": "4a657e1945d64762b9e5f27322ece4ef",
289
+ "version_major": 2,
290
+ "version_minor": 0
291
+ },
292
+ "text/plain": [
293
+ "Downloading data: 0%| | 0.00/6.33k [00:00<?, ?B/s]"
294
+ ]
295
+ },
296
+ "metadata": {},
297
+ "output_type": "display_data"
298
+ },
299
+ {
300
+ "data": {
301
+ "application/vnd.jupyter.widget-view+json": {
302
+ "model_id": "783e9c44195142c08d99bff16649ef41",
303
+ "version_major": 2,
304
+ "version_minor": 0
305
+ },
306
+ "text/plain": [
307
+ "Downloading data: 0%| | 0.00/6.33k [00:00<?, ?B/s]"
308
+ ]
309
+ },
310
+ "metadata": {},
311
+ "output_type": "display_data"
312
+ },
313
+ {
314
+ "data": {
315
+ "application/vnd.jupyter.widget-view+json": {
316
+ "model_id": "4e4319d7a7c04f878c90afcd7aa1c4fe",
317
+ "version_major": 2,
318
+ "version_minor": 0
319
+ },
320
+ "text/plain": [
321
+ "Generating train split: 0 examples [00:00, ? examples/s]"
322
+ ]
323
+ },
324
+ "metadata": {},
325
+ "output_type": "display_data"
326
+ },
327
+ {
328
+ "data": {
329
+ "application/vnd.jupyter.widget-view+json": {
330
+ "model_id": "0f8264be6de64c169d78ac7a48f68b6d",
331
+ "version_major": 2,
332
+ "version_minor": 0
333
+ },
334
+ "text/plain": [
335
+ "Generating validation split: 0 examples [00:00, ? examples/s]"
336
+ ]
337
+ },
338
+ "metadata": {},
339
+ "output_type": "display_data"
340
+ },
341
+ {
342
+ "data": {
343
+ "application/vnd.jupyter.widget-view+json": {
344
+ "model_id": "116eec0cb22c447dbf92d9fb9f4d1489",
345
+ "version_major": 2,
346
+ "version_minor": 0
347
+ },
348
+ "text/plain": [
349
+ "Generating test split: 0 examples [00:00, ? examples/s]"
350
+ ]
351
+ },
352
+ "metadata": {},
353
+ "output_type": "display_data"
354
+ }
355
+ ],
356
+ "source": [
357
+ "from datasets import load_dataset\n",
358
+ "dataset = load_dataset(\"uitnlp/vietnamese_students_feedback\", cache_dir=\"../data\")\n",
359
+ "dataset = dataset.rename_column(\"sentence\", 'text')\n",
360
+ "dataset = dataset.rename_column(\"sentiment\", 'label')\n",
361
+ "dataset = dataset.remove_columns(\"topic\")"
362
+ ]
363
+ },
364
+ {
365
+ "cell_type": "code",
366
+ "execution_count": 10,
367
+ "metadata": {},
368
+ "outputs": [
369
+ {
370
+ "data": {
371
+ "text/plain": [
372
+ "['thầy sử dụng thời gian dạy tốt .',\n",
373
+ " 'thầy wzjwz205 rất nhiệt tình với sinh viên , luôn cung cấp kiến thức cập nhật và thực tiễn .',\n",
374
+ " 'tài liệu và giảng viên nhiệt tình .',\n",
375
+ " 'thầy dạy tâm huyết với sinh viên , dạy cho sinh viên rất nhiều kiến thức bổ ích !',\n",
376
+ " 'thầy giúp sinh viên luyện tập rất nhiệt tình .',\n",
377
+ " 'khi có thông báo nghỉ , cần cập nhập thông tin trên web của khoa wzjwz158 .',\n",
378
+ " 'kiến thức truyền đạt còn ít , thời gian lên lớp thường trễ .',\n",
379
+ " 'em nghĩ nên thi thực hành thay vì lý thuyết cuối kỳ .',\n",
380
+ " 'khi sinh viên nhờ thầy giải một bài tập để làm mẫu nhưng không nhận được bất kỳ bài giải nào từ thầy .',\n",
381
+ " 'thời lượng thi ít khiến nhiều câu bỏ trống .',\n",
382
+ " 'cách thầy dạy môn này trong kỳ trước em không được biết chỉ được nghe từ các bạnem đã cảm thấy vui khi được học với thầy .',\n",
383
+ " 'thường xuyên nghỉ học không thông báo , lên lớp trễ .',\n",
384
+ " 'cô giáo rất tận tình và có phương pháp giảng dạy rất tốt đối với sinh viên .',\n",
385
+ " 'giảng viên luôn vui vẻ và tận tình giúp đỡ sinh viên .',\n",
386
+ " 'dùng lời lẽ để ép buộc sinh viên .',\n",
387
+ " 'những thứ đó không đủ để làm bài thực hành như tuần 5 , tuần 6 , tuần 7 .',\n",
388
+ " 'bài tập deadline quá nhiều mà thời gian lại quá ngắn .',\n",
389
+ " 'nên rút gọn kiến thức lại .',\n",
390
+ " 'đan xen những câu chuyện thực tiễn trong lúc học .',\n",
391
+ " 'thầy không chú trọng đến kết quả tốt hay không mà khuyến khích sinh viên làm việc hết khả năng của mình .',\n",
392
+ " 'không có hoạt động không hài lòng .',\n",
393
+ " 'có nhiều nội dung liên quan tới thực tiễn , có thể áp dụng vào thực tế sau này .',\n",
394
+ " 'vào lớp muộn , cho ra trễ .',\n",
395
+ " 'thầy vui tính , thường xuyên cho bài tập cho sinh viên .',\n",
396
+ " 'sinh viên trường wzjwz80 chúng ta hoàn toàn không được đánh giá cao so với sinh viên của wzjwz81 và wzjwz82 .']"
397
+ ]
398
+ },
399
+ "execution_count": 10,
400
+ "metadata": {},
401
+ "output_type": "execute_result"
402
+ }
403
+ ],
404
+ "source": [
405
+ "i=180\n",
406
+ "dataset['train']['text'][25*i:25*(i+1)]"
407
+ ]
408
+ },
409
+ {
410
+ "cell_type": "code",
411
+ "execution_count": 5,
412
+ "metadata": {},
413
+ "outputs": [],
414
+ "source": [
415
+ "import re\n",
416
+ "def cleaning(row):\n",
417
+ " text = row['content'].strip()\n",
418
+ " if isinstance(text, str): \n",
419
+ " text = text.lower()\n",
420
+ " text = re.sub(r'[^ ,.?!a-z0-9àáảãạăắằẳẵặâấầẩẫậèéẻẽẹêếềểễệđìíỉĩịòóỏõọôốồổỗộơớờởỡợùúủũụưứừửữựỳýỷỹỵ]', '', text)\n",
421
+ " text = re.sub(r'[.!?]+', '.', text)\n",
422
+ " text = re.sub(r'([,.!?])\\1+', r'\\1', text)\n",
423
+ " text = re.sub(r'[,]+', ' , ', text)\n",
424
+ " text = re.sub(r'[.]+', ' . ', text)\n",
425
+ " text = re.sub(r'([ ])\\1+', r'\\1', text)\n",
426
+ " row['content'] = text.strip()\n",
427
+ " return row\n",
428
+ " return row"
429
+ ]
430
+ },
431
+ {
432
+ "cell_type": "code",
433
+ "execution_count": 235,
434
+ "metadata": {},
435
+ "outputs": [],
436
+ "source": [
437
+ "from copy import deepcopy\n",
438
+ "\n",
439
+ "diction = {}\n",
440
+ "for i in range(len(data)):\n",
441
+ " if data.loc[i, 'content'] not in diction.keys():\n",
442
+ " diction[data.loc[i, 'content']] = [data.loc[i, 'score']]\n",
443
+ " else:\n",
444
+ " diction[data.loc[i, 'content']].append(data.loc[i, 'score'])\n",
445
+ " diction[data.loc[i, 'content']] = list(set(diction[data.loc[i, 'content']]))\n",
446
+ "\n",
447
+ "remained_reviews = list(set([i for i, j in diction.items() if len(j)<2]))\n",
448
+ "data_output = deepcopy(data)\n",
449
+ "data_output = data_output[data_output['content'].isin(remained_reviews)]\n",
450
+ "data_output = data_output.apply(cleaning, axis=1)\n",
451
+ "\n",
452
+ "removed_reviews_2 = [\n",
453
+ " 'g7mb',\n",
454
+ " 'samsung galaxy s21 ultra 5 g smg988b',\n",
455
+ " 'd4e',\n",
456
+ " 'yhehe',\n",
457
+ " 'messengr',\n",
458
+ " 'heé34e',\n",
459
+ " 'ịckhylh',\n",
460
+ " 'đbb',\n",
461
+ " 'chetme',\n",
462
+ " 'hhhhhhhhokkkk',\n",
463
+ " 'đjtme',\n",
464
+ " 'cmn',\n",
465
+ " 'như l',\n",
466
+ " 'meslon',\n",
467
+ " 'vcl',\n",
468
+ " 'cc',\n",
469
+ " 'dm',\n",
470
+ " ' . ',\n",
471
+ " 'cl',\n",
472
+ " 'như c',\n",
473
+ " 'del',\n",
474
+ " 'đb',\n",
475
+ " 'dcm',\n",
476
+ " 'explore',\n",
477
+ " 'loz',\n",
478
+ " 'hi hi',\n",
479
+ " 'cưk',\n",
480
+ " 'meomeo',\n",
481
+ " 'vkl', \n",
482
+ " 'ghi chú',\n",
483
+ " 'nhon nhặc',\n",
484
+ " 'vl',\n",
485
+ " 'lon',\n",
486
+ " 'lol',\n",
487
+ " 'đm',\n",
488
+ " 'haha',\n",
489
+ " 'đitme',\n",
490
+ " 'cặc',\n",
491
+ " 'thoănh',\n",
492
+ " 'anơnh',\n",
493
+ " 'moẹ',\n",
494
+ " 'cm',\n",
495
+ " 'mày',\n",
496
+ " 'tao',\n",
497
+ " 'gg',\n",
498
+ " 'sl',\n",
499
+ " 'éo',\n",
500
+ " 'gjhbhv',\n",
501
+ " 'hihi',\n",
502
+ " 'lll',\n",
503
+ " 'mẹ',\n",
504
+ " 'xz',\n",
505
+ " 'toots',\n",
506
+ " 'ckg',\n",
507
+ " 'bgi',\n",
508
+ " '7e',\n",
509
+ " 'b b',\n",
510
+ " 'xxx',\n",
511
+ " 'srtxatjrx',\n",
512
+ " '. 0',\n",
513
+ " 'di 0',\n",
514
+ " 'hô hô',\n",
515
+ " 'èy',\n",
516
+ " 'el .',\n",
517
+ " 'đe 3e',\n",
518
+ " 'eq',\n",
519
+ " 'qê',\n",
520
+ " 'êư',\n",
521
+ " 'lm',\n",
522
+ " 'za',\n",
523
+ " 'gồ',\n",
524
+ " 'bạnbạn',\n",
525
+ " 'snisb',\n",
526
+ " 'ld',\n",
527
+ " 'hehe',\n",
528
+ " '4gu',\n",
529
+ " 'u9',\n",
530
+ " 'h0',\n",
531
+ " 'kwwiwieie',\n",
532
+ " 'kw',\n",
533
+ " 'wiw',\n",
534
+ " 'wie',\n",
535
+ " 'iei',\n",
536
+ " 'eie',\n",
537
+ " 'ioo',\n",
538
+ " 'yyy',\n",
539
+ " 'ê3',\n",
540
+ " 'i c',\n",
541
+ " 'ẻcv',\n",
542
+ " 'mọe',\n",
543
+ " 'đel',\n",
544
+ " 'bòi',\n",
545
+ " 'wp',\n",
546
+ " 'medi',\n",
547
+ " 'boài',\n",
548
+ " 'gf',\n",
549
+ " 'amv',\n",
550
+ " 'am1',\n",
551
+ " 'hah',\n",
552
+ " 'ean',\n",
553
+ " 'cec',\n",
554
+ " 'bìu',\n",
555
+ " 'ut',\n",
556
+ " '7j',\n",
557
+ " 'qq',\n",
558
+ " 'đức',\n",
559
+ " 'l0',\n",
560
+ " '2 .',\n",
561
+ " 'ab',\n",
562
+ " 'bcd',\n",
563
+ " 'zx',\n",
564
+ " 'iz',\n",
565
+ " 'aa của',\n",
566
+ " 'kui',\n",
567
+ " 'vsn',\n",
568
+ " 'djt',\n",
569
+ " 'buoi',\n",
570
+ " 'đeoz',\n",
571
+ " 'cặt',\n",
572
+ " 'jav',\n",
573
+ " 'l y',\n",
574
+ " 'dsha',\n",
575
+ " 'dj',\n",
576
+ " 'rw',\n",
577
+ " 'cuc',\n",
578
+ " 'cẹc',\n",
579
+ " 'dahezwre',\n",
580
+ " 'đíu',\n",
581
+ " 'như nhái nhồn',\n",
582
+ " 'hd',\n",
583
+ " 'căc',\n",
584
+ " 'xuyn',\n",
585
+ " 'hya',\n",
586
+ " 'ỳy',\n",
587
+ " 'đ8',\n",
588
+ " 'duk',\n",
589
+ " 'ukis',\n",
590
+ " 'kisko',\n",
591
+ " 'skor',\n",
592
+ " 'oop',\n",
593
+ " 'akd',\n",
594
+ " 'kden',\n",
595
+ " 'eod',\n",
596
+ " 'zef',\n",
597
+ " 'osk',\n",
598
+ " 'kajs',\n",
599
+ " 'như .',\n",
600
+ " 'đ ',\n",
601
+ " 'dfd',\n",
602
+ " '2v',\n",
603
+ " 'gyg',\n",
604
+ " 'kkkkkk',\n",
605
+ " 'aa',\n",
606
+ " 'ăă',\n",
607
+ " 'ââ',\n",
608
+ " 'bb',\n",
609
+ " 'cc',\n",
610
+ " 'dd',\n",
611
+ " 'đđ',\n",
612
+ " 'ee',\n",
613
+ " 'êê',\n",
614
+ " 'ff',\n",
615
+ " 'gg',\n",
616
+ " 'hh',\n",
617
+ " 'ii',\n",
618
+ " 'kk',\n",
619
+ " 'll',\n",
620
+ " 'mm',\n",
621
+ " 'nn',\n",
622
+ " 'oo',\n",
623
+ " 'ôô',\n",
624
+ " 'ơơ',\n",
625
+ " 'pp',\n",
626
+ " 'qq',\n",
627
+ " 'rr',\n",
628
+ " 'tt',\n",
629
+ " 'uu',\n",
630
+ " 'ưư',\n",
631
+ " 'vv',\n",
632
+ " 'ww',\n",
633
+ " 'xx',\n",
634
+ " 'yy',\n",
635
+ " 'zz',\n",
636
+ " 'gp',\n",
637
+ " 'lng',\n",
638
+ " 'uv',\n",
639
+ " 'km',\n",
640
+ " 'khợ',\n",
641
+ " 'ợn',\n",
642
+ " 'by',\n",
643
+ " 'siv',\n",
644
+ " 'ivi',\n",
645
+ " 'ea',\n",
646
+ " 'aye',\n",
647
+ " 'thue',\n",
648
+ " 'oca',\n",
649
+ " 'coc',\n",
650
+ " 'mem',\n",
651
+ " 'emo',\n",
652
+ " 'mor',\n",
653
+ " 'ori',\n",
654
+ " 'rie',\n",
655
+ " 'ies',\n",
656
+ " 'okji',\n",
657
+ " 'kj',\n",
658
+ " 'ji',\n",
659
+ " 'ih',\n",
660
+ " 'dit',\n",
661
+ " 'ms',\n",
662
+ " 'sy',\n",
663
+ " 'nd',\n",
664
+ " 'die',\n",
665
+ " 'jđ',\n",
666
+ " 'ciu',\n",
667
+ " 'iuc',\n",
668
+ " 'cg',\n",
669
+ " 'goj',\n",
670
+ " 'oj',\n",
671
+ " 'jf',\n",
672
+ " 'fu',\n",
673
+ " 'uj',\n",
674
+ " 'ek',\n",
675
+ " 'ege',\n",
676
+ " 'geg',\n",
677
+ " 'gt',\n",
678
+ " 'tm',\n",
679
+ " 'muo',\n",
680
+ " 'nhưl',\n",
681
+ " 'nhôn',\n",
682
+ " 'lừ',\n",
683
+ " 'u12',\n",
684
+ " '111',\n",
685
+ " '22',\n",
686
+ " '33',\n",
687
+ " '44',\n",
688
+ " '55',\n",
689
+ " '66',\n",
690
+ " '77',\n",
691
+ " '88',\n",
692
+ " '99',\n",
693
+ " 'rc',\n",
694
+ " 'mé',\n",
695
+ " 'iồn',\n",
696
+ " 'gv',\n",
697
+ " 'gig',\n",
698
+ " 'hsh',\n",
699
+ " 'èu3',\n",
700
+ " 'n14',\n",
701
+ " 'tsi',\n",
702
+ " 'tau',\n",
703
+ " 'đcr',\n",
704
+ " '00',\n",
705
+ " 'tey',\n",
706
+ " 'sje',\n",
707
+ " 'tran ',\n",
708
+ " '1sa',\n",
709
+ " '56 8390',\n",
710
+ " 'hàh',\n",
711
+ " 'àhà',\n",
712
+ " 'jr',\n",
713
+ " 'ỹy',\n",
714
+ " 'd5',\n",
715
+ " '5e',\n",
716
+ " 'ed',\n",
717
+ " '7u',\n",
718
+ " '7g',\n",
719
+ " '5s',\n",
720
+ " 'wo',\n",
721
+ " 'q1',\n",
722
+ " '2e',\n",
723
+ " 'bỏi',\n",
724
+ " 'bf',\n",
725
+ " 'ad',\n",
726
+ " 'oio'\n",
727
+ "]\n",
728
+ "for substring in removed_reviews_2:\n",
729
+ " data_output = data_output[~data_output['content'].str.contains(substring)]\n",
730
+ " \n",
731
+ "data_output = data_output[~data_output['content'].isin(['', '.', ',', 'c', 'a .', 'an', 'edit', 'ti', 'd'])]\n",
732
+ "data_output = data_output[~data_output['content'].str.startswith(\".\")]\n",
733
+ "data_output.drop_duplicates(inplace=True)\n",
734
+ "data_output.reset_index(inplace=True)\n",
735
+ "data_output.drop(columns='index', inplace=True)"
736
+ ]
737
+ },
738
+ {
739
+ "cell_type": "code",
740
+ "execution_count": 236,
741
+ "metadata": {},
742
+ "outputs": [
743
+ {
744
+ "data": {
745
+ "text/html": [
746
+ "<div>\n",
747
+ "<style scoped>\n",
748
+ " .dataframe tbody tr th:only-of-type {\n",
749
+ " vertical-align: middle;\n",
750
+ " }\n",
751
+ "\n",
752
+ " .dataframe tbody tr th {\n",
753
+ " vertical-align: top;\n",
754
+ " }\n",
755
+ "\n",
756
+ " .dataframe thead th {\n",
757
+ " text-align: right;\n",
758
+ " }\n",
759
+ "</style>\n",
760
+ "<table border=\"1\" class=\"dataframe\">\n",
761
+ " <thead>\n",
762
+ " <tr style=\"text-align: right;\">\n",
763
+ " <th></th>\n",
764
+ " <th>content</th>\n",
765
+ " <th>score</th>\n",
766
+ " <th>thumbsUpCount</th>\n",
767
+ " <th>Application</th>\n",
768
+ " </tr>\n",
769
+ " </thead>\n",
770
+ " <tbody>\n",
771
+ " <tr>\n",
772
+ " <th>0</th>\n",
773
+ " <td>không làm được</td>\n",
774
+ " <td>1</td>\n",
775
+ " <td>1</td>\n",
776
+ " <td>Messenger</td>\n",
777
+ " </tr>\n",
778
+ " <tr>\n",
779
+ " <th>1</th>\n",
780
+ " <td>đăng xuất ra vô lại bị lỗi nhìu</td>\n",
781
+ " <td>1</td>\n",
782
+ " <td>1</td>\n",
783
+ " <td>Messenger</td>\n",
784
+ " </tr>\n",
785
+ " <tr>\n",
786
+ " <th>2</th>\n",
787
+ " <td>cập nhật lại giùm cái</td>\n",
788
+ " <td>5</td>\n",
789
+ " <td>2</td>\n",
790
+ " <td>Messenger</td>\n",
791
+ " </tr>\n",
792
+ " <tr>\n",
793
+ " <th>3</th>\n",
794
+ " <td>1 sao vì chặn mà vẫn gỡ được</td>\n",
795
+ " <td>1</td>\n",
796
+ " <td>0</td>\n",
797
+ " <td>Messenger</td>\n",
798
+ " </tr>\n",
799
+ " <tr>\n",
800
+ " <th>4</th>\n",
801
+ " <td>sản năm sao luân</td>\n",
802
+ " <td>5</td>\n",
803
+ " <td>1</td>\n",
804
+ " <td>Messenger</td>\n",
805
+ " </tr>\n",
806
+ " <tr>\n",
807
+ " <th>...</th>\n",
808
+ " <td>...</td>\n",
809
+ " <td>...</td>\n",
810
+ " <td>...</td>\n",
811
+ " <td>...</td>\n",
812
+ " </tr>\n",
813
+ " <tr>\n",
814
+ " <th>91994</th>\n",
815
+ " <td>cập nhật không được ạ</td>\n",
816
+ " <td>4</td>\n",
817
+ " <td>0</td>\n",
818
+ " <td>Instagram</td>\n",
819
+ " </tr>\n",
820
+ " <tr>\n",
821
+ " <th>91995</th>\n",
822
+ " <td>sao ko vô dc</td>\n",
823
+ " <td>5</td>\n",
824
+ " <td>0</td>\n",
825
+ " <td>Instagram</td>\n",
826
+ " </tr>\n",
827
+ " <tr>\n",
828
+ " <th>91996</th>\n",
829
+ " <td>chụp đẹp nhưng chưa có tính năng giây nha mong...</td>\n",
830
+ " <td>4</td>\n",
831
+ " <td>0</td>\n",
832
+ " <td>Instagram</td>\n",
833
+ " </tr>\n",
834
+ " <tr>\n",
835
+ " <th>91997</th>\n",
836
+ " <td>điện video bị lỗi</td>\n",
837
+ " <td>1</td>\n",
838
+ " <td>0</td>\n",
839
+ " <td>Instagram</td>\n",
840
+ " </tr>\n",
841
+ " <tr>\n",
842
+ " <th>91998</th>\n",
843
+ " <td>chụp ảnh lưu về máy xem lại ko có</td>\n",
844
+ " <td>1</td>\n",
845
+ " <td>0</td>\n",
846
+ " <td>Instagram</td>\n",
847
+ " </tr>\n",
848
+ " </tbody>\n",
849
+ "</table>\n",
850
+ "<p>91999 rows × 4 columns</p>\n",
851
+ "</div>"
852
+ ],
853
+ "text/plain": [
854
+ " content score \\\n",
855
+ "0 không làm được 1 \n",
856
+ "1 đăng xuất ra vô lại bị lỗi nhìu 1 \n",
857
+ "2 cập nhật lại giùm cái 5 \n",
858
+ "3 1 sao vì chặn mà vẫn gỡ được 1 \n",
859
+ "4 sản năm sao luân 5 \n",
860
+ "... ... ... \n",
861
+ "91994 cập nhật không được ạ 4 \n",
862
+ "91995 sao ko vô dc 5 \n",
863
+ "91996 chụp đẹp nhưng chưa có tính năng giây nha mong... 4 \n",
864
+ "91997 điện video bị lỗi 1 \n",
865
+ "91998 chụp ảnh lưu về máy xem lại ko có 1 \n",
866
+ "\n",
867
+ " thumbsUpCount Application \n",
868
+ "0 1 Messenger \n",
869
+ "1 1 Messenger \n",
870
+ "2 2 Messenger \n",
871
+ "3 0 Messenger \n",
872
+ "4 1 Messenger \n",
873
+ "... ... ... \n",
874
+ "91994 0 Instagram \n",
875
+ "91995 0 Instagram \n",
876
+ "91996 0 Instagram \n",
877
+ "91997 0 Instagram \n",
878
+ "91998 0 Instagram \n",
879
+ "\n",
880
+ "[91999 rows x 4 columns]"
881
+ ]
882
+ },
883
+ "execution_count": 236,
884
+ "metadata": {},
885
+ "output_type": "execute_result"
886
+ }
887
+ ],
888
+ "source": [
889
+ "data_output"
890
+ ]
891
+ },
892
+ {
893
+ "cell_type": "code",
894
+ "execution_count": 237,
895
+ "metadata": {},
896
+ "outputs": [],
897
+ "source": [
898
+ "data_output.to_csv(\"../data/clean_data_v2.csv\")"
899
+ ]
900
+ },
901
+ {
902
+ "cell_type": "code",
903
+ "execution_count": null,
904
+ "metadata": {},
905
+ "outputs": [],
906
+ "source": []
907
+ }
908
+ ],
909
+ "metadata": {
910
+ "kernelspec": {
911
+ "display_name": "base",
912
+ "language": "python",
913
+ "name": "python3"
914
+ },
915
+ "language_info": {
916
+ "codemirror_mode": {
917
+ "name": "ipython",
918
+ "version": 3
919
+ },
920
+ "file_extension": ".py",
921
+ "mimetype": "text/x-python",
922
+ "name": "python",
923
+ "nbconvert_exporter": "python",
924
+ "pygments_lexer": "ipython3",
925
+ "version": "3.11.4"
926
+ },
927
+ "orig_nbformat": 4
928
+ },
929
+ "nbformat": 4,
930
+ "nbformat_minor": 2
931
+ }
CustomerReviewSentiment/process/spell_correction.ipynb ADDED
@@ -0,0 +1,535 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cells": [
3
+ {
4
+ "cell_type": "code",
5
+ "execution_count": 1,
6
+ "metadata": {},
7
+ "outputs": [
8
+ {
9
+ "name": "stdout",
10
+ "output_type": "stream",
11
+ "text": [
12
+ "Request thành công\n",
13
+ "Response: {'code': 0, 'message': 'OK', 'result': {'suggestions': [{'startIndex': 8, 'endIndex': 11, 'originalText': 'the', 'suggestion': 'thế', 'confidence': 1.0}, {'startIndex': 12, 'endIndex': 14, 'originalText': 'cậ', 'suggestion': 'cậu', 'confidence': 1.0}]}}\n"
14
+ ]
15
+ }
16
+ ],
17
+ "source": [
18
+ "import json\n",
19
+ "import requests\n",
20
+ "\n",
21
+ "# Thay thế các giá trị dưới đây bằng thông tin của API bạn muốn gọi và mã thông báo (token) của bạn\n",
22
+ "api_url = \"https://viettelgroup.ai/nlp/api/v1/spell-checking\"\n",
23
+ "token = \"d3dad67f59d38557460aaeae820e6071\"\n",
24
+ "\n",
25
+ "# Dữ liệu bạn muốn gửi trong request POST (nếu có)\n",
26
+ "data = {\n",
27
+ " \"sentence\": \"Làm sao the cậ?\"\n",
28
+ "}\n",
29
+ "\n",
30
+ "# Tiêu đề Authorization chứa mã thông báo\n",
31
+ "headers = {'Content-Type': 'application/json', 'token': token}\n",
32
+ "\n",
33
+ "# Thực hiện cuộc gọi POST\n",
34
+ "response = requests.post(api_url, json=data, headers=headers)\n",
35
+ "\n",
36
+ "# Kiểm tra phản hồi từ server\n",
37
+ "if response.status_code == 200:\n",
38
+ " print('Request thành công')\n",
39
+ " print('Response:', response.json())\n",
40
+ "else:\n",
41
+ " print('Request thất bại')\n",
42
+ " print('Status code:', response.status_code)\n",
43
+ " print('Response:', response.text)"
44
+ ]
45
+ },
46
+ {
47
+ "cell_type": "code",
48
+ "execution_count": 2,
49
+ "metadata": {},
50
+ "outputs": [],
51
+ "source": [
52
+ "api_url = \"https://viettelgroup.ai/nlp/api/v1/spell-checking\"\n",
53
+ "token = \"d3dad67f59d38557460aaeae820e6071\"\n",
54
+ "\n",
55
+ "def spell_correcting(sentence, api_url, token):\n",
56
+ " # Dữ liệu bạn muốn gửi trong request POST (nếu có)\n",
57
+ " data = {\n",
58
+ " \"sentence\": sentence\n",
59
+ " }\n",
60
+ "\n",
61
+ " # Tiêu đề Authorization chứa mã thông báo\n",
62
+ " headers = {'Content-Type': 'application/json', 'token': token}\n",
63
+ "\n",
64
+ " # Thực hiện cuộc gọi POST\n",
65
+ " response = requests.post(api_url, json=data, headers=headers)\n",
66
+ "\n",
67
+ " # Kiểm tra phản hồi từ server\n",
68
+ " if response.status_code == 200:\n",
69
+ " return response.json()['result']['suggestions']\n",
70
+ " else:\n",
71
+ " return []\n",
72
+ "\n",
73
+ "def replace_text(input, api_url, token):\n",
74
+ " suggestion = spell_correcting(input, api_url, token)\n",
75
+ " for error in suggestion[::-1]:\n",
76
+ " if error['confidence'] > 0.7:\n",
77
+ " input = input[:error[\"startIndex\"]] + input[error[\"startIndex\"]:].replace(error['originalText'], error['suggestion'])\n",
78
+ " return input\n"
79
+ ]
80
+ },
81
+ {
82
+ "cell_type": "code",
83
+ "execution_count": 3,
84
+ "metadata": {},
85
+ "outputs": [
86
+ {
87
+ "data": {
88
+ "text/html": [
89
+ "<div>\n",
90
+ "<style scoped>\n",
91
+ " .dataframe tbody tr th:only-of-type {\n",
92
+ " vertical-align: middle;\n",
93
+ " }\n",
94
+ "\n",
95
+ " .dataframe tbody tr th {\n",
96
+ " vertical-align: top;\n",
97
+ " }\n",
98
+ "\n",
99
+ " .dataframe thead th {\n",
100
+ " text-align: right;\n",
101
+ " }\n",
102
+ "</style>\n",
103
+ "<table border=\"1\" class=\"dataframe\">\n",
104
+ " <thead>\n",
105
+ " <tr style=\"text-align: right;\">\n",
106
+ " <th></th>\n",
107
+ " <th>Unnamed: 0</th>\n",
108
+ " <th>content</th>\n",
109
+ " <th>score</th>\n",
110
+ " <th>thumbsUpCount</th>\n",
111
+ " <th>Application</th>\n",
112
+ " </tr>\n",
113
+ " </thead>\n",
114
+ " <tbody>\n",
115
+ " <tr>\n",
116
+ " <th>0</th>\n",
117
+ " <td>0</td>\n",
118
+ " <td>không làm được</td>\n",
119
+ " <td>1</td>\n",
120
+ " <td>1</td>\n",
121
+ " <td>Messenger</td>\n",
122
+ " </tr>\n",
123
+ " <tr>\n",
124
+ " <th>1</th>\n",
125
+ " <td>1</td>\n",
126
+ " <td>đăng xuất ra vô lại bị lỗi nhìu</td>\n",
127
+ " <td>1</td>\n",
128
+ " <td>1</td>\n",
129
+ " <td>Messenger</td>\n",
130
+ " </tr>\n",
131
+ " <tr>\n",
132
+ " <th>2</th>\n",
133
+ " <td>2</td>\n",
134
+ " <td>cập nhật lại giùm cái</td>\n",
135
+ " <td>5</td>\n",
136
+ " <td>2</td>\n",
137
+ " <td>Messenger</td>\n",
138
+ " </tr>\n",
139
+ " <tr>\n",
140
+ " <th>3</th>\n",
141
+ " <td>3</td>\n",
142
+ " <td>1 sao vì chặn mà vẫn gỡ được</td>\n",
143
+ " <td>1</td>\n",
144
+ " <td>0</td>\n",
145
+ " <td>Messenger</td>\n",
146
+ " </tr>\n",
147
+ " <tr>\n",
148
+ " <th>4</th>\n",
149
+ " <td>4</td>\n",
150
+ " <td>sản năm sao luân</td>\n",
151
+ " <td>5</td>\n",
152
+ " <td>1</td>\n",
153
+ " <td>Messenger</td>\n",
154
+ " </tr>\n",
155
+ " <tr>\n",
156
+ " <th>...</th>\n",
157
+ " <td>...</td>\n",
158
+ " <td>...</td>\n",
159
+ " <td>...</td>\n",
160
+ " <td>...</td>\n",
161
+ " <td>...</td>\n",
162
+ " </tr>\n",
163
+ " <tr>\n",
164
+ " <th>91994</th>\n",
165
+ " <td>91994</td>\n",
166
+ " <td>cập nhật không được ạ</td>\n",
167
+ " <td>4</td>\n",
168
+ " <td>0</td>\n",
169
+ " <td>Instagram</td>\n",
170
+ " </tr>\n",
171
+ " <tr>\n",
172
+ " <th>91995</th>\n",
173
+ " <td>91995</td>\n",
174
+ " <td>sao ko vô dc</td>\n",
175
+ " <td>5</td>\n",
176
+ " <td>0</td>\n",
177
+ " <td>Instagram</td>\n",
178
+ " </tr>\n",
179
+ " <tr>\n",
180
+ " <th>91996</th>\n",
181
+ " <td>91996</td>\n",
182
+ " <td>chụp đẹp nhưng chưa có tính năng giây nha mong...</td>\n",
183
+ " <td>4</td>\n",
184
+ " <td>0</td>\n",
185
+ " <td>Instagram</td>\n",
186
+ " </tr>\n",
187
+ " <tr>\n",
188
+ " <th>91997</th>\n",
189
+ " <td>91997</td>\n",
190
+ " <td>điện video bị lỗi</td>\n",
191
+ " <td>1</td>\n",
192
+ " <td>0</td>\n",
193
+ " <td>Instagram</td>\n",
194
+ " </tr>\n",
195
+ " <tr>\n",
196
+ " <th>91998</th>\n",
197
+ " <td>91998</td>\n",
198
+ " <td>chụp ảnh lưu về máy xem lại ko có</td>\n",
199
+ " <td>1</td>\n",
200
+ " <td>0</td>\n",
201
+ " <td>Instagram</td>\n",
202
+ " </tr>\n",
203
+ " </tbody>\n",
204
+ "</table>\n",
205
+ "<p>91999 rows × 5 columns</p>\n",
206
+ "</div>"
207
+ ],
208
+ "text/plain": [
209
+ " Unnamed: 0 content score \\\n",
210
+ "0 0 không làm được 1 \n",
211
+ "1 1 đăng xuất ra vô lại bị lỗi nhìu 1 \n",
212
+ "2 2 cập nhật lại giùm cái 5 \n",
213
+ "3 3 1 sao vì chặn mà vẫn gỡ được 1 \n",
214
+ "4 4 sản năm sao luân 5 \n",
215
+ "... ... ... ... \n",
216
+ "91994 91994 cập nhật không được ạ 4 \n",
217
+ "91995 91995 sao ko vô dc 5 \n",
218
+ "91996 91996 chụp đẹp nhưng chưa có tính năng giây nha mong... 4 \n",
219
+ "91997 91997 điện video bị lỗi 1 \n",
220
+ "91998 91998 chụp ảnh lưu về máy xem lại ko có 1 \n",
221
+ "\n",
222
+ " thumbsUpCount Application \n",
223
+ "0 1 Messenger \n",
224
+ "1 1 Messenger \n",
225
+ "2 2 Messenger \n",
226
+ "3 0 Messenger \n",
227
+ "4 1 Messenger \n",
228
+ "... ... ... \n",
229
+ "91994 0 Instagram \n",
230
+ "91995 0 Instagram \n",
231
+ "91996 0 Instagram \n",
232
+ "91997 0 Instagram \n",
233
+ "91998 0 Instagram \n",
234
+ "\n",
235
+ "[91999 rows x 5 columns]"
236
+ ]
237
+ },
238
+ "execution_count": 3,
239
+ "metadata": {},
240
+ "output_type": "execute_result"
241
+ }
242
+ ],
243
+ "source": [
244
+ "import pandas as pd\n",
245
+ "\n",
246
+ "data = pd.read_csv(\"../data/clean_data_v2.csv\")\n",
247
+ "data"
248
+ ]
249
+ },
250
+ {
251
+ "cell_type": "code",
252
+ "execution_count": 4,
253
+ "metadata": {},
254
+ "outputs": [],
255
+ "source": [
256
+ "from tqdm import tqdm"
257
+ ]
258
+ },
259
+ {
260
+ "cell_type": "code",
261
+ "execution_count": 5,
262
+ "metadata": {},
263
+ "outputs": [
264
+ {
265
+ "name": "stderr",
266
+ "output_type": "stream",
267
+ "text": [
268
+ "100%|██████████| 91999/91999 [4:01:07<00:00, 6.36it/s] \n"
269
+ ]
270
+ }
271
+ ],
272
+ "source": [
273
+ "tqdm.pandas()\n",
274
+ "data['spell_corrected_content'] = data['content'].progress_apply(lambda x: replace_text(x, api_url, token))"
275
+ ]
276
+ },
277
+ {
278
+ "cell_type": "code",
279
+ "execution_count": 7,
280
+ "metadata": {},
281
+ "outputs": [],
282
+ "source": [
283
+ "# data.to_csv(\"../data/spell_corrected_data_v3.csv\")"
284
+ ]
285
+ },
286
+ {
287
+ "cell_type": "code",
288
+ "execution_count": 8,
289
+ "metadata": {},
290
+ "outputs": [
291
+ {
292
+ "data": {
293
+ "text/html": [
294
+ "<div>\n",
295
+ "<style scoped>\n",
296
+ " .dataframe tbody tr th:only-of-type {\n",
297
+ " vertical-align: middle;\n",
298
+ " }\n",
299
+ "\n",
300
+ " .dataframe tbody tr th {\n",
301
+ " vertical-align: top;\n",
302
+ " }\n",
303
+ "\n",
304
+ " .dataframe thead th {\n",
305
+ " text-align: right;\n",
306
+ " }\n",
307
+ "</style>\n",
308
+ "<table border=\"1\" class=\"dataframe\">\n",
309
+ " <thead>\n",
310
+ " <tr style=\"text-align: right;\">\n",
311
+ " <th></th>\n",
312
+ " <th>Unnamed: 0</th>\n",
313
+ " <th>content</th>\n",
314
+ " <th>score</th>\n",
315
+ " <th>thumbsUpCount</th>\n",
316
+ " <th>Application</th>\n",
317
+ " <th>spell_corrected_content</th>\n",
318
+ " </tr>\n",
319
+ " </thead>\n",
320
+ " <tbody>\n",
321
+ " <tr>\n",
322
+ " <th>0</th>\n",
323
+ " <td>0</td>\n",
324
+ " <td>không làm được</td>\n",
325
+ " <td>1</td>\n",
326
+ " <td>1</td>\n",
327
+ " <td>Messenger</td>\n",
328
+ " <td>không làm được</td>\n",
329
+ " </tr>\n",
330
+ " <tr>\n",
331
+ " <th>1</th>\n",
332
+ " <td>1</td>\n",
333
+ " <td>đăng xuất ra vô lại bị lỗi nhìu</td>\n",
334
+ " <td>1</td>\n",
335
+ " <td>1</td>\n",
336
+ " <td>Messenger</td>\n",
337
+ " <td>đăng xuất ra vô lại bị lỗi nhiều</td>\n",
338
+ " </tr>\n",
339
+ " <tr>\n",
340
+ " <th>2</th>\n",
341
+ " <td>2</td>\n",
342
+ " <td>cập nhật lại giùm cái</td>\n",
343
+ " <td>5</td>\n",
344
+ " <td>2</td>\n",
345
+ " <td>Messenger</td>\n",
346
+ " <td>cập nhật lại giùm cái</td>\n",
347
+ " </tr>\n",
348
+ " <tr>\n",
349
+ " <th>3</th>\n",
350
+ " <td>3</td>\n",
351
+ " <td>1 sao vì chặn mà vẫn gỡ được</td>\n",
352
+ " <td>1</td>\n",
353
+ " <td>0</td>\n",
354
+ " <td>Messenger</td>\n",
355
+ " <td>1 sào vì chăn mà vẫn gỡ được</td>\n",
356
+ " </tr>\n",
357
+ " <tr>\n",
358
+ " <th>4</th>\n",
359
+ " <td>4</td>\n",
360
+ " <td>sản năm sao luân</td>\n",
361
+ " <td>5</td>\n",
362
+ " <td>1</td>\n",
363
+ " <td>Messenger</td>\n",
364
+ " <td>sạn năm sao luận</td>\n",
365
+ " </tr>\n",
366
+ " <tr>\n",
367
+ " <th>...</th>\n",
368
+ " <td>...</td>\n",
369
+ " <td>...</td>\n",
370
+ " <td>...</td>\n",
371
+ " <td>...</td>\n",
372
+ " <td>...</td>\n",
373
+ " <td>...</td>\n",
374
+ " </tr>\n",
375
+ " <tr>\n",
376
+ " <th>91994</th>\n",
377
+ " <td>91994</td>\n",
378
+ " <td>cập nhật không được ạ</td>\n",
379
+ " <td>4</td>\n",
380
+ " <td>0</td>\n",
381
+ " <td>Instagram</td>\n",
382
+ " <td>cập nhật không được ạ</td>\n",
383
+ " </tr>\n",
384
+ " <tr>\n",
385
+ " <th>91995</th>\n",
386
+ " <td>91995</td>\n",
387
+ " <td>sao ko vô dc</td>\n",
388
+ " <td>5</td>\n",
389
+ " <td>0</td>\n",
390
+ " <td>Instagram</td>\n",
391
+ " <td>sao không vô được</td>\n",
392
+ " </tr>\n",
393
+ " <tr>\n",
394
+ " <th>91996</th>\n",
395
+ " <td>91996</td>\n",
396
+ " <td>chụp đẹp nhưng chưa có tính năng giây nha mong...</td>\n",
397
+ " <td>4</td>\n",
398
+ " <td>0</td>\n",
399
+ " <td>Instagram</td>\n",
400
+ " <td>chụp đẹp nhưng chưa có tính năng giấy nhà mong...</td>\n",
401
+ " </tr>\n",
402
+ " <tr>\n",
403
+ " <th>91997</th>\n",
404
+ " <td>91997</td>\n",
405
+ " <td>điện video bị lỗi</td>\n",
406
+ " <td>1</td>\n",
407
+ " <td>0</td>\n",
408
+ " <td>Instagram</td>\n",
409
+ " <td>điện video bị lỗi</td>\n",
410
+ " </tr>\n",
411
+ " <tr>\n",
412
+ " <th>91998</th>\n",
413
+ " <td>91998</td>\n",
414
+ " <td>chụp ảnh lưu về máy xem lại ko có</td>\n",
415
+ " <td>1</td>\n",
416
+ " <td>0</td>\n",
417
+ " <td>Instagram</td>\n",
418
+ " <td>chụp ảnh lưu về máy xem lại không có</td>\n",
419
+ " </tr>\n",
420
+ " </tbody>\n",
421
+ "</table>\n",
422
+ "<p>91999 rows × 6 columns</p>\n",
423
+ "</div>"
424
+ ],
425
+ "text/plain": [
426
+ " Unnamed: 0 content score \\\n",
427
+ "0 0 không làm được 1 \n",
428
+ "1 1 đăng xuất ra vô lại bị lỗi nhìu 1 \n",
429
+ "2 2 cập nhật lại giùm cái 5 \n",
430
+ "3 3 1 sao vì chặn mà vẫn gỡ được 1 \n",
431
+ "4 4 sản năm sao luân 5 \n",
432
+ "... ... ... ... \n",
433
+ "91994 91994 cập nhật không được ạ 4 \n",
434
+ "91995 91995 sao ko vô dc 5 \n",
435
+ "91996 91996 chụp đẹp nhưng chưa có tính năng giây nha mong... 4 \n",
436
+ "91997 91997 điện video bị lỗi 1 \n",
437
+ "91998 91998 chụp ảnh lưu về máy xem lại ko có 1 \n",
438
+ "\n",
439
+ " thumbsUpCount Application \\\n",
440
+ "0 1 Messenger \n",
441
+ "1 1 Messenger \n",
442
+ "2 2 Messenger \n",
443
+ "3 0 Messenger \n",
444
+ "4 1 Messenger \n",
445
+ "... ... ... \n",
446
+ "91994 0 Instagram \n",
447
+ "91995 0 Instagram \n",
448
+ "91996 0 Instagram \n",
449
+ "91997 0 Instagram \n",
450
+ "91998 0 Instagram \n",
451
+ "\n",
452
+ " spell_corrected_content \n",
453
+ "0 không làm được \n",
454
+ "1 đăng xuất ra vô lại bị lỗi nhiều \n",
455
+ "2 cập nhật lại giùm cái \n",
456
+ "3 1 sào vì chăn mà vẫn gỡ được \n",
457
+ "4 sạn năm sao luận \n",
458
+ "... ... \n",
459
+ "91994 cập nhật không được ạ \n",
460
+ "91995 sao không vô được \n",
461
+ "91996 chụp đẹp nhưng chưa có tính năng giấy nhà mong... \n",
462
+ "91997 điện video bị lỗi \n",
463
+ "91998 chụp ảnh lưu về máy xem lại không có \n",
464
+ "\n",
465
+ "[91999 rows x 6 columns]"
466
+ ]
467
+ },
468
+ "execution_count": 8,
469
+ "metadata": {},
470
+ "output_type": "execute_result"
471
+ }
472
+ ],
473
+ "source": [
474
+ "data"
475
+ ]
476
+ },
477
+ {
478
+ "cell_type": "code",
479
+ "execution_count": 73,
480
+ "metadata": {},
481
+ "outputs": [
482
+ {
483
+ "name": "stdout",
484
+ "output_type": "stream",
485
+ "text": [
486
+ "Success!!!\n"
487
+ ]
488
+ },
489
+ {
490
+ "data": {
491
+ "text/plain": [
492
+ "'Làm sao thế cậu'"
493
+ ]
494
+ },
495
+ "execution_count": 73,
496
+ "metadata": {},
497
+ "output_type": "execute_result"
498
+ }
499
+ ],
500
+ "source": [
501
+ "sentence = \"Làm sao thê cậ\"\n",
502
+ "replace_text(sentence, api_url, token)"
503
+ ]
504
+ },
505
+ {
506
+ "cell_type": "code",
507
+ "execution_count": null,
508
+ "metadata": {},
509
+ "outputs": [],
510
+ "source": []
511
+ }
512
+ ],
513
+ "metadata": {
514
+ "kernelspec": {
515
+ "display_name": "base",
516
+ "language": "python",
517
+ "name": "python3"
518
+ },
519
+ "language_info": {
520
+ "codemirror_mode": {
521
+ "name": "ipython",
522
+ "version": 3
523
+ },
524
+ "file_extension": ".py",
525
+ "mimetype": "text/x-python",
526
+ "name": "python",
527
+ "nbconvert_exporter": "python",
528
+ "pygments_lexer": "ipython3",
529
+ "version": "3.11.4"
530
+ },
531
+ "orig_nbformat": 4
532
+ },
533
+ "nbformat": 4,
534
+ "nbformat_minor": 2
535
+ }
CustomerReviewSentiment/test/test_cleaner.ipynb ADDED
@@ -0,0 +1,421 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cells": [
3
+ {
4
+ "attachments": {},
5
+ "cell_type": "markdown",
6
+ "metadata": {},
7
+ "source": [
8
+ "## Config"
9
+ ]
10
+ },
11
+ {
12
+ "cell_type": "code",
13
+ "execution_count": 2,
14
+ "metadata": {},
15
+ "outputs": [
16
+ {
17
+ "name": "stdout",
18
+ "output_type": "stream",
19
+ "text": [
20
+ "/Users/tranxuanhuy/Documents/GitHub/CustomerReviewSentiment\n"
21
+ ]
22
+ }
23
+ ],
24
+ "source": [
25
+ "%cd .."
26
+ ]
27
+ },
28
+ {
29
+ "cell_type": "code",
30
+ "execution_count": 3,
31
+ "metadata": {},
32
+ "outputs": [
33
+ {
34
+ "name": "stdout",
35
+ "output_type": "stream",
36
+ "text": [
37
+ "README.md \u001b[34mdata\u001b[m\u001b[m \u001b[34mtest\u001b[m\u001b[m \u001b[34mutils\u001b[m\u001b[m\n"
38
+ ]
39
+ }
40
+ ],
41
+ "source": [
42
+ "# assure \"data\" folder in the output list\n",
43
+ "!ls"
44
+ ]
45
+ },
46
+ {
47
+ "cell_type": "code",
48
+ "execution_count": 4,
49
+ "metadata": {},
50
+ "outputs": [],
51
+ "source": [
52
+ "%load_ext autoreload\n",
53
+ "%autoreload 2"
54
+ ]
55
+ },
56
+ {
57
+ "attachments": {},
58
+ "cell_type": "markdown",
59
+ "metadata": {},
60
+ "source": [
61
+ "## Cleaning\n"
62
+ ]
63
+ },
64
+ {
65
+ "cell_type": "code",
66
+ "execution_count": 5,
67
+ "metadata": {},
68
+ "outputs": [],
69
+ "source": [
70
+ "import pandas as pd\n",
71
+ "from utils.cleaner import cleaning"
72
+ ]
73
+ },
74
+ {
75
+ "cell_type": "code",
76
+ "execution_count": 6,
77
+ "metadata": {},
78
+ "outputs": [
79
+ {
80
+ "data": {
81
+ "text/html": [
82
+ "<div>\n",
83
+ "<style scoped>\n",
84
+ " .dataframe tbody tr th:only-of-type {\n",
85
+ " vertical-align: middle;\n",
86
+ " }\n",
87
+ "\n",
88
+ " .dataframe tbody tr th {\n",
89
+ " vertical-align: top;\n",
90
+ " }\n",
91
+ "\n",
92
+ " .dataframe thead th {\n",
93
+ " text-align: right;\n",
94
+ " }\n",
95
+ "</style>\n",
96
+ "<table border=\"1\" class=\"dataframe\">\n",
97
+ " <thead>\n",
98
+ " <tr style=\"text-align: right;\">\n",
99
+ " <th></th>\n",
100
+ " <th>Unnamed: 0</th>\n",
101
+ " <th>content</th>\n",
102
+ " <th>score</th>\n",
103
+ " <th>thumbsUpCount</th>\n",
104
+ " <th>Application</th>\n",
105
+ " </tr>\n",
106
+ " </thead>\n",
107
+ " <tbody>\n",
108
+ " <tr>\n",
109
+ " <th>0</th>\n",
110
+ " <td>0</td>\n",
111
+ " <td>rất thuận tiện , có lợi ích .</td>\n",
112
+ " <td>5</td>\n",
113
+ " <td>2</td>\n",
114
+ " <td>Messenger</td>\n",
115
+ " </tr>\n",
116
+ " <tr>\n",
117
+ " <th>1</th>\n",
118
+ " <td>1</td>\n",
119
+ " <td>tốt</td>\n",
120
+ " <td>4</td>\n",
121
+ " <td>213</td>\n",
122
+ " <td>Messenger</td>\n",
123
+ " </tr>\n",
124
+ " <tr>\n",
125
+ " <th>2</th>\n",
126
+ " <td>2</td>\n",
127
+ " <td>ok</td>\n",
128
+ " <td>5</td>\n",
129
+ " <td>1</td>\n",
130
+ " <td>Messenger</td>\n",
131
+ " </tr>\n",
132
+ " <tr>\n",
133
+ " <th>3</th>\n",
134
+ " <td>3</td>\n",
135
+ " <td>xài rất tốt , nên tải nha</td>\n",
136
+ " <td>5</td>\n",
137
+ " <td>8</td>\n",
138
+ " <td>Messenger</td>\n",
139
+ " </tr>\n",
140
+ " <tr>\n",
141
+ " <th>4</th>\n",
142
+ " <td>4</td>\n",
143
+ " <td>gútttt</td>\n",
144
+ " <td>5</td>\n",
145
+ " <td>1</td>\n",
146
+ " <td>Messenger</td>\n",
147
+ " </tr>\n",
148
+ " <tr>\n",
149
+ " <th>...</th>\n",
150
+ " <td>...</td>\n",
151
+ " <td>...</td>\n",
152
+ " <td>...</td>\n",
153
+ " <td>...</td>\n",
154
+ " <td>...</td>\n",
155
+ " </tr>\n",
156
+ " <tr>\n",
157
+ " <th>310741</th>\n",
158
+ " <td>99995</td>\n",
159
+ " <td>ok</td>\n",
160
+ " <td>5</td>\n",
161
+ " <td>0</td>\n",
162
+ " <td>Instagram</td>\n",
163
+ " </tr>\n",
164
+ " <tr>\n",
165
+ " <th>310742</th>\n",
166
+ " <td>99996</td>\n",
167
+ " <td>g o o d</td>\n",
168
+ " <td>5</td>\n",
169
+ " <td>0</td>\n",
170
+ " <td>Instagram</td>\n",
171
+ " </tr>\n",
172
+ " <tr>\n",
173
+ " <th>310743</th>\n",
174
+ " <td>99997</td>\n",
175
+ " <td>có</td>\n",
176
+ " <td>5</td>\n",
177
+ " <td>0</td>\n",
178
+ " <td>Instagram</td>\n",
179
+ " </tr>\n",
180
+ " <tr>\n",
181
+ " <th>310744</th>\n",
182
+ " <td>99998</td>\n",
183
+ " <td>nhiều lúc tôi k lấy đc hiệu ứng</td>\n",
184
+ " <td>1</td>\n",
185
+ " <td>0</td>\n",
186
+ " <td>Instagram</td>\n",
187
+ " </tr>\n",
188
+ " <tr>\n",
189
+ " <th>310745</th>\n",
190
+ " <td>99999</td>\n",
191
+ " <td>tui chưa chơi ko biết có hay ko .</td>\n",
192
+ " <td>3</td>\n",
193
+ " <td>0</td>\n",
194
+ " <td>Instagram</td>\n",
195
+ " </tr>\n",
196
+ " </tbody>\n",
197
+ "</table>\n",
198
+ "<p>310746 rows × 5 columns</p>\n",
199
+ "</div>"
200
+ ],
201
+ "text/plain": [
202
+ " Unnamed: 0 content score thumbsUpCount \\\n",
203
+ "0 0 rất thuận tiện , có lợi ích . 5 2 \n",
204
+ "1 1 tốt 4 213 \n",
205
+ "2 2 ok 5 1 \n",
206
+ "3 3 xài rất tốt , nên tải nha 5 8 \n",
207
+ "4 4 gútttt 5 1 \n",
208
+ "... ... ... ... ... \n",
209
+ "310741 99995 ok 5 0 \n",
210
+ "310742 99996 g o o d 5 0 \n",
211
+ "310743 99997 có 5 0 \n",
212
+ "310744 99998 nhiều lúc tôi k lấy đc hiệu ứng 1 0 \n",
213
+ "310745 99999 tui chưa chơi ko biết có hay ko . 3 0 \n",
214
+ "\n",
215
+ " Application \n",
216
+ "0 Messenger \n",
217
+ "1 Messenger \n",
218
+ "2 Messenger \n",
219
+ "3 Messenger \n",
220
+ "4 Messenger \n",
221
+ "... ... \n",
222
+ "310741 Instagram \n",
223
+ "310742 Instagram \n",
224
+ "310743 Instagram \n",
225
+ "310744 Instagram \n",
226
+ "310745 Instagram \n",
227
+ "\n",
228
+ "[310746 rows x 5 columns]"
229
+ ]
230
+ },
231
+ "execution_count": 6,
232
+ "metadata": {},
233
+ "output_type": "execute_result"
234
+ }
235
+ ],
236
+ "source": [
237
+ "data = pd.read_csv('data/rawdata.csv')\n",
238
+ "data['content'] = data['content'].apply(cleaning)\n",
239
+ "data"
240
+ ]
241
+ },
242
+ {
243
+ "attachments": {},
244
+ "cell_type": "markdown",
245
+ "metadata": {},
246
+ "source": [
247
+ "## Manual Test"
248
+ ]
249
+ },
250
+ {
251
+ "cell_type": "code",
252
+ "execution_count": 9,
253
+ "metadata": {},
254
+ "outputs": [
255
+ {
256
+ "name": "stdout",
257
+ "output_type": "stream",
258
+ "text": [
259
+ "bị lỗi quài\n",
260
+ "bị lỗi quài\n",
261
+ "\n",
262
+ "Meslon\n",
263
+ "meslon\n",
264
+ "\n",
265
+ "Dcmm app như lolll lỗi hoài dcmm appp lolll mess sài như cc lỗi ko\n",
266
+ "dcmm app như lolll lỗi hoài dcmm appp lolll mess sài như cc lỗi ko\n",
267
+ "\n",
268
+ "Cập nhật dì mà lỗi quài nt thì ko hiện lên s mà đọc tr ơi....call vd thì mất filter..:(\n",
269
+ "cập nhật dì mà lỗi quài nt thì ko hiện lên s mà đọc tr ơi . call vd thì mất filter . \n",
270
+ "\n",
271
+ "App nt nhưng nhắn ko ai trl:)\n",
272
+ "app nt nhưng nhắn ko ai trl\n",
273
+ "\n",
274
+ "Cập nhật xg vẫn như cũ\n",
275
+ "cập nhật xg vẫn như cũ\n",
276
+ "\n",
277
+ "Tại sao tôi không có ghi chú ????\n",
278
+ "tại sao tôi không có ghi chú . \n",
279
+ "\n",
280
+ "Acc hk xài thì có ghi chú mà acc đag xài thì hk có r cập nhật cx hk có j ht trơn kì cục 😠\n",
281
+ "acc hk xài thì có ghi chú mà acc đag xài thì hk có r cập nhật cx hk có j ht trơn kì cục \n",
282
+ "\n",
283
+ "Bị lỗi hoài\n",
284
+ "bị lỗi hoài\n",
285
+ "\n"
286
+ ]
287
+ }
288
+ ],
289
+ "source": [
290
+ "raw_data = pd.read_csv('data/rawdata.csv')\n",
291
+ "\n",
292
+ "i = 2\n",
293
+ "for i in range(9*i, 9*(i+1)):\n",
294
+ " print(raw_data.loc[i, 'content'])\n",
295
+ " print(data.loc[i, 'content'])\n",
296
+ " print()"
297
+ ]
298
+ },
299
+ {
300
+ "cell_type": "code",
301
+ "execution_count": 14,
302
+ "metadata": {},
303
+ "outputs": [
304
+ {
305
+ "name": "stdout",
306
+ "output_type": "stream",
307
+ "text": [
308
+ "Acc hk xài thì có ghi chú mà acc đag xài thì hk có r cập nhật cx hk có j ht trơn kì cục =))\n"
309
+ ]
310
+ }
311
+ ],
312
+ "source": [
313
+ "text = \"Acc hk xài thì có ghi chú mà acc đag xài thì hk có r cập nhật cx hk có j ht trơn kì cục 😠\"\n",
314
+ "text = \"Acc hk xài thì có ghi chú mà acc đag xài thì hk có r cập nhật cx hk có j ht trơn kì cục =))\"\n",
315
+ "print(text)"
316
+ ]
317
+ },
318
+ {
319
+ "cell_type": "code",
320
+ "execution_count": 15,
321
+ "metadata": {},
322
+ "outputs": [
323
+ {
324
+ "data": {
325
+ "text/plain": [
326
+ "'Acc hk xài thì có ghi chú mà acc đag xài thì hk có r cập nhật cx hk có j ht trơn kì cục =))'"
327
+ ]
328
+ },
329
+ "execution_count": 15,
330
+ "metadata": {},
331
+ "output_type": "execute_result"
332
+ }
333
+ ],
334
+ "source": [
335
+ "import re\n",
336
+ "def deEmojify(text):\n",
337
+ " regrex_pattern = re.compile(pattern = \"[\"\n",
338
+ " u\"\\U0001F600-\\U0001F64F\" # emoticons\n",
339
+ " u\"\\U0001F300-\\U0001F5FF\" # symbols & pictographs\n",
340
+ " u\"\\U0001F680-\\U0001F6FF\" # transport & map symbols\n",
341
+ " u\"\\U0001F1E0-\\U0001F1FF\" # flags (iOS)\n",
342
+ " \"]+\", flags = re.UNICODE)\n",
343
+ " return regrex_pattern.sub(r'',text)\n",
344
+ "\n",
345
+ "deEmojify(text)"
346
+ ]
347
+ },
348
+ {
349
+ "cell_type": "code",
350
+ "execution_count": null,
351
+ "metadata": {},
352
+ "outputs": [],
353
+ "source": [
354
+ "import numpy as np\n",
355
+ "\n",
356
+ "def filter_stop_words(train_sentences, stop_words):\n",
357
+ " new_sent = [word for word in train_sentences.split() if word not in stop_words]\n",
358
+ " train_sentences = ' '.join(new_sent)\n",
359
+ " return train_sentences\n",
360
+ "\n",
361
+ "\n",
362
+ "def deEmojify(text):\n",
363
+ " regrex_pattern = re.compile(pattern = \"[\"\n",
364
+ " u\"\\U0001F600-\\U0001F64F\" # emoticons\n",
365
+ " u\"\\U0001F300-\\U0001F5FF\" # symbols & pictographs\n",
366
+ " u\"\\U0001F680-\\U0001F6FF\" # transport & map symbols\n",
367
+ " u\"\\U0001F1E0-\\U0001F1FF\" # flags (iOS)\n",
368
+ " \"]+\", flags = re.UNICODE)\n",
369
+ " return regrex_pattern.sub(r'',text)\n",
370
+ "\n",
371
+ "\n",
372
+ "def preprocess(text, tokenized=True, lowercased=True):\n",
373
+ " # text = ViTokenizer.tokenize(text)\n",
374
+ " # text = ' '.join(vncorenlp.tokenize(text)[0])\n",
375
+ " #text = filter_stop_words(text, stopwords)\n",
376
+ " #text = deEmojify(text)\n",
377
+ " #text = text.lower() if lowercased else text\n",
378
+ " if tokenized:\n",
379
+ " pre_text = \"\"\n",
380
+ " #sentences = vncorenlp.tokenize(text)\n",
381
+ " for sentence in text:\n",
382
+ " pre_text += \" \".join(sentence)\n",
383
+ " text = pre_text\n",
384
+ " return text\n",
385
+ "\n",
386
+ "\n",
387
+ "def pre_process_features(X, y, tokenized=True, lowercased=True):\n",
388
+ " X = np.array(X)\n",
389
+ " y = np.array(y)\n",
390
+ " X = [preprocess(str(p), tokenized=tokenized, lowercased=lowercased) for p in list(X)]\n",
391
+ " for idx, ele in enumerate(X):\n",
392
+ " if not ele:\n",
393
+ " np.delete(X, idx)\n",
394
+ " np.delete(y, idx)\n",
395
+ " return X, y"
396
+ ]
397
+ }
398
+ ],
399
+ "metadata": {
400
+ "kernelspec": {
401
+ "display_name": "base",
402
+ "language": "python",
403
+ "name": "python3"
404
+ },
405
+ "language_info": {
406
+ "codemirror_mode": {
407
+ "name": "ipython",
408
+ "version": 3
409
+ },
410
+ "file_extension": ".py",
411
+ "mimetype": "text/x-python",
412
+ "name": "python",
413
+ "nbconvert_exporter": "python",
414
+ "pygments_lexer": "ipython3",
415
+ "version": "3.11.4"
416
+ },
417
+ "orig_nbformat": 4
418
+ },
419
+ "nbformat": 4,
420
+ "nbformat_minor": 2
421
+ }
CustomerReviewSentiment/utils/__pycache__/cleaner.cpython-311.pyc ADDED
Binary file (1.16 kB). View file
 
CustomerReviewSentiment/utils/cleaner.py ADDED
@@ -0,0 +1,15 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import re
2
+ import math
3
+
4
+ def cleaning(text):
5
+ if isinstance(text, str):
6
+ text = text.lower()
7
+ text = re.sub(r'[^ ,.?!a-z0-9àáảãạăắằẳẵặâấầẩẫậèéẻẽẹêếềểễệđìíỉĩịòóỏõọôốồổỗộơớờởỡợùúủũụưứừửữựỳýỷỹỵ]', '', text)
8
+ text = re.sub(r'[.!?]+', '.', text)
9
+ text = re.sub(r'([,.!?])\1+', r'\1', text)
10
+ text = re.sub(r'[,]+', ' , ', text)
11
+ text = re.sub(r'[.]+', ' . ', text)
12
+ text = re.sub(r'([ ])\1+', r'\1', text)
13
+ return text
14
+ return text
15
+
CustomerReviewSentiment/vietnamese-stopwords.txt ADDED
@@ -0,0 +1,1942 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ a lô
2
+ a ha
3
+ ai
4
+ ai ai
5
+ ai nấy
6
+ ai đó
7
+ alô
8
+ amen
9
+ anh
10
+ anh ấy
11
+ ba
12
+ ba ba
13
+ ba bản
14
+ ba cùng
15
+ ba họ
16
+ ba ngày
17
+ ba ngôi
18
+ ba tăng
19
+ bao giờ
20
+ bao lâu
21
+ bao nhiêu
22
+ bao nả
23
+ bay biến
24
+ biết
25
+ biết bao
26
+ biết bao nhiêu
27
+ biết chắc
28
+ biết chừng nào
29
+ biết mình
30
+ biết mấy
31
+ biết thế
32
+ biết trước
33
+ biết việc
34
+ biết đâu
35
+ biết đâu chừng
36
+ biết đâu đấy
37
+ biết được
38
+ buổi
39
+ buổi làm
40
+ buổi mới
41
+ buổi ngày
42
+ buổi sớm
43
+
44
+ bà ấy
45
+ bài
46
+ bài bác
47
+ bài bỏ
48
+ bài cái
49
+ bác
50
+ bán
51
+ bán cấp
52
+ bán dạ
53
+ bán thế
54
+ bây bẩy
55
+ bây chừ
56
+ bây giờ
57
+ bây nhiêu
58
+ bèn
59
+ béng
60
+ bên
61
+ bên bị
62
+ bên có
63
+ bên cạnh
64
+ bông
65
+ bước
66
+ bước khỏi
67
+ bước tới
68
+ bước đi
69
+ bạn
70
+ bản
71
+ bản bộ
72
+ bản riêng
73
+ bản thân
74
+ bản ý
75
+ bất chợt
76
+ bất cứ
77
+ bất giác
78
+ bất kì
79
+ bất kể
80
+ bất kỳ
81
+ bất luận
82
+ bất ngờ
83
+ bất nhược
84
+ bất quá
85
+ bất quá chỉ
86
+ bất thình lình
87
+ bất tử
88
+ bất đồ
89
+ bấy
90
+ bấy chầy
91
+ bấy chừ
92
+ bấy giờ
93
+ bấy lâu
94
+ bấy lâu nay
95
+ bấy nay
96
+ bấy nhiêu
97
+ bập bà bập bõm
98
+ bập bõm
99
+ bắt đầu
100
+ bắt đầu từ
101
+ bằng
102
+ bằng cứ
103
+ bằng không
104
+ bằng người
105
+ bằng nhau
106
+ bằng như
107
+ bằng nào
108
+ bằng nấy
109
+ bằng vào
110
+ bằng được
111
+ bằng ấy
112
+ bển
113
+ bệt
114
+ bị
115
+ bị chú
116
+ bị vì
117
+ bỏ
118
+ bỏ bà
119
+ bỏ cha
120
+ bỏ cuộc
121
+ bỏ không
122
+ bỏ lại
123
+ bỏ mình
124
+ bỏ mất
125
+ bỏ mẹ
126
+ bỏ nhỏ
127
+ bỏ quá
128
+ bỏ ra
129
+ bỏ riêng
130
+ bỏ việc
131
+ bỏ xa
132
+ bỗng
133
+ bỗng chốc
134
+ bỗng dưng
135
+ bỗng không
136
+ bỗng nhiên
137
+ bỗng nhưng
138
+ bỗng thấy
139
+ bỗng đâu
140
+ bộ
141
+ bộ thuộc
142
+ bộ điều
143
+ bội phần
144
+ bớ
145
+ bởi
146
+ bởi ai
147
+ bởi chưng
148
+ bởi nhưng
149
+ bởi sao
150
+ bởi thế
151
+ bởi thế cho nên
152
+ bởi tại
153
+ bởi vì
154
+ bởi vậy
155
+ bởi đâu
156
+ bức
157
+ cao
158
+ cao lâu
159
+ cao ráo
160
+ cao răng
161
+ cao sang
162
+ cao số
163
+ cao thấp
164
+ cao thế
165
+ cao xa
166
+ cha
167
+ cha chả
168
+ chao ôi
169
+ chia sẻ
170
+ chiếc
171
+ cho
172
+ cho biết
173
+ cho chắc
174
+ cho hay
175
+ cho nhau
176
+ cho nên
177
+ cho rằng
178
+ cho rồi
179
+ cho thấy
180
+ cho tin
181
+ cho tới
182
+ cho tới khi
183
+ cho về
184
+ cho ăn
185
+ cho đang
186
+ cho được
187
+ cho đến
188
+ cho đến khi
189
+ cho đến nỗi
190
+ choa
191
+ chu cha
192
+ chui cha
193
+ chung
194
+ chung cho
195
+ chung chung
196
+ chung cuộc
197
+ chung cục
198
+ chung nhau
199
+ chung qui
200
+ chung quy
201
+ chung quy lại
202
+ chung ái
203
+ chuyển
204
+ chuyển tự
205
+ chuyển đạt
206
+ chuyện
207
+ chuẩn bị
208
+ chành chạnh
209
+ chí chết
210
+ chính
211
+ chính bản
212
+ chính giữa
213
+ chính là
214
+ chính thị
215
+ chính điểm
216
+ chùn chùn
217
+ chùn chũn
218
+ chú
219
+ chú dẫn
220
+ chú khách
221
+ chú mày
222
+ chú mình
223
+ chúng
224
+ chúng mình
225
+ chúng ta
226
+ chúng tôi
227
+ chúng ông
228
+ chăn chắn
229
+ chăng
230
+ chăng chắc
231
+ chăng nữa
232
+ chơi
233
+ chơi họ
234
+ chưa
235
+ chưa bao giờ
236
+ chưa chắc
237
+ chưa có
238
+ chưa cần
239
+ chưa dùng
240
+ chưa dễ
241
+ chưa kể
242
+ chưa tính
243
+ chưa từng
244
+ chầm chập
245
+ chậc
246
+ chắc
247
+ chắc chắn
248
+ chắc dạ
249
+ chắc hẳn
250
+ chắc lòng
251
+ chắc người
252
+ chắc vào
253
+ chắc ăn
254
+ chẳng lẽ
255
+ chẳng những
256
+ chẳng nữa
257
+ chẳng phải
258
+ chết nỗi
259
+ chết thật
260
+ chết tiệt
261
+ chỉ
262
+ chỉ chính
263
+ chỉ có
264
+ chỉ là
265
+ chỉ tên
266
+ chỉn
267
+ chị
268
+ chị bộ
269
+ chị ấy
270
+ chịu
271
+ chịu chưa
272
+ chịu lời
273
+ chịu tốt
274
+ chịu ăn
275
+ chọn
276
+ chọn bên
277
+ chọn ra
278
+ chốc chốc
279
+ chớ
280
+ chớ chi
281
+ chớ gì
282
+ chớ không
283
+ chớ kể
284
+ chớ như
285
+ chợt
286
+ chợt nghe
287
+ chợt nhìn
288
+ chủn
289
+ chứ
290
+ chứ ai
291
+ chứ còn
292
+ chứ gì
293
+ chứ không
294
+ chứ không phải
295
+ chứ lại
296
+ chứ lị
297
+ chứ như
298
+ chứ sao
299
+ coi bộ
300
+ coi mòi
301
+ con
302
+ con con
303
+ con dạ
304
+ con nhà
305
+ con tính
306
+ cu cậu
307
+ cuối
308
+ cuối cùng
309
+ cuối điểm
310
+ cuốn
311
+ cuộc
312
+ càng
313
+ càng càng
314
+ càng hay
315
+ cá nhân
316
+ các
317
+ các cậu
318
+ cách
319
+ cách bức
320
+ cách không
321
+ cách nhau
322
+ cách đều
323
+ cái
324
+ cái gì
325
+ cái họ
326
+ cái đã
327
+ cái đó
328
+ cái ấy
329
+ câu hỏi
330
+ cây
331
+ cây nước
332
+ còn
333
+ còn như
334
+ còn nữa
335
+ còn thời gian
336
+ còn về
337
+
338
+ có ai
339
+ có chuyện
340
+ có chăng
341
+ có chăng là
342
+ có chứ
343
+ có cơ
344
+ có dễ
345
+ có họ
346
+ có khi
347
+ có ngày
348
+ có người
349
+ có nhiều
350
+ có nhà
351
+ có phải
352
+ có số
353
+ có tháng
354
+ có thế
355
+ có thể
356
+ có vẻ
357
+ có ý
358
+ có ăn
359
+ có điều
360
+ có điều kiện
361
+ có đáng
362
+ có đâu
363
+ có được
364
+ cóc khô
365
+
366
+ cô mình
367
+ cô quả
368
+ cô tăng
369
+ cô ấy
370
+ công nhiên
371
+ cùng
372
+ cùng chung
373
+ cùng cực
374
+ cùng nhau
375
+ cùng tuổi
376
+ cùng tột
377
+ cùng với
378
+ cùng ăn
379
+ căn
380
+ căn cái
381
+ căn cắt
382
+ căn tính
383
+ cũng
384
+ cũng như
385
+ cũng nên
386
+ cũng thế
387
+ cũng vậy
388
+ cũng vậy thôi
389
+ cũng được
390
+
391
+ cơ chỉ
392
+ cơ chừng
393
+ cơ cùng
394
+ cơ dẫn
395
+ cơ hồ
396
+ cơ hội
397
+ cơ mà
398
+ cơn
399
+ cả
400
+ cả nghe
401
+ cả nghĩ
402
+ cả ngày
403
+ cả người
404
+ cả nhà
405
+ cả năm
406
+ cả thảy
407
+ cả thể
408
+ cả tin
409
+ cả ăn
410
+ cả đến
411
+ cảm thấy
412
+ cảm ơn
413
+ cấp
414
+ cấp số
415
+ cấp trực tiếp
416
+ cần
417
+ cần cấp
418
+ cần gì
419
+ cần số
420
+ cật lực
421
+ cật sức
422
+ cậu
423
+ cổ lai
424
+ cụ thể
425
+ cụ thể là
426
+ cụ thể như
427
+ của
428
+ của ngọt
429
+ của tin
430
+ cứ
431
+ cứ như
432
+ cứ việc
433
+ cứ điểm
434
+ cực lực
435
+ do
436
+ do vì
437
+ do vậy
438
+ do đó
439
+ duy
440
+ duy chỉ
441
+ duy có
442
+ dài
443
+ dài lời
444
+ dài ra
445
+ dành
446
+ dành dành
447
+ dào
448
+
449
+
450
+ dù cho
451
+ dù dì
452
+ dù gì
453
+ dù rằng
454
+ dù sao
455
+ dùng
456
+ dùng cho
457
+ dùng hết
458
+ dùng làm
459
+ dùng đến
460
+ dưới
461
+ dưới nước
462
+ dạ
463
+ dạ bán
464
+ dạ con
465
+ dạ dài
466
+ dạ dạ
467
+ dạ khách
468
+ dần dà
469
+ dần dần
470
+ dầu sao
471
+ dẫn
472
+ dẫu
473
+ dẫu mà
474
+ dẫu rằng
475
+ dẫu sao
476
+ dễ
477
+ dễ dùng
478
+ dễ gì
479
+ dễ khiến
480
+ dễ nghe
481
+ dễ ngươi
482
+ dễ như chơi
483
+ dễ sợ
484
+ dễ sử dụng
485
+ dễ thường
486
+ dễ thấy
487
+ dễ ăn
488
+ dễ đâu
489
+ dở chừng
490
+ dữ
491
+ dữ cách
492
+ em
493
+ em em
494
+ giá trị
495
+ giá trị thực tế
496
+ giảm
497
+ giảm chính
498
+ giảm thấp
499
+ giảm thế
500
+ giống
501
+ giống người
502
+ giống nhau
503
+ giống như
504
+ giờ
505
+ giờ lâu
506
+ giờ này
507
+ giờ đi
508
+ giờ đây
509
+ giờ đến
510
+ giữ
511
+ giữ lấy
512
+ giữ ý
513
+ giữa
514
+ giữa lúc
515
+ gây
516
+ gây cho
517
+ gây giống
518
+ gây ra
519
+ gây thêm
520
+
521
+ gì gì
522
+ gì đó
523
+ gần
524
+ gần bên
525
+ gần hết
526
+ gần ngày
527
+ gần như
528
+ gần xa
529
+ gần đây
530
+ gần đến
531
+ gặp
532
+ gặp khó khăn
533
+ gặp phải
534
+ gồm
535
+ hay
536
+ hay biết
537
+ hay hay
538
+ hay không
539
+ hay là
540
+ hay làm
541
+ hay nhỉ
542
+ hay nói
543
+ hay sao
544
+ hay tin
545
+ hay đâu
546
+ hiểu
547
+ hiện nay
548
+ hiện tại
549
+ hoàn toàn
550
+ hoặc
551
+ hoặc là
552
+ hãy
553
+ hãy còn
554
+ hơn
555
+ hơn cả
556
+ hơn hết
557
+ hơn là
558
+ hơn nữa
559
+ hơn trước
560
+ hầu hết
561
+ hết
562
+ hết chuyện
563
+ hết cả
564
+ hết của
565
+ hết nói
566
+ hết ráo
567
+ hết rồi
568
+ hết ý
569
+ họ
570
+ họ gần
571
+ họ xa
572
+ hỏi
573
+ hỏi lại
574
+ hỏi xem
575
+ hỏi xin
576
+ hỗ trợ
577
+ khi
578
+ khi khác
579
+ khi không
580
+ khi nào
581
+ khi nên
582
+ khi trước
583
+ khiến
584
+ khoảng
585
+ khoảng cách
586
+ khoảng không
587
+ khá
588
+ khá tốt
589
+ khác
590
+ khác gì
591
+ khác khác
592
+ khác nhau
593
+ khác nào
594
+ khác thường
595
+ khác xa
596
+ khách
597
+ khó
598
+ khó biết
599
+ khó chơi
600
+ khó khăn
601
+ khó làm
602
+ khó mở
603
+ khó nghe
604
+ khó nghĩ
605
+ khó nói
606
+ khó thấy
607
+ khó tránh
608
+ không
609
+ không ai
610
+ không bao giờ
611
+ không bao lâu
612
+ không biết
613
+ không bán
614
+ không chỉ
615
+ không còn
616
+ không có
617
+ không có gì
618
+ không cùng
619
+ không cần
620
+ không cứ
621
+ không dùng
622
+ không gì
623
+ không hay
624
+ không khỏi
625
+ không kể
626
+ không ngoài
627
+ không nhận
628
+ không những
629
+ không phải
630
+ không phải không
631
+ không thể
632
+ không tính
633
+ không điều kiện
634
+ không được
635
+ không đầy
636
+ không để
637
+ khẳng định
638
+ khỏi
639
+ khỏi nói
640
+ kể
641
+ kể cả
642
+ kể như
643
+ kể tới
644
+ kể từ
645
+ liên quan
646
+ loại
647
+ loại từ
648
+ luôn
649
+ luôn cả
650
+ luôn luôn
651
+ luôn tay
652
+
653
+ là cùng
654
+ là là
655
+ là nhiều
656
+ là phải
657
+ là thế nào
658
+ là vì
659
+ là ít
660
+ làm
661
+ làm bằng
662
+ làm cho
663
+ làm dần dần
664
+ làm gì
665
+ làm lòng
666
+ làm lại
667
+ làm lấy
668
+ làm mất
669
+ làm ngay
670
+ làm như
671
+ làm nên
672
+ làm ra
673
+ làm riêng
674
+ làm sao
675
+ làm theo
676
+ làm thế nào
677
+ làm tin
678
+ làm tôi
679
+ làm tăng
680
+ làm tại
681
+ làm tắp lự
682
+ làm vì
683
+ làm đúng
684
+ làm được
685
+ lâu
686
+ lâu các
687
+ lâu lâu
688
+ lâu nay
689
+ lâu ngày
690
+ lên
691
+ lên cao
692
+ lên cơn
693
+ lên mạnh
694
+ lên ngôi
695
+ lên nước
696
+ lên số
697
+ lên xuống
698
+ lên đến
699
+ lòng
700
+ lòng không
701
+ lúc
702
+ lúc khác
703
+ lúc lâu
704
+ lúc nào
705
+ lúc này
706
+ lúc sáng
707
+ lúc trước
708
+ lúc đi
709
+ lúc đó
710
+ lúc đến
711
+ lúc ấy
712
+ lý do
713
+ lượng
714
+ lượng cả
715
+ lượng số
716
+ lượng từ
717
+ lại
718
+ lại bộ
719
+ lại cái
720
+ lại còn
721
+ lại giống
722
+ lại làm
723
+ lại người
724
+ lại nói
725
+ lại nữa
726
+ lại quả
727
+ lại thôi
728
+ lại ăn
729
+ lại đây
730
+ lấy
731
+ lấy có
732
+ lấy cả
733
+ lấy giống
734
+ lấy làm
735
+ lấy lý do
736
+ lấy lại
737
+ lấy ra
738
+ lấy ráo
739
+ lấy sau
740
+ lấy số
741
+ lấy thêm
742
+ lấy thế
743
+ lấy vào
744
+ lấy xuống
745
+ lấy được
746
+ lấy để
747
+ lần
748
+ lần khác
749
+ lần lần
750
+ lần nào
751
+ lần này
752
+ lần sang
753
+ lần sau
754
+ lần theo
755
+ lần trước
756
+ lần tìm
757
+ lớn
758
+ lớn lên
759
+ lớn nhỏ
760
+ lời
761
+ lời chú
762
+ lời nói
763
+ mang
764
+ mang lại
765
+ mang mang
766
+ mang nặng
767
+ mang về
768
+ muốn
769
+
770
+ mà cả
771
+ mà không
772
+ mà lại
773
+ mà thôi
774
+ mà vẫn
775
+ mình
776
+ mạnh
777
+ mất
778
+ mất còn
779
+ mọi
780
+ mọi giờ
781
+ mọi khi
782
+ mọi lúc
783
+ mọi người
784
+ mọi nơi
785
+ mọi sự
786
+ mọi thứ
787
+ mọi việc
788
+ mối
789
+ mỗi
790
+ mỗi lúc
791
+ mỗi lần
792
+ mỗi một
793
+ mỗi ngày
794
+ mỗi người
795
+ một
796
+ một cách
797
+ một cơn
798
+ một khi
799
+ một lúc
800
+ một số
801
+ một vài
802
+ một ít
803
+ mới
804
+ mới hay
805
+ mới rồi
806
+ mới đây
807
+ mở
808
+ mở mang
809
+ mở nước
810
+ mở ra
811
+ mợ
812
+ mức
813
+ nay
814
+ ngay
815
+ ngay bây giờ
816
+ ngay cả
817
+ ngay khi
818
+ ngay khi đến
819
+ ngay lúc
820
+ ngay lúc này
821
+ ngay lập tức
822
+ ngay thật
823
+ ngay tức khắc
824
+ ngay tức thì
825
+ ngay từ
826
+ nghe
827
+ nghe chừng
828
+ nghe hiểu
829
+ nghe không
830
+ nghe lại
831
+ nghe nhìn
832
+ nghe như
833
+ nghe nói
834
+ nghe ra
835
+ nghe rõ
836
+ nghe thấy
837
+ nghe tin
838
+ nghe trực tiếp
839
+ nghe đâu
840
+ nghe đâu như
841
+ nghe được
842
+ nghen
843
+ nghiễm nhiên
844
+ nghĩ
845
+ nghĩ lại
846
+ nghĩ ra
847
+ nghĩ tới
848
+ nghĩ xa
849
+ nghĩ đến
850
+ nghỉm
851
+ ngoài
852
+ ngoài này
853
+ ngoài ra
854
+ ngoài xa
855
+ ngoải
856
+ nguồn
857
+ ngày
858
+ ngày càng
859
+ ngày cấp
860
+ ngày giờ
861
+ ngày ngày
862
+ ngày nào
863
+ ngày này
864
+ ngày nọ
865
+ ngày qua
866
+ ngày rày
867
+ ngày tháng
868
+ ngày xưa
869
+ ngày xửa
870
+ ngày đến
871
+ ngày ấy
872
+ ngôi
873
+ ngôi nhà
874
+ ngôi thứ
875
+ ngõ hầu
876
+ ngăn ngắt
877
+ ngươi
878
+ người
879
+ người hỏi
880
+ người khác
881
+ người khách
882
+ người mình
883
+ người nghe
884
+ người người
885
+ người nhận
886
+ ngọn
887
+ ngọn nguồn
888
+ ngọt
889
+ ngồi
890
+ ngồi bệt
891
+ ngồi không
892
+ ngồi sau
893
+ ngồi trệt
894
+ ngộ nhỡ
895
+ nhanh
896
+ nhanh lên
897
+ nhanh tay
898
+ nhau
899
+ nhiên hậu
900
+ nhiều
901
+ nhiều ít
902
+ nhiệt liệt
903
+ nhung nhăng
904
+ nhà
905
+ nhà chung
906
+ nhà khó
907
+ nhà làm
908
+ nhà ngoài
909
+ nhà ngươi
910
+ nhà tôi
911
+ nhà việc
912
+ nhân dịp
913
+ nhân tiện
914
+ nhé
915
+ nhìn
916
+ nhìn chung
917
+ nhìn lại
918
+ nhìn nhận
919
+ nhìn theo
920
+ nhìn thấy
921
+ nhìn xuống
922
+ nhóm
923
+ nhón nhén
924
+ như
925
+ như ai
926
+ như chơi
927
+ như không
928
+ như là
929
+ như nhau
930
+ như quả
931
+ như sau
932
+ như thường
933
+ như thế
934
+ như thế nào
935
+ như thể
936
+ như trên
937
+ như trước
938
+ như tuồng
939
+ như vậy
940
+ như ý
941
+ nhưng
942
+ nhưng mà
943
+ nhược bằng
944
+ nhất
945
+ nhất loạt
946
+ nhất luật
947
+ nhất là
948
+ nhất mực
949
+ nhất nhất
950
+ nhất quyết
951
+ nhất sinh
952
+ nhất thiết
953
+ nhất thì
954
+ nhất tâm
955
+ nhất tề
956
+ nhất đán
957
+ nhất định
958
+ nhận
959
+ nhận biết
960
+ nhận họ
961
+ nhận làm
962
+ nhận nhau
963
+ nhận ra
964
+ nhận thấy
965
+ nhận việc
966
+ nhận được
967
+ nhằm
968
+ nhằm khi
969
+ nhằm lúc
970
+ nhằm vào
971
+ nhằm để
972
+ nhỉ
973
+ nhỏ
974
+ nhỏ người
975
+ nhớ
976
+ nhớ bập bõm
977
+ nhớ lại
978
+ nhớ lấy
979
+ nhớ ra
980
+ nhờ
981
+ nhờ chuyển
982
+ nhờ có
983
+ nhờ nhờ
984
+ nhờ đó
985
+ nhỡ ra
986
+ những
987
+ những ai
988
+ những khi
989
+ những là
990
+ những lúc
991
+ những muốn
992
+ những như
993
+ nào
994
+ nào cũng
995
+ nào hay
996
+ nào là
997
+ nào phải
998
+ nào đâu
999
+ nào đó
1000
+ này
1001
+ này nọ
1002
+ nên
1003
+ nên chi
1004
+ nên chăng
1005
+ nên làm
1006
+ nên người
1007
+ nên tránh
1008
+
1009
+ nóc
1010
+ nói
1011
+ nói bông
1012
+ nói chung
1013
+ nói khó
1014
+ nói là
1015
+ nói lên
1016
+ nói lại
1017
+ nói nhỏ
1018
+ nói phải
1019
+ nói qua
1020
+ nói ra
1021
+ nói riêng
1022
+ nói rõ
1023
+ nói thêm
1024
+ nói thật
1025
+ nói toẹt
1026
+ nói trước
1027
+ nói tốt
1028
+ nói với
1029
+ nói xa
1030
+ nói ý
1031
+ nói đến
1032
+ nói đủ
1033
+ năm
1034
+ năm tháng
1035
+ nơi
1036
+ nơi nơi
1037
+ nước
1038
+ nước bài
1039
+ nước cùng
1040
+ nước lên
1041
+ nước nặng
1042
+ nước quả
1043
+ nước xuống
1044
+ nước ăn
1045
+ nước đến
1046
+ nấy
1047
+ nặng
1048
+ nặng căn
1049
+ nặng mình
1050
+ nặng về
1051
+ nếu
1052
+ nếu có
1053
+ nếu cần
1054
+ nếu không
1055
+ nếu mà
1056
+ nếu như
1057
+ nếu thế
1058
+ nếu vậy
1059
+ nếu được
1060
+ nền
1061
+ nọ
1062
+ nớ
1063
+ nức nở
1064
+ nữa
1065
+ nữa khi
1066
+ nữa là
1067
+ nữa rồi
1068
+ oai oái
1069
+ oái
1070
+ pho
1071
+ phè
1072
+ phè phè
1073
+ phía
1074
+ phía bên
1075
+ phía bạn
1076
+ phía dưới
1077
+ phía sau
1078
+ phía trong
1079
+ phía trên
1080
+ phía trước
1081
+ phóc
1082
+ phót
1083
+ phù hợp
1084
+ phăn phắt
1085
+ phương chi
1086
+ phải
1087
+ phải biết
1088
+ phải chi
1089
+ phải chăng
1090
+ phải cách
1091
+ phải cái
1092
+ phải giờ
1093
+ phải khi
1094
+ phải không
1095
+ phải lại
1096
+ phải lời
1097
+ phải người
1098
+ phải như
1099
+ phải rồi
1100
+ phải tay
1101
+ phần
1102
+ phần lớn
1103
+ phần nhiều
1104
+ phần nào
1105
+ phần sau
1106
+ phần việc
1107
+ phắt
1108
+ phỉ phui
1109
+ phỏng
1110
+ phỏng như
1111
+ phỏng nước
1112
+ phỏng theo
1113
+ phỏng tính
1114
+ phốc
1115
+ phụt
1116
+ phứt
1117
+ qua
1118
+ qua chuyện
1119
+ qua khỏi
1120
+ qua lại
1121
+ qua lần
1122
+ qua ngày
1123
+ qua tay
1124
+ qua thì
1125
+ qua đi
1126
+ quan trọng
1127
+ quan trọng vấn đề
1128
+ quan tâm
1129
+ quay
1130
+ quay bước
1131
+ quay lại
1132
+ quay số
1133
+ quay đi
1134
+ quá
1135
+ quá bán
1136
+ quá bộ
1137
+ quá giờ
1138
+ quá lời
1139
+ quá mức
1140
+ quá nhiều
1141
+ quá tay
1142
+ quá thì
1143
+ quá tin
1144
+ quá trình
1145
+ quá tuổi
1146
+ quá đáng
1147
+ quá ư
1148
+ quả
1149
+ quả là
1150
+ quả thật
1151
+ quả thế
1152
+ quả vậy
1153
+ quận
1154
+ ra
1155
+ ra bài
1156
+ ra bộ
1157
+ ra chơi
1158
+ ra gì
1159
+ ra lại
1160
+ ra lời
1161
+ ra ngôi
1162
+ ra người
1163
+ ra sao
1164
+ ra tay
1165
+ ra vào
1166
+ ra ý
1167
+ ra điều
1168
+ ra đây
1169
+ ren rén
1170
+ riu ríu
1171
+ riêng
1172
+ riêng từng
1173
+ riệt
1174
+ rày
1175
+ ráo
1176
+ ráo cả
1177
+ ráo nước
1178
+ ráo trọi
1179
+ rén
1180
+ rén bước
1181
+ rích
1182
+ rón rén
1183
+
1184
+ rõ là
1185
+ rõ thật
1186
+ rút cục
1187
+ răng
1188
+ răng răng
1189
+ rất
1190
+ rất lâu
1191
+ rằng
1192
+ rằng là
1193
+ rốt cuộc
1194
+ rốt cục
1195
+ rồi
1196
+ rồi nữa
1197
+ rồi ra
1198
+ rồi sao
1199
+ rồi sau
1200
+ rồi tay
1201
+ rồi thì
1202
+ rồi xem
1203
+ rồi đây
1204
+ rứa
1205
+ sa sả
1206
+ sang
1207
+ sang năm
1208
+ sang sáng
1209
+ sang tay
1210
+ sao
1211
+ sao bản
1212
+ sao bằng
1213
+ sao cho
1214
+ sao vậy
1215
+ sao đang
1216
+ sau
1217
+ sau chót
1218
+ sau cuối
1219
+ sau cùng
1220
+ sau hết
1221
+ sau này
1222
+ sau nữa
1223
+ sau sau
1224
+ sau đây
1225
+ sau đó
1226
+ so
1227
+ so với
1228
+ song le
1229
+ suýt
1230
+ suýt nữa
1231
+ sáng
1232
+ sáng ngày
1233
+ sáng rõ
1234
+ sáng thế
1235
+ sáng ý
1236
+
1237
+ sì sì
1238
+ sất
1239
+ sắp
1240
+ sắp đặt
1241
+ sẽ
1242
+ sẽ biết
1243
+ sẽ hay
1244
+ số
1245
+ số cho biết
1246
+ số cụ thể
1247
+ số loại
1248
+ số là
1249
+ số người
1250
+ số phần
1251
+ số thiếu
1252
+ sốt sột
1253
+ sớm
1254
+ sớm ngày
1255
+ sở dĩ
1256
+ sử dụng
1257
+ sự
1258
+ sự thế
1259
+ sự việc
1260
+ tanh
1261
+ tanh tanh
1262
+ tay
1263
+ tay quay
1264
+ tha hồ
1265
+ tha hồ chơi
1266
+ tha hồ ăn
1267
+ than ôi
1268
+ thanh
1269
+ thanh ba
1270
+ thanh chuyển
1271
+ thanh không
1272
+ thanh thanh
1273
+ thanh tính
1274
+ thanh điều kiện
1275
+ thanh điểm
1276
+ thay đổi
1277
+ thay đổi tình trạng
1278
+ theo
1279
+ theo bước
1280
+ theo như
1281
+ theo tin
1282
+ thi thoảng
1283
+ thiếu
1284
+ thiếu gì
1285
+ thiếu điểm
1286
+ thoạt
1287
+ thoạt nghe
1288
+ thoạt nhiên
1289
+ thoắt
1290
+ thuần
1291
+ thuần ái
1292
+ thuộc
1293
+ thuộc bài
1294
+ thuộc cách
1295
+ thuộc lại
1296
+ thuộc từ
1297
+ thà
1298
+ thà là
1299
+ thà rằng
1300
+ thành ra
1301
+ thành thử
1302
+ thái quá
1303
+ tháng
1304
+ tháng ngày
1305
+ tháng năm
1306
+ tháng tháng
1307
+ thêm
1308
+ thêm chuyện
1309
+ thêm giờ
1310
+ thêm vào
1311
+ thì
1312
+ thì giờ
1313
+ thì là
1314
+ thì phải
1315
+ thì ra
1316
+ thì thôi
1317
+ thình lình
1318
+ thích
1319
+ thích cứ
1320
+ thích thuộc
1321
+ thích tự
1322
+ thích ý
1323
+ thím
1324
+ thôi
1325
+ thôi việc
1326
+ thúng thắng
1327
+ thương ôi
1328
+ thường
1329
+ thường bị
1330
+ thường hay
1331
+ thường khi
1332
+ thường số
1333
+ thường sự
1334
+ thường thôi
1335
+ thường thường
1336
+ thường tính
1337
+ thường tại
1338
+ thường xuất hiện
1339
+ thường đến
1340
+ thảo hèn
1341
+ thảo nào
1342
+ thấp
1343
+ thấp cơ
1344
+ thấp thỏm
1345
+ thấp xuống
1346
+ thấy
1347
+ thấy tháng
1348
+ thẩy
1349
+ thậm
1350
+ thậm chí
1351
+ thậm cấp
1352
+ thậm từ
1353
+ thật
1354
+ thật chắc
1355
+ thật là
1356
+ thật lực
1357
+ thật quả
1358
+ thật ra
1359
+ thật sự
1360
+ thật thà
1361
+ thật tốt
1362
+ thật vậy
1363
+ thế
1364
+ thế chuẩn bị
1365
+ thế là
1366
+ thế lại
1367
+ thế mà
1368
+ thế nào
1369
+ thế nên
1370
+ thế ra
1371
+ thế sự
1372
+ thế thì
1373
+ thế thôi
1374
+ thế thường
1375
+ thế thế
1376
+ thế à
1377
+ thế đó
1378
+ thếch
1379
+ thỉnh thoảng
1380
+ thỏm
1381
+ thốc
1382
+ thốc tháo
1383
+ thốt
1384
+ thốt nhiên
1385
+ thốt nói
1386
+ thốt thôi
1387
+ thộc
1388
+ thời gian
1389
+ thời gian sử dụng
1390
+ thời gian tính
1391
+ thời điểm
1392
+ thục mạng
1393
+ thứ
1394
+ thứ bản
1395
+ thứ đến
1396
+ thửa
1397
+ thực hiện
1398
+ thực hiện đúng
1399
+ thực ra
1400
+ thực sự
1401
+ thực tế
1402
+ thực vậy
1403
+ tin
1404
+ tin thêm
1405
+ tin vào
1406
+ tiếp theo
1407
+ tiếp tục
1408
+ tiếp đó
1409
+ tiện thể
1410
+ toà
1411
+ toé khói
1412
+ toẹt
1413
+ trong
1414
+ trong khi
1415
+ trong lúc
1416
+ trong mình
1417
+ trong ngoài
1418
+ trong này
1419
+ trong số
1420
+ trong vùng
1421
+ trong đó
1422
+ trong ấy
1423
+ tránh
1424
+ tránh khỏi
1425
+ tránh ra
1426
+ tránh tình trạng
1427
+ tránh xa
1428
+ trên
1429
+ trên bộ
1430
+ trên dưới
1431
+ trước
1432
+ trước hết
1433
+ trước khi
1434
+ trước kia
1435
+ trước nay
1436
+ trước ngày
1437
+ trước nhất
1438
+ trước sau
1439
+ trước tiên
1440
+ trước tuổi
1441
+ trước đây
1442
+ trước đó
1443
+ trả
1444
+ trả của
1445
+ trả lại
1446
+ trả ngay
1447
+ trả trước
1448
+ trếu tráo
1449
+ trển
1450
+ trệt
1451
+ trệu trạo
1452
+ trỏng
1453
+ trời đất ơi
1454
+ trở thành
1455
+ trừ phi
1456
+ trực tiếp
1457
+ trực tiếp làm
1458
+ tuy
1459
+ tuy có
1460
+ tuy là
1461
+ tuy nhiên
1462
+ tuy rằng
1463
+ tuy thế
1464
+ tuy vậy
1465
+ tuy đã
1466
+ tuyệt nhiên
1467
+ tuần tự
1468
+ tuốt luốt
1469
+ tuốt tuồn tuột
1470
+ tuốt tuột
1471
+ tuổi
1472
+ tuổi cả
1473
+ tuổi tôi
1474
+ tà tà
1475
+ tên
1476
+ tên chính
1477
+ tên cái
1478
+ tên họ
1479
+ tên tự
1480
+ tênh
1481
+ tênh tênh
1482
+ tìm
1483
+ tìm bạn
1484
+ tìm cách
1485
+ tìm hiểu
1486
+ tìm ra
1487
+ tìm việc
1488
+ tình trạng
1489
+ tính
1490
+ tính cách
1491
+ tính căn
1492
+ tính người
1493
+ tính phỏng
1494
+ tính từ
1495
+ tít mù
1496
+ tò te
1497
+ tôi
1498
+ tôi con
1499
+ tông tốc
1500
+ tù tì
1501
+ tăm tắp
1502
+ tăng
1503
+ tăng chúng
1504
+ tăng cấp
1505
+ tăng giảm
1506
+ tăng thêm
1507
+ tăng thế
1508
+ tại
1509
+ tại lòng
1510
+ tại nơi
1511
+ tại sao
1512
+ tại tôi
1513
+ tại vì
1514
+ tại đâu
1515
+ tại đây
1516
+ tại đó
1517
+ tạo
1518
+ tạo cơ hội
1519
+ tạo nên
1520
+ tạo ra
1521
+ tạo ý
1522
+ tạo điều kiện
1523
+ tấm
1524
+ tấm bản
1525
+ tấm các
1526
+ tấn
1527
+ tấn tới
1528
+ tất cả
1529
+ tất cả bao nhiêu
1530
+ tất thảy
1531
+ tất tần tật
1532
+ tất tật
1533
+ tập trung
1534
+ tắp
1535
+ tắp lự
1536
+ tắp tắp
1537
+ tọt
1538
+ tỏ ra
1539
+ tỏ vẻ
1540
+ tốc tả
1541
+ tối ư
1542
+ tốt
1543
+ tốt bạn
1544
+ tốt bộ
1545
+ tốt hơn
1546
+ tốt mối
1547
+ tốt ngày
1548
+ tột
1549
+ tột cùng
1550
+ tớ
1551
+ tới
1552
+ tới gần
1553
+ tới mức
1554
+ tới nơi
1555
+ tới thì
1556
+ tức thì
1557
+ tức tốc
1558
+ từ
1559
+ từ căn
1560
+ từ giờ
1561
+ từ khi
1562
+ từ loại
1563
+ từ nay
1564
+ từ thế
1565
+ từ tính
1566
+ từ tại
1567
+ từ từ
1568
+ từ ái
1569
+ từ điều
1570
+ từ đó
1571
+ từ ấy
1572
+ từng
1573
+ từng cái
1574
+ từng giờ
1575
+ từng nhà
1576
+ từng phần
1577
+ từng thời gian
1578
+ từng đơn vị
1579
+ từng ấy
1580
+ tự
1581
+ tự cao
1582
+ tự khi
1583
+ tự lượng
1584
+ tự tính
1585
+ tự tạo
1586
+ tự vì
1587
+ tự ý
1588
+ tự ăn
1589
+ tựu trung
1590
+ veo
1591
+ veo veo
1592
+ việc
1593
+ việc gì
1594
+ vung thiên địa
1595
+ vung tàn tán
1596
+ vung tán tàn
1597
+
1598
+ vài
1599
+ vài ba
1600
+ vài người
1601
+ vài nhà
1602
+ vài nơi
1603
+ vài tên
1604
+ vài điều
1605
+ vào
1606
+ vào gặp
1607
+ vào khoảng
1608
+ vào lúc
1609
+ vào vùng
1610
+ vào đến
1611
+ vâng
1612
+ vâng chịu
1613
+ vâng dạ
1614
+ vâng vâng
1615
+ vâng ý
1616
+ vèo
1617
+ vèo vèo
1618
+
1619
+ vì chưng
1620
+ vì rằng
1621
+ vì sao
1622
+ vì thế
1623
+ vì vậy
1624
+ ví bằng
1625
+ ví dù
1626
+ ví phỏng
1627
+ ví thử
1628
+ vô hình trung
1629
+ vô kể
1630
+ vô luận
1631
+ vô vàn
1632
+ vùng
1633
+ vùng lên
1634
+ vùng nước
1635
+ văng tê
1636
+ vượt
1637
+ vượt khỏi
1638
+ vượt quá
1639
+ vạn nhất
1640
+ vả chăng
1641
+ vả lại
1642
+ vấn đề
1643
+ vấn đề quan trọng
1644
+ vẫn
1645
+ vẫn thế
1646
+ vậy
1647
+ vậy là
1648
+ vậy mà
1649
+ vậy nên
1650
+ vậy ra
1651
+ vậy thì
1652
+ vậy ư
1653
+ về
1654
+ về không
1655
+ về nước
1656
+ về phần
1657
+ về sau
1658
+ về tay
1659
+ vị trí
1660
+ vị tất
1661
+ vốn dĩ
1662
+ với
1663
+ với lại
1664
+ với nhau
1665
+ vở
1666
+ vụt
1667
+ vừa
1668
+ vừa khi
1669
+ vừa lúc
1670
+ vừa mới
1671
+ vừa qua
1672
+ vừa rồi
1673
+ vừa vừa
1674
+ xa
1675
+ xa cách
1676
+ xa gần
1677
+ xa nhà
1678
+ xa tanh
1679
+ xa tắp
1680
+ xa xa
1681
+ xa xả
1682
+ xem
1683
+ xem lại
1684
+ xem ra
1685
+ xem số
1686
+ xin
1687
+ xin gặp
1688
+ xin vâng
1689
+ xiết bao
1690
+ xon xón
1691
+ xoành xoạch
1692
+ xoét
1693
+ xoẳn
1694
+ xoẹt
1695
+ xuất hiện
1696
+ xuất kì bất ý
1697
+ xuất kỳ bất ý
1698
+ xuể
1699
+ xuống
1700
+ xăm xúi
1701
+ xăm xăm
1702
+ xăm xắm
1703
+ xảy ra
1704
+ xềnh xệch
1705
+ xệp
1706
+ xử lý
1707
+ yêu cầu
1708
+ à
1709
+ à này
1710
+ à ơi
1711
+ ào
1712
+ ào vào
1713
+ ào ào
1714
+ á
1715
+ á à
1716
+ ái
1717
+ ái chà
1718
+ ái dà
1719
+ áng
1720
+ áng như
1721
+ âu là
1722
+ ít
1723
+ ít biết
1724
+ ít có
1725
+ ít hơn
1726
+ ít khi
1727
+ ít lâu
1728
+ ít nhiều
1729
+ ít nhất
1730
+ ít nữa
1731
+ ít quá
1732
+ ít ra
1733
+ ít thôi
1734
+ ít thấy
1735
+ ô hay
1736
+ ô hô
1737
+ ô kê
1738
+ ô kìa
1739
+ ôi chao
1740
+ ôi thôi
1741
+ ông
1742
+ ông nhỏ
1743
+ ông tạo
1744
+ ông từ
1745
+ ông ấy
1746
+ ông ổng
1747
+ úi
1748
+ úi chà
1749
+ úi dào
1750
+ ý
1751
+ ý chừng
1752
+ ý da
1753
+ ý hoặc
1754
+ ăn
1755
+ ăn chung
1756
+ ăn chắc
1757
+ ăn chịu
1758
+ ăn cuộc
1759
+ ăn hết
1760
+ ăn hỏi
1761
+ ăn làm
1762
+ ăn người
1763
+ ăn ngồi
1764
+ ăn quá
1765
+ ăn riêng
1766
+ ăn sáng
1767
+ ăn tay
1768
+ ăn trên
1769
+ ăn về
1770
+ đang
1771
+ đang tay
1772
+ đang thì
1773
+ điều
1774
+ điều gì
1775
+ điều kiện
1776
+ điểm
1777
+ điểm chính
1778
+ điểm gặp
1779
+ điểm đầu tiên
1780
+ đành đạch
1781
+ đáng
1782
+ đáng kể
1783
+ đáng lí
1784
+ đáng lý
1785
+ đáng lẽ
1786
+ đáng số
1787
+ đánh giá
1788
+ đánh đùng
1789
+ đáo để
1790
+ đâu
1791
+ đâu có
1792
+ đâu cũng
1793
+ đâu như
1794
+ đâu nào
1795
+ đâu phải
1796
+ đâu đâu
1797
+ đâu đây
1798
+ đâu đó
1799
+ đây
1800
+ đây này
1801
+ đây rồi
1802
+ đây đó
1803
+ đã
1804
+ đã hay
1805
+ đã không
1806
+ đã là
1807
+ đã lâu
1808
+ đã thế
1809
+ đã vậy
1810
+ đã đủ
1811
+ đó
1812
+ đó đây
1813
+ đúng
1814
+ đúng ngày
1815
+ đúng ra
1816
+ đúng tuổi
1817
+ đúng với
1818
+ đơn vị
1819
+ đưa
1820
+ đưa cho
1821
+ đưa chuyện
1822
+ đưa em
1823
+ đưa ra
1824
+ đưa tay
1825
+ đưa tin
1826
+ đưa tới
1827
+ đưa vào
1828
+ đưa về
1829
+ đưa xuống
1830
+ đưa đến
1831
+ được
1832
+ được cái
1833
+ được lời
1834
+ được nước
1835
+ được tin
1836
+ đại loại
1837
+ đại nhân
1838
+ đại phàm
1839
+ đại để
1840
+ đạt
1841
+ đảm bảo
1842
+ đầu tiên
1843
+ đầy
1844
+ đầy năm
1845
+ đầy phè
1846
+ đầy tuổi
1847
+ đặc biệt
1848
+ đặt
1849
+ đặt làm
1850
+ đặt mình
1851
+ đặt mức
1852
+ đặt ra
1853
+ đặt trước
1854
+ đặt để
1855
+ đến
1856
+ đến bao giờ
1857
+ đến cùng
1858
+ đến cùng cực
1859
+ đến cả
1860
+ đến giờ
1861
+ đến gần
1862
+ đến hay
1863
+ đến khi
1864
+ đến lúc
1865
+ đến lời
1866
+ đến nay
1867
+ đến ngày
1868
+ đến nơi
1869
+ đến nỗi
1870
+ đến thì
1871
+ đến thế
1872
+ đến tuổi
1873
+ đến xem
1874
+ đến điều
1875
+ đến đâu
1876
+ đều
1877
+ đều bước
1878
+ đều nhau
1879
+ đều đều
1880
+ để
1881
+ để cho
1882
+ để giống
1883
+ để không
1884
+ để lòng
1885
+ để lại
1886
+ để mà
1887
+ để phần
1888
+ để được
1889
+ để đến nỗi
1890
+ đối với
1891
+ đồng thời
1892
+ đủ
1893
+ đủ dùng
1894
+ đủ nơi
1895
+ đủ số
1896
+ đủ điều
1897
+ đủ điểm
1898
+ ơ
1899
+ ơ hay
1900
+ ơ kìa
1901
+ ơi
1902
+ ơi là
1903
+ ư
1904
+
1905
+ ạ ơi
1906
+ ấy
1907
+ ấy là
1908
+ ầu ơ
1909
+ ắt
1910
+ ắt hẳn
1911
+ ắt là
1912
+ ắt phải
1913
+ ắt thật
1914
+ ối dào
1915
+ ối giời
1916
+ ối giời ơi
1917
+
1918
+ ồ ồ
1919
+ ổng
1920
+
1921
+ ớ này
1922
+
1923
+ ờ ờ
1924
+
1925
+ ở lại
1926
+ ở như
1927
+ ở nhờ
1928
+ ở năm
1929
+ ở trên
1930
+ ở vào
1931
+ ở đây
1932
+ ở đó
1933
+ ở được
1934
+ ủa
1935
+ ứ hự
1936
+ ứ ừ
1937
+
1938
+ ừ nhé
1939
+ ừ thì
1940
+ ừ ào
1941
+ ừ ừ
1942
+
README.md ADDED
@@ -0,0 +1,69 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: mit
3
+ base_model: VietAI/vit5-base
4
+ tags:
5
+ - generated_from_trainer
6
+ metrics:
7
+ - f1
8
+ - accuracy
9
+ model-index:
10
+ - name: sentiment_oversampling_25_12
11
+ results: []
12
+ ---
13
+
14
+ <!-- This model card has been generated automatically according to the information the Trainer had access to. You
15
+ should probably proofread and complete it, then remove this comment. -->
16
+
17
+ # sentiment_oversampling_25_12
18
+
19
+ This model is a fine-tuned version of [VietAI/vit5-base](https://huggingface.co/VietAI/vit5-base) on the None dataset.
20
+ It achieves the following results on the evaluation set:
21
+ - Loss: 0.1955
22
+ - F1: 0.6240
23
+ - Accuracy: 0.7911
24
+
25
+ ## Model description
26
+
27
+ More information needed
28
+
29
+ ## Intended uses & limitations
30
+
31
+ More information needed
32
+
33
+ ## Training and evaluation data
34
+
35
+ More information needed
36
+
37
+ ## Training procedure
38
+
39
+ ### Training hyperparameters
40
+
41
+ The following hyperparameters were used during training:
42
+ - learning_rate: 1e-05
43
+ - train_batch_size: 80
44
+ - eval_batch_size: 80
45
+ - seed: 42
46
+ - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
47
+ - lr_scheduler_type: linear
48
+ - num_epochs: 3
49
+
50
+ ### Training results
51
+
52
+ | Training Loss | Epoch | Step | Validation Loss | F1 | Accuracy |
53
+ |:-------------:|:-----:|:----:|:---------------:|:------:|:--------:|
54
+ | 1.2607 | 0.37 | 200 | 0.2220 | 0.5931 | 0.7885 |
55
+ | 0.2748 | 0.75 | 400 | 0.2099 | 0.6012 | 0.7954 |
56
+ | 0.2591 | 1.12 | 600 | 0.1922 | 0.6114 | 0.8117 |
57
+ | 0.2519 | 1.5 | 800 | 0.1993 | 0.6203 | 0.7975 |
58
+ | 0.2442 | 1.87 | 1000 | 0.2153 | 0.6092 | 0.7555 |
59
+ | 0.2408 | 2.24 | 1200 | 0.1915 | 0.6182 | 0.7992 |
60
+ | 0.2309 | 2.62 | 1400 | 0.2064 | 0.6109 | 0.7703 |
61
+ | 0.2322 | 2.99 | 1600 | 0.1972 | 0.6169 | 0.7881 |
62
+
63
+
64
+ ### Framework versions
65
+
66
+ - Transformers 4.36.2
67
+ - Pytorch 2.1.0+cu121
68
+ - Datasets 2.16.0
69
+ - Tokenizers 0.15.0
config.json ADDED
@@ -0,0 +1,32 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "VietAI/vit5-base",
3
+ "architectures": [
4
+ "T5ForConditionalGeneration"
5
+ ],
6
+ "classifier_dropout": 0.0,
7
+ "d_ff": 3072,
8
+ "d_kv": 64,
9
+ "d_model": 768,
10
+ "decoder_start_token_id": 0,
11
+ "dense_act_fn": "relu",
12
+ "dropout_rate": 0.1,
13
+ "eos_token_id": 1,
14
+ "feed_forward_proj": "relu",
15
+ "initializer_factor": 1.0,
16
+ "is_encoder_decoder": true,
17
+ "is_gated_act": false,
18
+ "layer_norm_epsilon": 1e-06,
19
+ "model_type": "t5",
20
+ "n_positions": 512,
21
+ "num_decoder_layers": 12,
22
+ "num_heads": 12,
23
+ "num_layers": 12,
24
+ "output_past": true,
25
+ "pad_token_id": 0,
26
+ "relative_attention_max_distance": 128,
27
+ "relative_attention_num_buckets": 32,
28
+ "torch_dtype": "float32",
29
+ "transformers_version": "4.36.2",
30
+ "use_cache": true,
31
+ "vocab_size": 36096
32
+ }
generation_config.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "decoder_start_token_id": 0,
3
+ "eos_token_id": 1,
4
+ "pad_token_id": 0,
5
+ "transformers_version": "4.36.2"
6
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b35897c94fd600056749f207527ccb6688296f93935cd8aea6923141e44ba222
3
+ size 903834408
runs/Dec25_09-03-37_2e2d09babfa5/events.out.tfevents.1703495031.2e2d09babfa5.550.0 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6e7d82e1fffc547157db28056cc50bf180efe5c9409d9a9ddc83914028820ac1
3
+ size 15483
runs/Dec25_09-03-37_2e2d09babfa5/events.out.tfevents.1703497791.2e2d09babfa5.550.1 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:4670356227c9ace76588effafafa06e38f285cec40716a26d343331507035b0e
3
+ size 826
runs/Dec25_09-59-23_2e2d09babfa5/events.out.tfevents.1703498384.2e2d09babfa5.14497.0 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e2abf5525726da1a0a210cbb05ee1ff13e73a4da9db64ccd54a915b195324110
3
+ size 4184
runs/Dec25_10-01-30_2e2d09babfa5/events.out.tfevents.1703498512.2e2d09babfa5.15098.0 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:f486d7a0a68369ffa8535cba4dc8334a7067e6b18c24b75f9dc55676bf7472e8
3
+ size 12535
runs/Dec25_11-08-14_2e2d09babfa5/events.out.tfevents.1703502509.2e2d09babfa5.31685.0 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:2b4b4d1a1416b362041bff64f493c8aa4e063ee16d63a9620ab40eba0946dfb2
3
+ size 9207
runs/Dec25_11-08-14_2e2d09babfa5/events.out.tfevents.1703505074.2e2d09babfa5.31685.1 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:911bf1a3e227314ead7fb29707f107e7f2b52fd735405774f5757b8befea3427
3
+ size 457
sample_data/README.md ADDED
@@ -0,0 +1,19 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ This directory includes a few sample datasets to get you started.
2
+
3
+ * `california_housing_data*.csv` is California housing data from the 1990 US
4
+ Census; more information is available at:
5
+ https://developers.google.com/machine-learning/crash-course/california-housing-data-description
6
+
7
+ * `mnist_*.csv` is a small sample of the
8
+ [MNIST database](https://en.wikipedia.org/wiki/MNIST_database), which is
9
+ described at: http://yann.lecun.com/exdb/mnist/
10
+
11
+ * `anscombe.json` contains a copy of
12
+ [Anscombe's quartet](https://en.wikipedia.org/wiki/Anscombe%27s_quartet); it
13
+ was originally described in
14
+
15
+ Anscombe, F. J. (1973). 'Graphs in Statistical Analysis'. American
16
+ Statistician. 27 (1): 17-21. JSTOR 2682899.
17
+
18
+ and our copy was prepared by the
19
+ [vega_datasets library](https://github.com/altair-viz/vega_datasets/blob/4f67bdaad10f45e3549984e17e1b3088c731503d/vega_datasets/_data/anscombe.json).
sample_data/anscombe.json ADDED
@@ -0,0 +1,49 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {"Series":"I", "X":10.0, "Y":8.04},
3
+ {"Series":"I", "X":8.0, "Y":6.95},
4
+ {"Series":"I", "X":13.0, "Y":7.58},
5
+ {"Series":"I", "X":9.0, "Y":8.81},
6
+ {"Series":"I", "X":11.0, "Y":8.33},
7
+ {"Series":"I", "X":14.0, "Y":9.96},
8
+ {"Series":"I", "X":6.0, "Y":7.24},
9
+ {"Series":"I", "X":4.0, "Y":4.26},
10
+ {"Series":"I", "X":12.0, "Y":10.84},
11
+ {"Series":"I", "X":7.0, "Y":4.81},
12
+ {"Series":"I", "X":5.0, "Y":5.68},
13
+
14
+ {"Series":"II", "X":10.0, "Y":9.14},
15
+ {"Series":"II", "X":8.0, "Y":8.14},
16
+ {"Series":"II", "X":13.0, "Y":8.74},
17
+ {"Series":"II", "X":9.0, "Y":8.77},
18
+ {"Series":"II", "X":11.0, "Y":9.26},
19
+ {"Series":"II", "X":14.0, "Y":8.10},
20
+ {"Series":"II", "X":6.0, "Y":6.13},
21
+ {"Series":"II", "X":4.0, "Y":3.10},
22
+ {"Series":"II", "X":12.0, "Y":9.13},
23
+ {"Series":"II", "X":7.0, "Y":7.26},
24
+ {"Series":"II", "X":5.0, "Y":4.74},
25
+
26
+ {"Series":"III", "X":10.0, "Y":7.46},
27
+ {"Series":"III", "X":8.0, "Y":6.77},
28
+ {"Series":"III", "X":13.0, "Y":12.74},
29
+ {"Series":"III", "X":9.0, "Y":7.11},
30
+ {"Series":"III", "X":11.0, "Y":7.81},
31
+ {"Series":"III", "X":14.0, "Y":8.84},
32
+ {"Series":"III", "X":6.0, "Y":6.08},
33
+ {"Series":"III", "X":4.0, "Y":5.39},
34
+ {"Series":"III", "X":12.0, "Y":8.15},
35
+ {"Series":"III", "X":7.0, "Y":6.42},
36
+ {"Series":"III", "X":5.0, "Y":5.73},
37
+
38
+ {"Series":"IV", "X":8.0, "Y":6.58},
39
+ {"Series":"IV", "X":8.0, "Y":5.76},
40
+ {"Series":"IV", "X":8.0, "Y":7.71},
41
+ {"Series":"IV", "X":8.0, "Y":8.84},
42
+ {"Series":"IV", "X":8.0, "Y":8.47},
43
+ {"Series":"IV", "X":8.0, "Y":7.04},
44
+ {"Series":"IV", "X":8.0, "Y":5.25},
45
+ {"Series":"IV", "X":19.0, "Y":12.50},
46
+ {"Series":"IV", "X":8.0, "Y":5.56},
47
+ {"Series":"IV", "X":8.0, "Y":7.91},
48
+ {"Series":"IV", "X":8.0, "Y":6.89}
49
+ ]
sample_data/california_housing_test.csv ADDED
The diff for this file is too large to render. See raw diff
 
sample_data/california_housing_train.csv ADDED
The diff for this file is too large to render. See raw diff
 
sample_data/mnist_test.csv ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:51c292478d94ec3a01461bdfa82eb0885d262eb09e615679b2d69dedb6ad09e7
3
+ size 18289443
sample_data/mnist_train_small.csv ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1ef64781aa03180f4f5ce504314f058f5d0227277df86060473d973cf43b033e
3
+ size 36523880
special_tokens_map.json ADDED
@@ -0,0 +1,103 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "additional_special_tokens": [
3
+ "<extra_id_0>",
4
+ "<extra_id_1>",
5
+ "<extra_id_2>",
6
+ "<extra_id_3>",
7
+ "<extra_id_4>",
8
+ "<extra_id_5>",
9
+ "<extra_id_6>",
10
+ "<extra_id_7>",
11
+ "<extra_id_8>",
12
+ "<extra_id_9>",
13
+ "<extra_id_10>",
14
+ "<extra_id_11>",
15
+ "<extra_id_12>",
16
+ "<extra_id_13>",
17
+ "<extra_id_14>",
18
+ "<extra_id_15>",
19
+ "<extra_id_16>",
20
+ "<extra_id_17>",
21
+ "<extra_id_18>",
22
+ "<extra_id_19>",
23
+ "<extra_id_20>",
24
+ "<extra_id_21>",
25
+ "<extra_id_22>",
26
+ "<extra_id_23>",
27
+ "<extra_id_24>",
28
+ "<extra_id_25>",
29
+ "<extra_id_26>",
30
+ "<extra_id_27>",
31
+ "<extra_id_28>",
32
+ "<extra_id_29>",
33
+ "<extra_id_30>",
34
+ "<extra_id_31>",
35
+ "<extra_id_32>",
36
+ "<extra_id_33>",
37
+ "<extra_id_34>",
38
+ "<extra_id_35>",
39
+ "<extra_id_36>",
40
+ "<extra_id_37>",
41
+ "<extra_id_38>",
42
+ "<extra_id_39>",
43
+ "<extra_id_40>",
44
+ "<extra_id_41>",
45
+ "<extra_id_42>",
46
+ "<extra_id_43>",
47
+ "<extra_id_44>",
48
+ "<extra_id_45>",
49
+ "<extra_id_46>",
50
+ "<extra_id_47>",
51
+ "<extra_id_48>",
52
+ "<extra_id_49>",
53
+ "<extra_id_50>",
54
+ "<extra_id_51>",
55
+ "<extra_id_52>",
56
+ "<extra_id_53>",
57
+ "<extra_id_54>",
58
+ "<extra_id_55>",
59
+ "<extra_id_56>",
60
+ "<extra_id_57>",
61
+ "<extra_id_58>",
62
+ "<extra_id_59>",
63
+ "<extra_id_60>",
64
+ "<extra_id_61>",
65
+ "<extra_id_62>",
66
+ "<extra_id_63>",
67
+ "<extra_id_64>",
68
+ "<extra_id_65>",
69
+ "<extra_id_66>",
70
+ "<extra_id_67>",
71
+ "<extra_id_68>",
72
+ "<extra_id_69>",
73
+ "<extra_id_70>",
74
+ "<extra_id_71>",
75
+ "<extra_id_72>",
76
+ "<extra_id_73>",
77
+ "<extra_id_74>",
78
+ "<extra_id_75>",
79
+ "<extra_id_76>",
80
+ "<extra_id_77>",
81
+ "<extra_id_78>",
82
+ "<extra_id_79>",
83
+ "<extra_id_80>",
84
+ "<extra_id_81>",
85
+ "<extra_id_82>",
86
+ "<extra_id_83>",
87
+ "<extra_id_84>",
88
+ "<extra_id_85>",
89
+ "<extra_id_86>",
90
+ "<extra_id_87>",
91
+ "<extra_id_88>",
92
+ "<extra_id_89>",
93
+ "<extra_id_90>",
94
+ "<extra_id_91>",
95
+ "<extra_id_92>",
96
+ "<extra_id_93>",
97
+ "<extra_id_94>",
98
+ "<extra_id_95>"
99
+ ],
100
+ "eos_token": "</s>",
101
+ "pad_token": "<pad>",
102
+ "unk_token": "<unk>"
103
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,902 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<pad>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "</s>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "<unk>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "36000": {
28
+ "content": "<extra_id_95>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "36001": {
36
+ "content": "<extra_id_94>",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ },
43
+ "36002": {
44
+ "content": "<extra_id_93>",
45
+ "lstrip": false,
46
+ "normalized": false,
47
+ "rstrip": false,
48
+ "single_word": false,
49
+ "special": true
50
+ },
51
+ "36003": {
52
+ "content": "<extra_id_92>",
53
+ "lstrip": false,
54
+ "normalized": false,
55
+ "rstrip": false,
56
+ "single_word": false,
57
+ "special": true
58
+ },
59
+ "36004": {
60
+ "content": "<extra_id_91>",
61
+ "lstrip": false,
62
+ "normalized": false,
63
+ "rstrip": false,
64
+ "single_word": false,
65
+ "special": true
66
+ },
67
+ "36005": {
68
+ "content": "<extra_id_90>",
69
+ "lstrip": false,
70
+ "normalized": false,
71
+ "rstrip": false,
72
+ "single_word": false,
73
+ "special": true
74
+ },
75
+ "36006": {
76
+ "content": "<extra_id_89>",
77
+ "lstrip": false,
78
+ "normalized": false,
79
+ "rstrip": false,
80
+ "single_word": false,
81
+ "special": true
82
+ },
83
+ "36007": {
84
+ "content": "<extra_id_88>",
85
+ "lstrip": false,
86
+ "normalized": false,
87
+ "rstrip": false,
88
+ "single_word": false,
89
+ "special": true
90
+ },
91
+ "36008": {
92
+ "content": "<extra_id_87>",
93
+ "lstrip": false,
94
+ "normalized": false,
95
+ "rstrip": false,
96
+ "single_word": false,
97
+ "special": true
98
+ },
99
+ "36009": {
100
+ "content": "<extra_id_86>",
101
+ "lstrip": false,
102
+ "normalized": false,
103
+ "rstrip": false,
104
+ "single_word": false,
105
+ "special": true
106
+ },
107
+ "36010": {
108
+ "content": "<extra_id_85>",
109
+ "lstrip": false,
110
+ "normalized": false,
111
+ "rstrip": false,
112
+ "single_word": false,
113
+ "special": true
114
+ },
115
+ "36011": {
116
+ "content": "<extra_id_84>",
117
+ "lstrip": false,
118
+ "normalized": false,
119
+ "rstrip": false,
120
+ "single_word": false,
121
+ "special": true
122
+ },
123
+ "36012": {
124
+ "content": "<extra_id_83>",
125
+ "lstrip": false,
126
+ "normalized": false,
127
+ "rstrip": false,
128
+ "single_word": false,
129
+ "special": true
130
+ },
131
+ "36013": {
132
+ "content": "<extra_id_82>",
133
+ "lstrip": false,
134
+ "normalized": false,
135
+ "rstrip": false,
136
+ "single_word": false,
137
+ "special": true
138
+ },
139
+ "36014": {
140
+ "content": "<extra_id_81>",
141
+ "lstrip": false,
142
+ "normalized": false,
143
+ "rstrip": false,
144
+ "single_word": false,
145
+ "special": true
146
+ },
147
+ "36015": {
148
+ "content": "<extra_id_80>",
149
+ "lstrip": false,
150
+ "normalized": false,
151
+ "rstrip": false,
152
+ "single_word": false,
153
+ "special": true
154
+ },
155
+ "36016": {
156
+ "content": "<extra_id_79>",
157
+ "lstrip": false,
158
+ "normalized": false,
159
+ "rstrip": false,
160
+ "single_word": false,
161
+ "special": true
162
+ },
163
+ "36017": {
164
+ "content": "<extra_id_78>",
165
+ "lstrip": false,
166
+ "normalized": false,
167
+ "rstrip": false,
168
+ "single_word": false,
169
+ "special": true
170
+ },
171
+ "36018": {
172
+ "content": "<extra_id_77>",
173
+ "lstrip": false,
174
+ "normalized": false,
175
+ "rstrip": false,
176
+ "single_word": false,
177
+ "special": true
178
+ },
179
+ "36019": {
180
+ "content": "<extra_id_76>",
181
+ "lstrip": false,
182
+ "normalized": false,
183
+ "rstrip": false,
184
+ "single_word": false,
185
+ "special": true
186
+ },
187
+ "36020": {
188
+ "content": "<extra_id_75>",
189
+ "lstrip": false,
190
+ "normalized": false,
191
+ "rstrip": false,
192
+ "single_word": false,
193
+ "special": true
194
+ },
195
+ "36021": {
196
+ "content": "<extra_id_74>",
197
+ "lstrip": false,
198
+ "normalized": false,
199
+ "rstrip": false,
200
+ "single_word": false,
201
+ "special": true
202
+ },
203
+ "36022": {
204
+ "content": "<extra_id_73>",
205
+ "lstrip": false,
206
+ "normalized": false,
207
+ "rstrip": false,
208
+ "single_word": false,
209
+ "special": true
210
+ },
211
+ "36023": {
212
+ "content": "<extra_id_72>",
213
+ "lstrip": false,
214
+ "normalized": false,
215
+ "rstrip": false,
216
+ "single_word": false,
217
+ "special": true
218
+ },
219
+ "36024": {
220
+ "content": "<extra_id_71>",
221
+ "lstrip": false,
222
+ "normalized": false,
223
+ "rstrip": false,
224
+ "single_word": false,
225
+ "special": true
226
+ },
227
+ "36025": {
228
+ "content": "<extra_id_70>",
229
+ "lstrip": false,
230
+ "normalized": false,
231
+ "rstrip": false,
232
+ "single_word": false,
233
+ "special": true
234
+ },
235
+ "36026": {
236
+ "content": "<extra_id_69>",
237
+ "lstrip": false,
238
+ "normalized": false,
239
+ "rstrip": false,
240
+ "single_word": false,
241
+ "special": true
242
+ },
243
+ "36027": {
244
+ "content": "<extra_id_68>",
245
+ "lstrip": false,
246
+ "normalized": false,
247
+ "rstrip": false,
248
+ "single_word": false,
249
+ "special": true
250
+ },
251
+ "36028": {
252
+ "content": "<extra_id_67>",
253
+ "lstrip": false,
254
+ "normalized": false,
255
+ "rstrip": false,
256
+ "single_word": false,
257
+ "special": true
258
+ },
259
+ "36029": {
260
+ "content": "<extra_id_66>",
261
+ "lstrip": false,
262
+ "normalized": false,
263
+ "rstrip": false,
264
+ "single_word": false,
265
+ "special": true
266
+ },
267
+ "36030": {
268
+ "content": "<extra_id_65>",
269
+ "lstrip": false,
270
+ "normalized": false,
271
+ "rstrip": false,
272
+ "single_word": false,
273
+ "special": true
274
+ },
275
+ "36031": {
276
+ "content": "<extra_id_64>",
277
+ "lstrip": false,
278
+ "normalized": false,
279
+ "rstrip": false,
280
+ "single_word": false,
281
+ "special": true
282
+ },
283
+ "36032": {
284
+ "content": "<extra_id_63>",
285
+ "lstrip": false,
286
+ "normalized": false,
287
+ "rstrip": false,
288
+ "single_word": false,
289
+ "special": true
290
+ },
291
+ "36033": {
292
+ "content": "<extra_id_62>",
293
+ "lstrip": false,
294
+ "normalized": false,
295
+ "rstrip": false,
296
+ "single_word": false,
297
+ "special": true
298
+ },
299
+ "36034": {
300
+ "content": "<extra_id_61>",
301
+ "lstrip": false,
302
+ "normalized": false,
303
+ "rstrip": false,
304
+ "single_word": false,
305
+ "special": true
306
+ },
307
+ "36035": {
308
+ "content": "<extra_id_60>",
309
+ "lstrip": false,
310
+ "normalized": false,
311
+ "rstrip": false,
312
+ "single_word": false,
313
+ "special": true
314
+ },
315
+ "36036": {
316
+ "content": "<extra_id_59>",
317
+ "lstrip": false,
318
+ "normalized": false,
319
+ "rstrip": false,
320
+ "single_word": false,
321
+ "special": true
322
+ },
323
+ "36037": {
324
+ "content": "<extra_id_58>",
325
+ "lstrip": false,
326
+ "normalized": false,
327
+ "rstrip": false,
328
+ "single_word": false,
329
+ "special": true
330
+ },
331
+ "36038": {
332
+ "content": "<extra_id_57>",
333
+ "lstrip": false,
334
+ "normalized": false,
335
+ "rstrip": false,
336
+ "single_word": false,
337
+ "special": true
338
+ },
339
+ "36039": {
340
+ "content": "<extra_id_56>",
341
+ "lstrip": false,
342
+ "normalized": false,
343
+ "rstrip": false,
344
+ "single_word": false,
345
+ "special": true
346
+ },
347
+ "36040": {
348
+ "content": "<extra_id_55>",
349
+ "lstrip": false,
350
+ "normalized": false,
351
+ "rstrip": false,
352
+ "single_word": false,
353
+ "special": true
354
+ },
355
+ "36041": {
356
+ "content": "<extra_id_54>",
357
+ "lstrip": false,
358
+ "normalized": false,
359
+ "rstrip": false,
360
+ "single_word": false,
361
+ "special": true
362
+ },
363
+ "36042": {
364
+ "content": "<extra_id_53>",
365
+ "lstrip": false,
366
+ "normalized": false,
367
+ "rstrip": false,
368
+ "single_word": false,
369
+ "special": true
370
+ },
371
+ "36043": {
372
+ "content": "<extra_id_52>",
373
+ "lstrip": false,
374
+ "normalized": false,
375
+ "rstrip": false,
376
+ "single_word": false,
377
+ "special": true
378
+ },
379
+ "36044": {
380
+ "content": "<extra_id_51>",
381
+ "lstrip": false,
382
+ "normalized": false,
383
+ "rstrip": false,
384
+ "single_word": false,
385
+ "special": true
386
+ },
387
+ "36045": {
388
+ "content": "<extra_id_50>",
389
+ "lstrip": false,
390
+ "normalized": false,
391
+ "rstrip": false,
392
+ "single_word": false,
393
+ "special": true
394
+ },
395
+ "36046": {
396
+ "content": "<extra_id_49>",
397
+ "lstrip": false,
398
+ "normalized": false,
399
+ "rstrip": false,
400
+ "single_word": false,
401
+ "special": true
402
+ },
403
+ "36047": {
404
+ "content": "<extra_id_48>",
405
+ "lstrip": false,
406
+ "normalized": false,
407
+ "rstrip": false,
408
+ "single_word": false,
409
+ "special": true
410
+ },
411
+ "36048": {
412
+ "content": "<extra_id_47>",
413
+ "lstrip": false,
414
+ "normalized": false,
415
+ "rstrip": false,
416
+ "single_word": false,
417
+ "special": true
418
+ },
419
+ "36049": {
420
+ "content": "<extra_id_46>",
421
+ "lstrip": false,
422
+ "normalized": false,
423
+ "rstrip": false,
424
+ "single_word": false,
425
+ "special": true
426
+ },
427
+ "36050": {
428
+ "content": "<extra_id_45>",
429
+ "lstrip": false,
430
+ "normalized": false,
431
+ "rstrip": false,
432
+ "single_word": false,
433
+ "special": true
434
+ },
435
+ "36051": {
436
+ "content": "<extra_id_44>",
437
+ "lstrip": false,
438
+ "normalized": false,
439
+ "rstrip": false,
440
+ "single_word": false,
441
+ "special": true
442
+ },
443
+ "36052": {
444
+ "content": "<extra_id_43>",
445
+ "lstrip": false,
446
+ "normalized": false,
447
+ "rstrip": false,
448
+ "single_word": false,
449
+ "special": true
450
+ },
451
+ "36053": {
452
+ "content": "<extra_id_42>",
453
+ "lstrip": false,
454
+ "normalized": false,
455
+ "rstrip": false,
456
+ "single_word": false,
457
+ "special": true
458
+ },
459
+ "36054": {
460
+ "content": "<extra_id_41>",
461
+ "lstrip": false,
462
+ "normalized": false,
463
+ "rstrip": false,
464
+ "single_word": false,
465
+ "special": true
466
+ },
467
+ "36055": {
468
+ "content": "<extra_id_40>",
469
+ "lstrip": false,
470
+ "normalized": false,
471
+ "rstrip": false,
472
+ "single_word": false,
473
+ "special": true
474
+ },
475
+ "36056": {
476
+ "content": "<extra_id_39>",
477
+ "lstrip": false,
478
+ "normalized": false,
479
+ "rstrip": false,
480
+ "single_word": false,
481
+ "special": true
482
+ },
483
+ "36057": {
484
+ "content": "<extra_id_38>",
485
+ "lstrip": false,
486
+ "normalized": false,
487
+ "rstrip": false,
488
+ "single_word": false,
489
+ "special": true
490
+ },
491
+ "36058": {
492
+ "content": "<extra_id_37>",
493
+ "lstrip": false,
494
+ "normalized": false,
495
+ "rstrip": false,
496
+ "single_word": false,
497
+ "special": true
498
+ },
499
+ "36059": {
500
+ "content": "<extra_id_36>",
501
+ "lstrip": false,
502
+ "normalized": false,
503
+ "rstrip": false,
504
+ "single_word": false,
505
+ "special": true
506
+ },
507
+ "36060": {
508
+ "content": "<extra_id_35>",
509
+ "lstrip": false,
510
+ "normalized": false,
511
+ "rstrip": false,
512
+ "single_word": false,
513
+ "special": true
514
+ },
515
+ "36061": {
516
+ "content": "<extra_id_34>",
517
+ "lstrip": false,
518
+ "normalized": false,
519
+ "rstrip": false,
520
+ "single_word": false,
521
+ "special": true
522
+ },
523
+ "36062": {
524
+ "content": "<extra_id_33>",
525
+ "lstrip": false,
526
+ "normalized": false,
527
+ "rstrip": false,
528
+ "single_word": false,
529
+ "special": true
530
+ },
531
+ "36063": {
532
+ "content": "<extra_id_32>",
533
+ "lstrip": false,
534
+ "normalized": false,
535
+ "rstrip": false,
536
+ "single_word": false,
537
+ "special": true
538
+ },
539
+ "36064": {
540
+ "content": "<extra_id_31>",
541
+ "lstrip": false,
542
+ "normalized": false,
543
+ "rstrip": false,
544
+ "single_word": false,
545
+ "special": true
546
+ },
547
+ "36065": {
548
+ "content": "<extra_id_30>",
549
+ "lstrip": false,
550
+ "normalized": false,
551
+ "rstrip": false,
552
+ "single_word": false,
553
+ "special": true
554
+ },
555
+ "36066": {
556
+ "content": "<extra_id_29>",
557
+ "lstrip": false,
558
+ "normalized": false,
559
+ "rstrip": false,
560
+ "single_word": false,
561
+ "special": true
562
+ },
563
+ "36067": {
564
+ "content": "<extra_id_28>",
565
+ "lstrip": false,
566
+ "normalized": false,
567
+ "rstrip": false,
568
+ "single_word": false,
569
+ "special": true
570
+ },
571
+ "36068": {
572
+ "content": "<extra_id_27>",
573
+ "lstrip": false,
574
+ "normalized": false,
575
+ "rstrip": false,
576
+ "single_word": false,
577
+ "special": true
578
+ },
579
+ "36069": {
580
+ "content": "<extra_id_26>",
581
+ "lstrip": false,
582
+ "normalized": false,
583
+ "rstrip": false,
584
+ "single_word": false,
585
+ "special": true
586
+ },
587
+ "36070": {
588
+ "content": "<extra_id_25>",
589
+ "lstrip": false,
590
+ "normalized": false,
591
+ "rstrip": false,
592
+ "single_word": false,
593
+ "special": true
594
+ },
595
+ "36071": {
596
+ "content": "<extra_id_24>",
597
+ "lstrip": false,
598
+ "normalized": false,
599
+ "rstrip": false,
600
+ "single_word": false,
601
+ "special": true
602
+ },
603
+ "36072": {
604
+ "content": "<extra_id_23>",
605
+ "lstrip": false,
606
+ "normalized": false,
607
+ "rstrip": false,
608
+ "single_word": false,
609
+ "special": true
610
+ },
611
+ "36073": {
612
+ "content": "<extra_id_22>",
613
+ "lstrip": false,
614
+ "normalized": false,
615
+ "rstrip": false,
616
+ "single_word": false,
617
+ "special": true
618
+ },
619
+ "36074": {
620
+ "content": "<extra_id_21>",
621
+ "lstrip": false,
622
+ "normalized": false,
623
+ "rstrip": false,
624
+ "single_word": false,
625
+ "special": true
626
+ },
627
+ "36075": {
628
+ "content": "<extra_id_20>",
629
+ "lstrip": false,
630
+ "normalized": false,
631
+ "rstrip": false,
632
+ "single_word": false,
633
+ "special": true
634
+ },
635
+ "36076": {
636
+ "content": "<extra_id_19>",
637
+ "lstrip": false,
638
+ "normalized": false,
639
+ "rstrip": false,
640
+ "single_word": false,
641
+ "special": true
642
+ },
643
+ "36077": {
644
+ "content": "<extra_id_18>",
645
+ "lstrip": false,
646
+ "normalized": false,
647
+ "rstrip": false,
648
+ "single_word": false,
649
+ "special": true
650
+ },
651
+ "36078": {
652
+ "content": "<extra_id_17>",
653
+ "lstrip": false,
654
+ "normalized": false,
655
+ "rstrip": false,
656
+ "single_word": false,
657
+ "special": true
658
+ },
659
+ "36079": {
660
+ "content": "<extra_id_16>",
661
+ "lstrip": false,
662
+ "normalized": false,
663
+ "rstrip": false,
664
+ "single_word": false,
665
+ "special": true
666
+ },
667
+ "36080": {
668
+ "content": "<extra_id_15>",
669
+ "lstrip": false,
670
+ "normalized": false,
671
+ "rstrip": false,
672
+ "single_word": false,
673
+ "special": true
674
+ },
675
+ "36081": {
676
+ "content": "<extra_id_14>",
677
+ "lstrip": false,
678
+ "normalized": false,
679
+ "rstrip": false,
680
+ "single_word": false,
681
+ "special": true
682
+ },
683
+ "36082": {
684
+ "content": "<extra_id_13>",
685
+ "lstrip": false,
686
+ "normalized": false,
687
+ "rstrip": false,
688
+ "single_word": false,
689
+ "special": true
690
+ },
691
+ "36083": {
692
+ "content": "<extra_id_12>",
693
+ "lstrip": false,
694
+ "normalized": false,
695
+ "rstrip": false,
696
+ "single_word": false,
697
+ "special": true
698
+ },
699
+ "36084": {
700
+ "content": "<extra_id_11>",
701
+ "lstrip": false,
702
+ "normalized": false,
703
+ "rstrip": false,
704
+ "single_word": false,
705
+ "special": true
706
+ },
707
+ "36085": {
708
+ "content": "<extra_id_10>",
709
+ "lstrip": false,
710
+ "normalized": false,
711
+ "rstrip": false,
712
+ "single_word": false,
713
+ "special": true
714
+ },
715
+ "36086": {
716
+ "content": "<extra_id_9>",
717
+ "lstrip": false,
718
+ "normalized": false,
719
+ "rstrip": false,
720
+ "single_word": false,
721
+ "special": true
722
+ },
723
+ "36087": {
724
+ "content": "<extra_id_8>",
725
+ "lstrip": false,
726
+ "normalized": false,
727
+ "rstrip": false,
728
+ "single_word": false,
729
+ "special": true
730
+ },
731
+ "36088": {
732
+ "content": "<extra_id_7>",
733
+ "lstrip": false,
734
+ "normalized": false,
735
+ "rstrip": false,
736
+ "single_word": false,
737
+ "special": true
738
+ },
739
+ "36089": {
740
+ "content": "<extra_id_6>",
741
+ "lstrip": false,
742
+ "normalized": false,
743
+ "rstrip": false,
744
+ "single_word": false,
745
+ "special": true
746
+ },
747
+ "36090": {
748
+ "content": "<extra_id_5>",
749
+ "lstrip": false,
750
+ "normalized": false,
751
+ "rstrip": false,
752
+ "single_word": false,
753
+ "special": true
754
+ },
755
+ "36091": {
756
+ "content": "<extra_id_4>",
757
+ "lstrip": false,
758
+ "normalized": false,
759
+ "rstrip": false,
760
+ "single_word": false,
761
+ "special": true
762
+ },
763
+ "36092": {
764
+ "content": "<extra_id_3>",
765
+ "lstrip": false,
766
+ "normalized": false,
767
+ "rstrip": false,
768
+ "single_word": false,
769
+ "special": true
770
+ },
771
+ "36093": {
772
+ "content": "<extra_id_2>",
773
+ "lstrip": false,
774
+ "normalized": false,
775
+ "rstrip": false,
776
+ "single_word": false,
777
+ "special": true
778
+ },
779
+ "36094": {
780
+ "content": "<extra_id_1>",
781
+ "lstrip": false,
782
+ "normalized": false,
783
+ "rstrip": false,
784
+ "single_word": false,
785
+ "special": true
786
+ },
787
+ "36095": {
788
+ "content": "<extra_id_0>",
789
+ "lstrip": false,
790
+ "normalized": false,
791
+ "rstrip": false,
792
+ "single_word": false,
793
+ "special": true
794
+ }
795
+ },
796
+ "additional_special_tokens": [
797
+ "<extra_id_0>",
798
+ "<extra_id_1>",
799
+ "<extra_id_2>",
800
+ "<extra_id_3>",
801
+ "<extra_id_4>",
802
+ "<extra_id_5>",
803
+ "<extra_id_6>",
804
+ "<extra_id_7>",
805
+ "<extra_id_8>",
806
+ "<extra_id_9>",
807
+ "<extra_id_10>",
808
+ "<extra_id_11>",
809
+ "<extra_id_12>",
810
+ "<extra_id_13>",
811
+ "<extra_id_14>",
812
+ "<extra_id_15>",
813
+ "<extra_id_16>",
814
+ "<extra_id_17>",
815
+ "<extra_id_18>",
816
+ "<extra_id_19>",
817
+ "<extra_id_20>",
818
+ "<extra_id_21>",
819
+ "<extra_id_22>",
820
+ "<extra_id_23>",
821
+ "<extra_id_24>",
822
+ "<extra_id_25>",
823
+ "<extra_id_26>",
824
+ "<extra_id_27>",
825
+ "<extra_id_28>",
826
+ "<extra_id_29>",
827
+ "<extra_id_30>",
828
+ "<extra_id_31>",
829
+ "<extra_id_32>",
830
+ "<extra_id_33>",
831
+ "<extra_id_34>",
832
+ "<extra_id_35>",
833
+ "<extra_id_36>",
834
+ "<extra_id_37>",
835
+ "<extra_id_38>",
836
+ "<extra_id_39>",
837
+ "<extra_id_40>",
838
+ "<extra_id_41>",
839
+ "<extra_id_42>",
840
+ "<extra_id_43>",
841
+ "<extra_id_44>",
842
+ "<extra_id_45>",
843
+ "<extra_id_46>",
844
+ "<extra_id_47>",
845
+ "<extra_id_48>",
846
+ "<extra_id_49>",
847
+ "<extra_id_50>",
848
+ "<extra_id_51>",
849
+ "<extra_id_52>",
850
+ "<extra_id_53>",
851
+ "<extra_id_54>",
852
+ "<extra_id_55>",
853
+ "<extra_id_56>",
854
+ "<extra_id_57>",
855
+ "<extra_id_58>",
856
+ "<extra_id_59>",
857
+ "<extra_id_60>",
858
+ "<extra_id_61>",
859
+ "<extra_id_62>",
860
+ "<extra_id_63>",
861
+ "<extra_id_64>",
862
+ "<extra_id_65>",
863
+ "<extra_id_66>",
864
+ "<extra_id_67>",
865
+ "<extra_id_68>",
866
+ "<extra_id_69>",
867
+ "<extra_id_70>",
868
+ "<extra_id_71>",
869
+ "<extra_id_72>",
870
+ "<extra_id_73>",
871
+ "<extra_id_74>",
872
+ "<extra_id_75>",
873
+ "<extra_id_76>",
874
+ "<extra_id_77>",
875
+ "<extra_id_78>",
876
+ "<extra_id_79>",
877
+ "<extra_id_80>",
878
+ "<extra_id_81>",
879
+ "<extra_id_82>",
880
+ "<extra_id_83>",
881
+ "<extra_id_84>",
882
+ "<extra_id_85>",
883
+ "<extra_id_86>",
884
+ "<extra_id_87>",
885
+ "<extra_id_88>",
886
+ "<extra_id_89>",
887
+ "<extra_id_90>",
888
+ "<extra_id_91>",
889
+ "<extra_id_92>",
890
+ "<extra_id_93>",
891
+ "<extra_id_94>",
892
+ "<extra_id_95>"
893
+ ],
894
+ "clean_up_tokenization_spaces": true,
895
+ "eos_token": "</s>",
896
+ "extra_ids": 96,
897
+ "model_max_length": 1000000000000000019884624838656,
898
+ "pad_token": "<pad>",
899
+ "sp_model_kwargs": {},
900
+ "tokenizer_class": "T5Tokenizer",
901
+ "unk_token": "<unk>"
902
+ }
training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8034e1b48314d5b759aa522ba1d2080820de0c02bbb9a2db20f3bb04950bc070
3
+ size 4920