amaanbadure
commited on
Commit
•
3638108
1
Parent(s):
a0c2c22
Upload tokenizer
Browse files- None.txt +1000 -0
- sentencepiece_tokenizer.py +82 -0
- special_tokens_map.json +1 -0
- tokenizer_config.json +14 -0
- vocab.txt +1000 -0
None.txt
ADDED
@@ -0,0 +1,1000 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
<pad> 0
|
2 |
+
<unk> 0
|
3 |
+
<s> 0
|
4 |
+
</s> 0
|
5 |
+
s -2.98325
|
6 |
+
▁ -3.33613
|
7 |
+
▁the -3.53659
|
8 |
+
, -3.96136
|
9 |
+
▁of -4.11741
|
10 |
+
e -4.13254
|
11 |
+
. -4.1679
|
12 |
+
▁a -4.32755
|
13 |
+
▁and -4.33125
|
14 |
+
▁in -4.37771
|
15 |
+
ed -4.40148
|
16 |
+
d -4.43306
|
17 |
+
t -4.4655
|
18 |
+
y -4.53252
|
19 |
+
ing -4.61545
|
20 |
+
er -4.6614
|
21 |
+
a -4.69442
|
22 |
+
l -4.74331
|
23 |
+
▁to -4.74857
|
24 |
+
n -4.76571
|
25 |
+
o -4.80687
|
26 |
+
▁, -4.92362
|
27 |
+
▁is -4.93935
|
28 |
+
r -4.97962
|
29 |
+
al -4.99362
|
30 |
+
in -5.09839
|
31 |
+
ar -5.10752
|
32 |
+
p -5.16879
|
33 |
+
f -5.17396
|
34 |
+
or -5.20309
|
35 |
+
c -5.21379
|
36 |
+
g -5.21537
|
37 |
+
▁The -5.26093
|
38 |
+
re -5.33666
|
39 |
+
- -5.37802
|
40 |
+
b -5.39736
|
41 |
+
ly -5.41386
|
42 |
+
▁. -5.4411
|
43 |
+
en -5.45186
|
44 |
+
i -5.47261
|
45 |
+
▁( -5.50639
|
46 |
+
▁f -5.51352
|
47 |
+
an -5.54095
|
48 |
+
▁as -5.54212
|
49 |
+
ur -5.55306
|
50 |
+
▁S -5.57071
|
51 |
+
▁re -5.58107
|
52 |
+
es -5.58272
|
53 |
+
▁for -5.62901
|
54 |
+
ic -5.63297
|
55 |
+
m -5.64497
|
56 |
+
u -5.65596
|
57 |
+
▁A -5.65812
|
58 |
+
le -5.66668
|
59 |
+
it -5.68914
|
60 |
+
▁by -5.70114
|
61 |
+
▁was -5.75532
|
62 |
+
on -5.79453
|
63 |
+
ri -5.79803
|
64 |
+
▁B -5.80188
|
65 |
+
st -5.81431
|
66 |
+
' -5.82833
|
67 |
+
▁with -5.83968
|
68 |
+
th -5.84353
|
69 |
+
▁on -5.87698
|
70 |
+
h -5.88915
|
71 |
+
▁P -5.89336
|
72 |
+
w -5.89774
|
73 |
+
▁or -5.91013
|
74 |
+
ra -5.92151
|
75 |
+
ation -5.92539
|
76 |
+
▁be -5.9376
|
77 |
+
il -5.98519
|
78 |
+
ent -5.9883
|
79 |
+
▁an -5.99257
|
80 |
+
▁19 -6.01172
|
81 |
+
ion -6.01493
|
82 |
+
at -6.02207
|
83 |
+
▁" -6.02294
|
84 |
+
▁c -6.02546
|
85 |
+
ch -6.02773
|
86 |
+
) -6.03923
|
87 |
+
k -6.04155
|
88 |
+
▁co -6.04329
|
89 |
+
▁are -6.05606
|
90 |
+
ro -6.0652
|
91 |
+
▁C -6.07878
|
92 |
+
▁p -6.11511
|
93 |
+
v -6.1246
|
94 |
+
us -6.13632
|
95 |
+
▁de -6.14746
|
96 |
+
▁st -6.15681
|
97 |
+
▁that -6.16069
|
98 |
+
1 -6.16222
|
99 |
+
se -6.17232
|
100 |
+
ce -6.18052
|
101 |
+
ir -6.18303
|
102 |
+
▁from -6.18936
|
103 |
+
5 -6.19203
|
104 |
+
is -6.22921
|
105 |
+
" -6.23156
|
106 |
+
▁D -6.25522
|
107 |
+
el -6.25566
|
108 |
+
ne -6.27447
|
109 |
+
te -6.28033
|
110 |
+
ad -6.29411
|
111 |
+
▁G -6.29495
|
112 |
+
ment -6.29817
|
113 |
+
am -6.29912
|
114 |
+
▁F -6.29947
|
115 |
+
x -6.30442
|
116 |
+
▁T -6.32441
|
117 |
+
li -6.32652
|
118 |
+
▁m -6.33549
|
119 |
+
ol -6.34257
|
120 |
+
ive -6.35499
|
121 |
+
9 -6.3607
|
122 |
+
un -6.38235
|
123 |
+
▁con -6.38422
|
124 |
+
id -6.3859
|
125 |
+
ate -6.38848
|
126 |
+
est -6.3947
|
127 |
+
▁In -6.39701
|
128 |
+
ul -6.40068
|
129 |
+
ut -6.41284
|
130 |
+
0 -6.41971
|
131 |
+
▁t -6.42085
|
132 |
+
▁H -6.43357
|
133 |
+
et -6.44432
|
134 |
+
2 -6.44628
|
135 |
+
as -6.44759
|
136 |
+
▁se -6.4536
|
137 |
+
6 -6.45453
|
138 |
+
▁b -6.46467
|
139 |
+
7 -6.46587
|
140 |
+
la -6.4908
|
141 |
+
8 -6.49474
|
142 |
+
ist -6.49804
|
143 |
+
▁ex -6.50137
|
144 |
+
▁g -6.50505
|
145 |
+
S -6.50922
|
146 |
+
▁h -6.51419
|
147 |
+
4 -6.52466
|
148 |
+
▁which -6.54796
|
149 |
+
▁at -6.58108
|
150 |
+
▁W -6.5819
|
151 |
+
3 -6.58465
|
152 |
+
im -6.5961
|
153 |
+
om -6.59781
|
154 |
+
A -6.60127
|
155 |
+
age -6.60365
|
156 |
+
ies -6.60467
|
157 |
+
▁w -6.62078
|
158 |
+
ver -6.62924
|
159 |
+
▁N -6.63071
|
160 |
+
ers -6.63181
|
161 |
+
▁E -6.63282
|
162 |
+
C -6.63669
|
163 |
+
ve -6.63671
|
164 |
+
▁e -6.65324
|
165 |
+
▁has -6.66208
|
166 |
+
▁it -6.67689
|
167 |
+
ter -6.68174
|
168 |
+
ity -6.68823
|
169 |
+
mp -6.70881
|
170 |
+
▁his -6.72489
|
171 |
+
▁d -6.73116
|
172 |
+
um -6.7349
|
173 |
+
ge -6.73673
|
174 |
+
▁M -6.74175
|
175 |
+
me -6.74328
|
176 |
+
▁r -6.74662
|
177 |
+
▁1 -6.75046
|
178 |
+
qu -6.75189
|
179 |
+
▁I -6.75752
|
180 |
+
▁United -6.76143
|
181 |
+
nd -6.76592
|
182 |
+
lo -6.76616
|
183 |
+
▁ch -6.77466
|
184 |
+
▁also -6.7776
|
185 |
+
▁J -6.79458
|
186 |
+
▁po -6.80132
|
187 |
+
), -6.80651
|
188 |
+
▁It -6.81648
|
189 |
+
▁pro -6.81762
|
190 |
+
and -6.81885
|
191 |
+
▁he -6.8234
|
192 |
+
▁have -6.83154
|
193 |
+
z -6.8364
|
194 |
+
▁O -6.84215
|
195 |
+
ill -6.84536
|
196 |
+
ant -6.84949
|
197 |
+
▁R -6.85995
|
198 |
+
▁what -6.88048
|
199 |
+
ated -6.88381
|
200 |
+
▁States -6.88593
|
201 |
+
ine -6.89957
|
202 |
+
▁di -6.90808
|
203 |
+
ight -6.90919
|
204 |
+
ance -6.91298
|
205 |
+
ph -6.9194
|
206 |
+
▁other -6.92562
|
207 |
+
; -6.93669
|
208 |
+
co -6.94291
|
209 |
+
▁U -6.94648
|
210 |
+
tic -6.95711
|
211 |
+
ide -6.96324
|
212 |
+
ta -6.96777
|
213 |
+
▁its -6.9678
|
214 |
+
ect -6.97397
|
215 |
+
ud -6.97493
|
216 |
+
iv -6.98038
|
217 |
+
▁who -6.98122
|
218 |
+
▁mo -6.98793
|
219 |
+
I -6.99739
|
220 |
+
ot -7.01328
|
221 |
+
▁not -7.01789
|
222 |
+
▁most -7.02148
|
223 |
+
▁v -7.02259
|
224 |
+
ci -7.02331
|
225 |
+
▁were -7.03457
|
226 |
+
tion -7.04212
|
227 |
+
ow -7.04501
|
228 |
+
ry -7.04542
|
229 |
+
▁2 -7.05202
|
230 |
+
op -7.05275
|
231 |
+
▁first -7.0554
|
232 |
+
▁K -7.05685
|
233 |
+
all -7.0605
|
234 |
+
min -7.06175
|
235 |
+
▁can -7.06893
|
236 |
+
ia -7.07865
|
237 |
+
ac -7.08502
|
238 |
+
▁sp -7.09015
|
239 |
+
▁pa -7.09396
|
240 |
+
▁one -7.09743
|
241 |
+
). -7.10594
|
242 |
+
ther -7.11186
|
243 |
+
pe -7.1143
|
244 |
+
av -7.12624
|
245 |
+
mo -7.12761
|
246 |
+
▁Ch -7.13342
|
247 |
+
ical -7.13516
|
248 |
+
pp -7.13969
|
249 |
+
▁American -7.14112
|
250 |
+
▁un -7.14512
|
251 |
+
ian -7.14524
|
252 |
+
ig -7.14606
|
253 |
+
▁been -7.15507
|
254 |
+
ence -7.15667
|
255 |
+
▁used -7.15929
|
256 |
+
▁so -7.16047
|
257 |
+
ap -7.17222
|
258 |
+
▁St -7.17543
|
259 |
+
ven -7.18062
|
260 |
+
ke -7.18374
|
261 |
+
old -7.20342
|
262 |
+
▁ma -7.2115
|
263 |
+
▁form -7.21604
|
264 |
+
land -7.21658
|
265 |
+
▁ca -7.21738
|
266 |
+
▁state -7.21891
|
267 |
+
ck -7.22935
|
268 |
+
hi -7.23329
|
269 |
+
ted -7.24357
|
270 |
+
▁la -7.25031
|
271 |
+
▁such -7.2514
|
272 |
+
▁pre -7.25425
|
273 |
+
port -7.2548
|
274 |
+
ie -7.25505
|
275 |
+
D -7.25589
|
276 |
+
▁their -7.26005
|
277 |
+
▁part -7.26338
|
278 |
+
able -7.26411
|
279 |
+
▁Mo -7.2669
|
280 |
+
em -7.26987
|
281 |
+
T -7.27079
|
282 |
+
ma -7.27164
|
283 |
+
ub -7.27451
|
284 |
+
▁He -7.27531
|
285 |
+
ial -7.27582
|
286 |
+
ag -7.27696
|
287 |
+
ction -7.27945
|
288 |
+
P -7.29408
|
289 |
+
up -7.31156
|
290 |
+
▁V -7.31241
|
291 |
+
ard -7.31839
|
292 |
+
ous -7.32009
|
293 |
+
▁me -7.32062
|
294 |
+
ell -7.32153
|
295 |
+
: -7.32453
|
296 |
+
▁but -7.32773
|
297 |
+
he -7.33481
|
298 |
+
▁no -7.34059
|
299 |
+
▁over -7.34226
|
300 |
+
▁many -7.34398
|
301 |
+
ha -7.35318
|
302 |
+
mb -7.36081
|
303 |
+
bo -7.36412
|
304 |
+
if -7.36603
|
305 |
+
les -7.36806
|
306 |
+
ten -7.37112
|
307 |
+
▁into -7.3734
|
308 |
+
ally -7.37849
|
309 |
+
ust -7.37887
|
310 |
+
ish -7.37962
|
311 |
+
▁known -7.38086
|
312 |
+
▁two -7.38213
|
313 |
+
ary -7.38731
|
314 |
+
ang -7.39591
|
315 |
+
▁sh -7.39651
|
316 |
+
ho -7.40195
|
317 |
+
▁Ma -7.4021
|
318 |
+
▁all -7.40284
|
319 |
+
ti -7.40569
|
320 |
+
▁ho -7.40924
|
321 |
+
▁L -7.41168
|
322 |
+
ab -7.41502
|
323 |
+
com -7.42251
|
324 |
+
▁name -7.4232
|
325 |
+
▁3 -7.42434
|
326 |
+
uc -7.42528
|
327 |
+
ak -7.42852
|
328 |
+
to -7.43329
|
329 |
+
j -7.43401
|
330 |
+
day -7.44705
|
331 |
+
▁j -7.45545
|
332 |
+
B -7.45711
|
333 |
+
▁Re -7.4583
|
334 |
+
– -7.46056
|
335 |
+
▁use -7.46287
|
336 |
+
cent -7.46858
|
337 |
+
▁more -7.47239
|
338 |
+
▁18 -7.47506
|
339 |
+
mi -7.47913
|
340 |
+
▁Co -7.48482
|
341 |
+
ture -7.49362
|
342 |
+
po -7.50349
|
343 |
+
ca -7.50676
|
344 |
+
▁when -7.50816
|
345 |
+
▁ba -7.51262
|
346 |
+
E -7.51342
|
347 |
+
und -7.51527
|
348 |
+
▁br -7.51879
|
349 |
+
200 -7.52528
|
350 |
+
na -7.53136
|
351 |
+
ach -7.53575
|
352 |
+
▁act -7.53834
|
353 |
+
one -7.53944
|
354 |
+
▁time -7.54097
|
355 |
+
▁play -7.54584
|
356 |
+
ric -7.55652
|
357 |
+
M -7.55855
|
358 |
+
ue -7.55971
|
359 |
+
▁may -7.56174
|
360 |
+
ress -7.56233
|
361 |
+
tra -7.56266
|
362 |
+
▁include -7.56512
|
363 |
+
▁high -7.56513
|
364 |
+
▁car -7.5676
|
365 |
+
▁film -7.56876
|
366 |
+
ative -7.56917
|
367 |
+
▁La -7.57192
|
368 |
+
▁term -7.57839
|
369 |
+
no -7.58717
|
370 |
+
▁some -7.59031
|
371 |
+
lin -7.59239
|
372 |
+
▁New -7.59409
|
373 |
+
low -7.59432
|
374 |
+
▁do -7.595
|
375 |
+
▁after -7.59602
|
376 |
+
tro -7.59984
|
377 |
+
ru -7.60526
|
378 |
+
▁than -7.6062
|
379 |
+
▁bo -7.61657
|
380 |
+
ok -7.61903
|
381 |
+
▁number -7.62558
|
382 |
+
▁world -7.62936
|
383 |
+
ron -7.63126
|
384 |
+
ition -7.63362
|
385 |
+
ack -7.63495
|
386 |
+
ug -7.63745
|
387 |
+
vo -7.64372
|
388 |
+
▁per -7.64738
|
389 |
+
▁where -7.65822
|
390 |
+
▁lo -7.66202
|
391 |
+
man -7.66506
|
392 |
+
▁had -7.6653
|
393 |
+
▁Ro -7.66706
|
394 |
+
R -7.6693
|
395 |
+
N -7.67234
|
396 |
+
▁this -7.67473
|
397 |
+
▁De -7.68762
|
398 |
+
ank -7.69171
|
399 |
+
▁War -7.69455
|
400 |
+
▁inter -7.70337
|
401 |
+
▁Mar -7.70572
|
402 |
+
act -7.70587
|
403 |
+
▁k -7.71029
|
404 |
+
the -7.71248
|
405 |
+
▁gr -7.71417
|
406 |
+
mon -7.71636
|
407 |
+
▁her -7.72386
|
408 |
+
ual -7.72539
|
409 |
+
▁An -7.73173
|
410 |
+
▁only -7.7342
|
411 |
+
L -7.7428
|
412 |
+
▁system -7.74584
|
413 |
+
▁acc -7.75146
|
414 |
+
ship -7.75202
|
415 |
+
ton -7.75294
|
416 |
+
ities -7.75685
|
417 |
+
▁out -7.75767
|
418 |
+
▁Ar -7.76284
|
419 |
+
round -7.76685
|
420 |
+
▁This -7.76688
|
421 |
+
ism -7.76781
|
422 |
+
▁series -7.77408
|
423 |
+
▁refer -7.77481
|
424 |
+
io -7.77484
|
425 |
+
ice -7.77969
|
426 |
+
00 -7.78432
|
427 |
+
▁work -7.78498
|
428 |
+
ip -7.78704
|
429 |
+
ized -7.78924
|
430 |
+
▁million -7.79162
|
431 |
+
F -7.79665
|
432 |
+
cul -7.79869
|
433 |
+
over -7.79984
|
434 |
+
▁years -7.80147
|
435 |
+
▁war -7.80264
|
436 |
+
ep -7.80304
|
437 |
+
O -7.80382
|
438 |
+
▁Lo -7.8093
|
439 |
+
during -7.80962
|
440 |
+
▁4 -7.81569
|
441 |
+
▁how -7.82293
|
442 |
+
di -7.82509
|
443 |
+
▁common -7.83726
|
444 |
+
▁dis -7.8391
|
445 |
+
▁including -7.83956
|
446 |
+
▁game -7.84703
|
447 |
+
ick -7.85306
|
448 |
+
▁World -7.8537
|
449 |
+
▁under -7.8545
|
450 |
+
▁between -7.86084
|
451 |
+
ration -7.86217
|
452 |
+
ev -7.87153
|
453 |
+
▁well -7.87304
|
454 |
+
▁Ho -7.8788
|
455 |
+
way -7.87917
|
456 |
+
ize -7.88827
|
457 |
+
▁trans -7.89243
|
458 |
+
came -7.89553
|
459 |
+
present -7.8977
|
460 |
+
ga -7.90352
|
461 |
+
imp -7.90424
|
462 |
+
▁20 -7.91065
|
463 |
+
▁large -7.91385
|
464 |
+
▁new -7.92043
|
465 |
+
▁record -7.92244
|
466 |
+
▁four -7.9228
|
467 |
+
▁we -7.92322
|
468 |
+
▁major -7.93266
|
469 |
+
H -7.93297
|
470 |
+
▁often -7.93609
|
471 |
+
▁group -7.94299
|
472 |
+
uch -7.94534
|
473 |
+
▁up -7.94593
|
474 |
+
▁develop -7.94817
|
475 |
+
▁produce -7.95324
|
476 |
+
▁people -7.96394
|
477 |
+
ner -7.96649
|
478 |
+
% -7.97192
|
479 |
+
tter -7.97777
|
480 |
+
▁For -7.97864
|
481 |
+
▁plan -7.98045
|
482 |
+
▁Bo -7.98192
|
483 |
+
▁called -7.98275
|
484 |
+
bu -7.99349
|
485 |
+
▁about -7.99356
|
486 |
+
▁Me -7.99467
|
487 |
+
▁population -7.99625
|
488 |
+
con -7.99954
|
489 |
+
▁end -8.00591
|
490 |
+
▁second -8.01283
|
491 |
+
▁mi -8.01704
|
492 |
+
▁area -8.02148
|
493 |
+
▁show -8.02283
|
494 |
+
/ -8.02399
|
495 |
+
▁Con -8.0241
|
496 |
+
ttle -8.03169
|
497 |
+
▁since -8.03253
|
498 |
+
▁three -8.03533
|
499 |
+
▁To -8.03668
|
500 |
+
▁vi -8.03818
|
501 |
+
V -8.0431
|
502 |
+
ward -8.04836
|
503 |
+
▁season -8.05255
|
504 |
+
ib -8.05421
|
505 |
+
▁both -8.0575
|
506 |
+
▁America -8.06135
|
507 |
+
▁year -8.0631
|
508 |
+
? -8.07004
|
509 |
+
▁South -8.073
|
510 |
+
▁city -8.07512
|
511 |
+
▁through -8.07597
|
512 |
+
gu -8.07666
|
513 |
+
cri -8.07767
|
514 |
+
▁team -8.08249
|
515 |
+
▁product -8.08424
|
516 |
+
▁found -8.09697
|
517 |
+
▁main -8.10388
|
518 |
+
▁law -8.10683
|
519 |
+
▁sub -8.1072
|
520 |
+
▁Th -8.10747
|
521 |
+
va -8.11156
|
522 |
+
▁character -8.11215
|
523 |
+
▁follow -8.12453
|
524 |
+
▁government -8.12763
|
525 |
+
▁Mi -8.12877
|
526 |
+
▁North -8.13132
|
527 |
+
▁made -8.13142
|
528 |
+
▁man -8.13487
|
529 |
+
ign -8.13576
|
530 |
+
▁creat -8.14272
|
531 |
+
east -8.1504
|
532 |
+
▁human -8.15615
|
533 |
+
▁song -8.15634
|
534 |
+
ator -8.15765
|
535 |
+
▁Le -8.16108
|
536 |
+
▁lead -8.17645
|
537 |
+
▁different -8.17884
|
538 |
+
while -8.17924
|
539 |
+
direct -8.18304
|
540 |
+
,000 -8.18884
|
541 |
+
▁2010 -8.19207
|
542 |
+
▁long -8.19886
|
543 |
+
▁right -8.2005
|
544 |
+
▁John -8.2021
|
545 |
+
▁power -8.2024
|
546 |
+
▁does -8.20394
|
547 |
+
X -8.20547
|
548 |
+
▁several -8.2089
|
549 |
+
▁largest -8.21363
|
550 |
+
▁countries -8.21565
|
551 |
+
▁general -8.21566
|
552 |
+
▁life -8.21571
|
553 |
+
ible -8.22191
|
554 |
+
▁each -8.22319
|
555 |
+
G -8.2286
|
556 |
+
▁own -8.23473
|
557 |
+
▁US -8.23481
|
558 |
+
▁history -8.23978
|
559 |
+
▁On -8.24717
|
560 |
+
▁17 -8.26111
|
561 |
+
▁person -8.26485
|
562 |
+
▁single -8.26853
|
563 |
+
▁mean -8.26999
|
564 |
+
form -8.27906
|
565 |
+
▁2011 -8.28257
|
566 |
+
▁member -8.2826
|
567 |
+
▁album -8.28988
|
568 |
+
▁national -8.28992
|
569 |
+
▁Com -8.29855
|
570 |
+
$ -8.30094
|
571 |
+
▁public -8.30466
|
572 |
+
▁bi -8.30766
|
573 |
+
▁leg -8.30841
|
574 |
+
▁result -8.30842
|
575 |
+
▁later -8.30898
|
576 |
+
▁Award -8.30927
|
577 |
+
▁President -8.31214
|
578 |
+
▁process -8.31217
|
579 |
+
▁usually -8.3159
|
580 |
+
▁water -8.3162
|
581 |
+
— -8.31967
|
582 |
+
▁century -8.31968
|
583 |
+
▁appear -8.31968
|
584 |
+
▁music -8.32404
|
585 |
+
▁success -8.32726
|
586 |
+
▁service -8.33108
|
587 |
+
▁type -8.33118
|
588 |
+
▁president -8.33491
|
589 |
+
▁perform -8.34315
|
590 |
+
60 -8.35939
|
591 |
+
▁Li -8.36016
|
592 |
+
ness -8.3606
|
593 |
+
▁list -8.36139
|
594 |
+
▁featur -8.36218
|
595 |
+
▁operat -8.36292
|
596 |
+
U -8.36662
|
597 |
+
born -8.36936
|
598 |
+
▁released -8.37568
|
599 |
+
▁original -8.37602
|
600 |
+
▁Col -8.37608
|
601 |
+
▁before -8.37806
|
602 |
+
▁small -8.37808
|
603 |
+
▁cause -8.38501
|
604 |
+
▁cell -8.38604
|
605 |
+
▁early -8.38633
|
606 |
+
▁event -8.38638
|
607 |
+
ium -8.38872
|
608 |
+
▁design -8.39437
|
609 |
+
▁Man -8.3989
|
610 |
+
▁language -8.4024
|
611 |
+
▁would -8.40651
|
612 |
+
▁National -8.40663
|
613 |
+
mmuni -8.41256
|
614 |
+
log -8.41337
|
615 |
+
▁serve -8.4141
|
616 |
+
▁current -8.42735
|
617 |
+
▁country -8.43238
|
618 |
+
▁provide -8.44008
|
619 |
+
▁place -8.4419
|
620 |
+
vision -8.44221
|
621 |
+
ology -8.4486
|
622 |
+
▁German -8.44866
|
623 |
+
▁She -8.44989
|
624 |
+
▁electro -8.45295
|
625 |
+
▁live -8.45679
|
626 |
+
Y -8.45722
|
627 |
+
▁disc -8.45957
|
628 |
+
▁popular -8.46161
|
629 |
+
▁will -8.46457
|
630 |
+
▁death -8.46631
|
631 |
+
▁English -8.4881
|
632 |
+
▁same -8.48844
|
633 |
+
▁great -8.49289
|
634 |
+
▁based -8.49458
|
635 |
+
▁won -8.49533
|
636 |
+
tract -8.49707
|
637 |
+
▁2012 -8.50162
|
638 |
+
▁(19 -8.50623
|
639 |
+
▁sign -8.50888
|
640 |
+
▁role -8.50985
|
641 |
+
▁British -8.51073
|
642 |
+
▁10 -8.51193
|
643 |
+
▁program -8.51531
|
644 |
+
▁region -8.52019
|
645 |
+
▁unti -8.52285
|
646 |
+
W -8.53129
|
647 |
+
hose -8.53731
|
648 |
+
▁Africa -8.53858
|
649 |
+
▁take -8.54016
|
650 |
+
view -8.5449
|
651 |
+
ified -8.55788
|
652 |
+
struct -8.55972
|
653 |
+
spi -8.56224
|
654 |
+
▁occur -8.57207
|
655 |
+
▁considered -8.57694
|
656 |
+
▁period -8.57696
|
657 |
+
▁book -8.57841
|
658 |
+
▁slave -8.58197
|
659 |
+
▁short -8.58758
|
660 |
+
writ -8.59109
|
661 |
+
time -8.59155
|
662 |
+
▁television -8.59172
|
663 |
+
▁energy -8.5967
|
664 |
+
▁contain -8.59676
|
665 |
+
▁now -8.59796
|
666 |
+
▁require -8.60172
|
667 |
+
▁health -8.60182
|
668 |
+
▁body -8.60206
|
669 |
+
▁start -8.60416
|
670 |
+
▁began -8.60709
|
671 |
+
▁near -8.61413
|
672 |
+
▁count -8.61699
|
673 |
+
▁official -8.62195
|
674 |
+
▁home -8.62675
|
675 |
+
▁level -8.62709
|
676 |
+
▁Act -8.62953
|
677 |
+
▁economic -8.63223
|
678 |
+
▁political -8.63223
|
679 |
+
▁example -8.63224
|
680 |
+
▁After -8.63239
|
681 |
+
▁2009 -8.63243
|
682 |
+
▁become -8.63249
|
683 |
+
▁data -8.6328
|
684 |
+
▁support -8.63742
|
685 |
+
▁Europe -8.63864
|
686 |
+
▁because -8.64262
|
687 |
+
▁effect -8.64262
|
688 |
+
▁standard -8.64264
|
689 |
+
▁south -8.64309
|
690 |
+
▁European -8.65189
|
691 |
+
▁class -8.6532
|
692 |
+
▁various -8.65841
|
693 |
+
▁York -8.65841
|
694 |
+
▁company -8.65841
|
695 |
+
▁modern -8.65842
|
696 |
+
▁total -8.65873
|
697 |
+
▁back -8.66028
|
698 |
+
ization -8.66893
|
699 |
+
▁tax -8.66965
|
700 |
+
▁among -8.67466
|
701 |
+
▁continu -8.67987
|
702 |
+
▁remain -8.67997
|
703 |
+
▁Union -8.67998
|
704 |
+
▁Earth -8.68
|
705 |
+
▁market -8.6853
|
706 |
+
▁multi -8.69089
|
707 |
+
K -8.69409
|
708 |
+
é -8.69626
|
709 |
+
▁third -8.69627
|
710 |
+
▁control -8.6963
|
711 |
+
▁north -8.69726
|
712 |
+
▁computer -8.70178
|
713 |
+
mission -8.70196
|
714 |
+
▁Republic -8.70734
|
715 |
+
▁military -8.71292
|
716 |
+
▁version -8.7186
|
717 |
+
▁six -8.71863
|
718 |
+
ological -8.71869
|
719 |
+
spect -8.72371
|
720 |
+
▁However -8.72419
|
721 |
+
▁individual -8.72419
|
722 |
+
▁device -8.72421
|
723 |
+
▁Japan -8.72421
|
724 |
+
▁federal -8.72422
|
725 |
+
▁like -8.72453
|
726 |
+
▁word -8.73044
|
727 |
+
▁make -8.73128
|
728 |
+
▁allow -8.73458
|
729 |
+
▁located -8.73561
|
730 |
+
Z -8.74133
|
731 |
+
▁Great -8.74153
|
732 |
+
▁open -8.74226
|
733 |
+
▁Roman -8.74916
|
734 |
+
▁office -8.74921
|
735 |
+
▁Canada -8.75293
|
736 |
+
▁East -8.75446
|
737 |
+
▁though -8.75472
|
738 |
+
▁100 -8.75545
|
739 |
+
ootball -8.75878
|
740 |
+
▁2008 -8.76485
|
741 |
+
rmal -8.76922
|
742 |
+
▁establish -8.77653
|
743 |
+
▁addition -8.78253
|
744 |
+
field -8.78262
|
745 |
+
▁estimate -8.78858
|
746 |
+
▁species -8.7946
|
747 |
+
▁civil -8.79464
|
748 |
+
▁video -8.79465
|
749 |
+
▁issue -8.80662
|
750 |
+
▁January -8.80683
|
751 |
+
▁against -8.80684
|
752 |
+
ograph -8.80684
|
753 |
+
▁along -8.80688
|
754 |
+
▁title -8.80721
|
755 |
+
▁special -8.81301
|
756 |
+
▁engine -8.81301
|
757 |
+
▁colon -8.81368
|
758 |
+
▁specific -8.81922
|
759 |
+
▁tradition -8.82547
|
760 |
+
▁international -8.82547
|
761 |
+
▁qua -8.83622
|
762 |
+
▁April -8.83809
|
763 |
+
▁Some -8.83892
|
764 |
+
▁school -8.84446
|
765 |
+
▁measure -8.84447
|
766 |
+
▁free -8.84828
|
767 |
+
▁League -8.85087
|
768 |
+
▁family -8.85087
|
769 |
+
▁worldwide -8.85087
|
770 |
+
▁element -8.85097
|
771 |
+
▁although -8.85732
|
772 |
+
▁House -8.85756
|
773 |
+
▁food -8.86383
|
774 |
+
▁particular -8.87035
|
775 |
+
▁Kingdom -8.87035
|
776 |
+
▁Congress -8.87035
|
777 |
+
▁social -8.87701
|
778 |
+
▁July -8.8772
|
779 |
+
& -8.88355
|
780 |
+
▁California -8.88355
|
781 |
+
▁June -8.88382
|
782 |
+
▁range -8.88441
|
783 |
+
cycl -8.88772
|
784 |
+
▁sometime -8.89091
|
785 |
+
uff -8.89115
|
786 |
+
▁consist -8.89121
|
787 |
+
▁held -8.8913
|
788 |
+
▁describe -8.91049
|
789 |
+
▁written -8.91052
|
790 |
+
▁source -8.91054
|
791 |
+
▁space -8.91088
|
792 |
+
▁origin -8.91407
|
793 |
+
▁network -8.91734
|
794 |
+
▁author -8.91735
|
795 |
+
ability -8.91736
|
796 |
+
▁function -8.91737
|
797 |
+
▁treat -8.91873
|
798 |
+
▁India -8.92403
|
799 |
+
▁November -8.92423
|
800 |
+
▁increase -8.92423
|
801 |
+
▁artist -8.92428
|
802 |
+
▁2007 -8.92446
|
803 |
+
▁culture -8.93126
|
804 |
+
▁Super -8.93138
|
805 |
+
▁Christian -8.93817
|
806 |
+
▁super -8.94533
|
807 |
+
▁associat -8.95231
|
808 |
+
▁blood -8.95945
|
809 |
+
town -8.96151
|
810 |
+
▁natural -8.97389
|
811 |
+
▁France -8.97399
|
812 |
+
dependent -8.98119
|
813 |
+
▁vitamin -8.98119
|
814 |
+
▁animal -8.9814
|
815 |
+
▁model -8.98146
|
816 |
+
▁rock -8.98175
|
817 |
+
▁Australia -8.98854
|
818 |
+
▁September -8.98854
|
819 |
+
▁business -8.98854
|
820 |
+
▁significant -8.99595
|
821 |
+
▁University -9.00341
|
822 |
+
▁organization -9.00341
|
823 |
+
▁education -9.00342
|
824 |
+
▁throughout -9.00344
|
825 |
+
▁compet -9.00347
|
826 |
+
ification -9.011
|
827 |
+
▁story -9.01217
|
828 |
+
▁International -9.0185
|
829 |
+
▁important -9.0185
|
830 |
+
▁research -9.01851
|
831 |
+
▁2006 -9.01876
|
832 |
+
▁career -9.01964
|
833 |
+
▁October -9.03383
|
834 |
+
▁August -9.03384
|
835 |
+
▁women -9.03391
|
836 |
+
▁Although -9.04158
|
837 |
+
▁initial -9.04197
|
838 |
+
▁full -9.04731
|
839 |
+
▁billion -9.04943
|
840 |
+
▁novel -9.04949
|
841 |
+
▁limit -9.0573
|
842 |
+
▁Washington -9.0652
|
843 |
+
▁Bowl -9.06552
|
844 |
+
▁global -9.07321
|
845 |
+
▁widely -9.07326
|
846 |
+
▁another -9.07342
|
847 |
+
▁England -9.08127
|
848 |
+
▁disease -9.08128
|
849 |
+
▁With -9.08167
|
850 |
+
▁media -9.0849
|
851 |
+
▁surface -9.0894
|
852 |
+
▁oppos -9.08941
|
853 |
+
▁Qu -9.09002
|
854 |
+
▁collect -9.09766
|
855 |
+
▁Since -9.09805
|
856 |
+
▁help -9.10654
|
857 |
+
▁release -9.11081
|
858 |
+
▁close -9.11479
|
859 |
+
rough -9.1175
|
860 |
+
▁similar -9.1226
|
861 |
+
▁French -9.1226
|
862 |
+
▁white -9.12262
|
863 |
+
▁election -9.12265
|
864 |
+
▁information -9.12268
|
865 |
+
▁employ -9.13107
|
866 |
+
▁influence -9.13107
|
867 |
+
▁capital -9.13107
|
868 |
+
▁regard -9.13122
|
869 |
+
▁children -9.13962
|
870 |
+
▁episode -9.13962
|
871 |
+
▁Greek -9.13962
|
872 |
+
▁return -9.13964
|
873 |
+
▁1990 -9.13968
|
874 |
+
▁What -9.13984
|
875 |
+
▁making -9.1399
|
876 |
+
▁given -9.13997
|
877 |
+
J -9.1477
|
878 |
+
▁February -9.14824
|
879 |
+
▁amount -9.14824
|
880 |
+
▁psych -9.14827
|
881 |
+
▁application -9.15694
|
882 |
+
▁replac -9.15695
|
883 |
+
▁value -9.15699
|
884 |
+
▁every -9.15723
|
885 |
+
produc -9.15995
|
886 |
+
▁December -9.16571
|
887 |
+
▁typically -9.16571
|
888 |
+
▁movement -9.16573
|
889 |
+
▁left -9.16578
|
890 |
+
▁however -9.1658
|
891 |
+
▁previous -9.17456
|
892 |
+
▁claim -9.17462
|
893 |
+
▁Windows -9.18349
|
894 |
+
▁observ -9.18349
|
895 |
+
▁material -9.18349
|
896 |
+
▁object -9.19249
|
897 |
+
▁professional -9.19249
|
898 |
+
wood -9.19263
|
899 |
+
▁local -9.19306
|
900 |
+
▁trade -9.1939
|
901 |
+
▁Internet -9.20159
|
902 |
+
ought -9.20434
|
903 |
+
▁especial -9.21076
|
904 |
+
▁Western -9.21076
|
905 |
+
▁either -9.21083
|
906 |
+
pproximate -9.22002
|
907 |
+
▁County -9.22002
|
908 |
+
▁primary -9.22936
|
909 |
+
▁property -9.22936
|
910 |
+
▁account -9.22937
|
911 |
+
▁separate -9.22938
|
912 |
+
▁factor -9.22948
|
913 |
+
▁down -9.22964
|
914 |
+
▁commercial -9.2388
|
915 |
+
▁structure -9.24835
|
916 |
+
▁economy -9.26765
|
917 |
+
▁pressure -9.26765
|
918 |
+
▁attack -9.26776
|
919 |
+
▁condition -9.26778
|
920 |
+
▁decade -9.26783
|
921 |
+
▁week -9.26791
|
922 |
+
▁Confederate -9.27745
|
923 |
+
▁complete -9.27745
|
924 |
+
▁Spanish -9.28735
|
925 |
+
▁across -9.28736
|
926 |
+
▁growth -9.28736
|
927 |
+
▁central -9.28738
|
928 |
+
▁available -9.29735
|
929 |
+
▁certain -9.29735
|
930 |
+
▁2013 -9.29736
|
931 |
+
▁You -9.29745
|
932 |
+
▁Whil -9.30017
|
933 |
+
▁primari -9.30745
|
934 |
+
▁contribut -9.31766
|
935 |
+
▁Party -9.31768
|
936 |
+
▁drug -9.31777
|
937 |
+
▁Democrat -9.32797
|
938 |
+
▁campaign -9.32797
|
939 |
+
▁subsequent -9.32797
|
940 |
+
▁focus -9.32797
|
941 |
+
▁elected -9.32798
|
942 |
+
craft -9.32802
|
943 |
+
NFL -9.32802
|
944 |
+
▁environment -9.33838
|
945 |
+
▁chemical -9.33839
|
946 |
+
▁entire -9.33845
|
947 |
+
▁radio -9.34074
|
948 |
+
▁William -9.34891
|
949 |
+
▁complex -9.34891
|
950 |
+
▁financial -9.35955
|
951 |
+
▁George -9.35955
|
952 |
+
▁league -9.35955
|
953 |
+
▁policy -9.35956
|
954 |
+
▁project -9.35956
|
955 |
+
▁compos -9.35958
|
956 |
+
▁litera -9.36277
|
957 |
+
▁physical -9.3703
|
958 |
+
▁historical -9.3703
|
959 |
+
▁hydro -9.37031
|
960 |
+
▁defeat -9.37041
|
961 |
+
▁regulat -9.37057
|
962 |
+
▁According -9.38117
|
963 |
+
▁method -9.38117
|
964 |
+
▁generat -9.38195
|
965 |
+
known -9.39007
|
966 |
+
▁celebrat -9.39216
|
967 |
+
▁built -9.39216
|
968 |
+
▁practice -9.40327
|
969 |
+
▁purpose -9.41451
|
970 |
+
▁credit -9.41452
|
971 |
+
▁affect -9.42587
|
972 |
+
▁degree -9.4259
|
973 |
+
▁beginning -9.43736
|
974 |
+
▁symbol -9.43736
|
975 |
+
▁science -9.43738
|
976 |
+
▁Central -9.449
|
977 |
+
▁industry -9.46076
|
978 |
+
▁private -9.46076
|
979 |
+
▁subject -9.46076
|
980 |
+
▁western -9.46076
|
981 |
+
▁district -9.47266
|
982 |
+
▁community -9.47266
|
983 |
+
▁problem -9.47266
|
984 |
+
▁determine -9.47268
|
985 |
+
▁Constitution -9.48471
|
986 |
+
▁Texas -9.48471
|
987 |
+
▁distinct -9.48476
|
988 |
+
▁except -9.48476
|
989 |
+
▁Association -9.4969
|
990 |
+
▁institution -9.4969
|
991 |
+
▁nuclear -9.4969
|
992 |
+
▁technology -9.4969
|
993 |
+
▁Empire -9.49691
|
994 |
+
▁regular -9.49691
|
995 |
+
▁concept -9.49694
|
996 |
+
▁Mexico -9.50925
|
997 |
+
▁announced -9.50925
|
998 |
+
Q -9.69917
|
999 |
+
q -9.90537
|
1000 |
+
( -9.98015
|
sentencepiece_tokenizer.py
ADDED
@@ -0,0 +1,82 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
from transformers import PreTrainedTokenizer
|
2 |
+
import sentencepiece as spm
|
3 |
+
import os
|
4 |
+
from logging import getLogger
|
5 |
+
from typing import List
|
6 |
+
|
7 |
+
logger = getLogger()
|
8 |
+
|
9 |
+
class SPTokenizer(PreTrainedTokenizer):
|
10 |
+
"""Tokenizing and encoding/decoding text using SentencePiece."""
|
11 |
+
|
12 |
+
def __init__(self, model_path: str, vocab_file: str, **kwargs):
|
13 |
+
# Add 'vocab_file' to kwargs if it's not present
|
14 |
+
if 'vocab_file' not in kwargs:
|
15 |
+
kwargs['vocab_file'] = vocab_file
|
16 |
+
|
17 |
+
super().__init__(**kwargs)
|
18 |
+
|
19 |
+
# Store initialization arguments
|
20 |
+
self.init_kwargs = {"model_path": model_path, "vocab_file": vocab_file, **kwargs}
|
21 |
+
|
22 |
+
# Reload tokenizer
|
23 |
+
assert os.path.isfile(model_path), model_path
|
24 |
+
self.sp_model = spm.SentencePieceProcessor(model_file=model_path)
|
25 |
+
logger.info(f"Reloaded SentencePiece model from {model_path}")
|
26 |
+
|
27 |
+
# BOS / EOS token IDs
|
28 |
+
self.n_words: int = self.sp_model.vocab_size()
|
29 |
+
self.bos_id: int = self.sp_model.bos_id()
|
30 |
+
self.eos_id: int = self.sp_model.eos_id()
|
31 |
+
self.pad_id: int = self.sp_model.pad_id()
|
32 |
+
logger.info(
|
33 |
+
f"#words: {self.n_words} - BOS ID: {self.bos_id} - EOS ID: {self.eos_id}"
|
34 |
+
)
|
35 |
+
assert self.sp_model.vocab_size() == self.sp_model.get_piece_size()
|
36 |
+
|
37 |
+
def encode(self, s: str, bos: bool, eos: bool) -> List[int]:
|
38 |
+
t = self.sp_model.encode(s)
|
39 |
+
if bos:
|
40 |
+
t = [self.bos_id] + t
|
41 |
+
if eos:
|
42 |
+
t = t + [self.eos_id]
|
43 |
+
return t
|
44 |
+
|
45 |
+
def decode(self, t: List[int]) -> str:
|
46 |
+
return self.sp_model.decode(t)
|
47 |
+
@property
|
48 |
+
def vocab_size(self):
|
49 |
+
"""Size of the base vocabulary (without the added tokens)."""
|
50 |
+
return self.n_words
|
51 |
+
|
52 |
+
def save_pretrained(self, save_directory: str, max_shard_size=None, safe_serialization=None):
|
53 |
+
# Save the SentencePiece model file
|
54 |
+
super().save_pretrained(save_directory, max_shard_size=None, safe_serialization=None)
|
55 |
+
|
56 |
+
|
57 |
+
# Save the vocabulary to a file
|
58 |
+
self.save_vocabulary(save_directory, filename_prefix="vocab")
|
59 |
+
|
60 |
+
@classmethod
|
61 |
+
def from_pretrained(cls, pretrained_model_name_or_path: str, **kwargs):
|
62 |
+
# Load the SentencePiece model file
|
63 |
+
model_file = os.path.join(pretrained_model_name_or_path, "spmodel_wikiqa.model")
|
64 |
+
|
65 |
+
# Load the vocabulary file path
|
66 |
+
vocab_file = os.path.join(pretrained_model_name_or_path, "spmodel_wikiqa.vocab")
|
67 |
+
|
68 |
+
return cls(model_path=model_file, vocab_file=vocab_file, **kwargs)
|
69 |
+
#return super().from_pretrained(cls, pretrained_model_name_or_path, **kwargs)
|
70 |
+
|
71 |
+
def get_vocab(self):
|
72 |
+
# Read vocabulary from the file
|
73 |
+
with open(self.init_kwargs["vocab_file"], "r", encoding="utf-8") as f:
|
74 |
+
vocab = {word.strip(): i for i, word in enumerate(f)}
|
75 |
+
return vocab
|
76 |
+
|
77 |
+
def save_vocabulary(self, save_directory, filename_prefix):
|
78 |
+
vocab_file = os.path.join(save_directory, f"{filename_prefix}.txt")
|
79 |
+
with open(vocab_file, "w", encoding="utf-8") as f:
|
80 |
+
for word, index in sorted(self.get_vocab().items(), key=lambda x: x[1]):
|
81 |
+
f.write(f"{word}\n")
|
82 |
+
return (vocab_file,)
|
special_tokens_map.json
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
{}
|
tokenizer_config.json
ADDED
@@ -0,0 +1,14 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {},
|
3 |
+
"auto_map": {
|
4 |
+
"AutoTokenizer": [
|
5 |
+
"sentencepiece_tokenizer.Tokenizer",
|
6 |
+
null
|
7 |
+
]
|
8 |
+
},
|
9 |
+
"clean_up_tokenization_spaces": true,
|
10 |
+
"model_max_length": 1000000000000000019884624838656,
|
11 |
+
"model_path": "./spmodel_wikiqa.model",
|
12 |
+
"tokenizer_class": "Tokenizer",
|
13 |
+
"vocab_file": "./spmodel_wikiqa.vocab"
|
14 |
+
}
|
vocab.txt
ADDED
@@ -0,0 +1,1000 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
<pad> 0
|
2 |
+
<unk> 0
|
3 |
+
<s> 0
|
4 |
+
</s> 0
|
5 |
+
s -2.98325
|
6 |
+
▁ -3.33613
|
7 |
+
▁the -3.53659
|
8 |
+
, -3.96136
|
9 |
+
▁of -4.11741
|
10 |
+
e -4.13254
|
11 |
+
. -4.1679
|
12 |
+
▁a -4.32755
|
13 |
+
▁and -4.33125
|
14 |
+
▁in -4.37771
|
15 |
+
ed -4.40148
|
16 |
+
d -4.43306
|
17 |
+
t -4.4655
|
18 |
+
y -4.53252
|
19 |
+
ing -4.61545
|
20 |
+
er -4.6614
|
21 |
+
a -4.69442
|
22 |
+
l -4.74331
|
23 |
+
▁to -4.74857
|
24 |
+
n -4.76571
|
25 |
+
o -4.80687
|
26 |
+
▁, -4.92362
|
27 |
+
▁is -4.93935
|
28 |
+
r -4.97962
|
29 |
+
al -4.99362
|
30 |
+
in -5.09839
|
31 |
+
ar -5.10752
|
32 |
+
p -5.16879
|
33 |
+
f -5.17396
|
34 |
+
or -5.20309
|
35 |
+
c -5.21379
|
36 |
+
g -5.21537
|
37 |
+
▁The -5.26093
|
38 |
+
re -5.33666
|
39 |
+
- -5.37802
|
40 |
+
b -5.39736
|
41 |
+
ly -5.41386
|
42 |
+
▁. -5.4411
|
43 |
+
en -5.45186
|
44 |
+
i -5.47261
|
45 |
+
▁( -5.50639
|
46 |
+
▁f -5.51352
|
47 |
+
an -5.54095
|
48 |
+
▁as -5.54212
|
49 |
+
ur -5.55306
|
50 |
+
▁S -5.57071
|
51 |
+
▁re -5.58107
|
52 |
+
es -5.58272
|
53 |
+
▁for -5.62901
|
54 |
+
ic -5.63297
|
55 |
+
m -5.64497
|
56 |
+
u -5.65596
|
57 |
+
▁A -5.65812
|
58 |
+
le -5.66668
|
59 |
+
it -5.68914
|
60 |
+
▁by -5.70114
|
61 |
+
▁was -5.75532
|
62 |
+
on -5.79453
|
63 |
+
ri -5.79803
|
64 |
+
▁B -5.80188
|
65 |
+
st -5.81431
|
66 |
+
' -5.82833
|
67 |
+
▁with -5.83968
|
68 |
+
th -5.84353
|
69 |
+
▁on -5.87698
|
70 |
+
h -5.88915
|
71 |
+
▁P -5.89336
|
72 |
+
w -5.89774
|
73 |
+
▁or -5.91013
|
74 |
+
ra -5.92151
|
75 |
+
ation -5.92539
|
76 |
+
▁be -5.9376
|
77 |
+
il -5.98519
|
78 |
+
ent -5.9883
|
79 |
+
▁an -5.99257
|
80 |
+
▁19 -6.01172
|
81 |
+
ion -6.01493
|
82 |
+
at -6.02207
|
83 |
+
▁" -6.02294
|
84 |
+
▁c -6.02546
|
85 |
+
ch -6.02773
|
86 |
+
) -6.03923
|
87 |
+
k -6.04155
|
88 |
+
▁co -6.04329
|
89 |
+
▁are -6.05606
|
90 |
+
ro -6.0652
|
91 |
+
▁C -6.07878
|
92 |
+
▁p -6.11511
|
93 |
+
v -6.1246
|
94 |
+
us -6.13632
|
95 |
+
▁de -6.14746
|
96 |
+
▁st -6.15681
|
97 |
+
▁that -6.16069
|
98 |
+
1 -6.16222
|
99 |
+
se -6.17232
|
100 |
+
ce -6.18052
|
101 |
+
ir -6.18303
|
102 |
+
▁from -6.18936
|
103 |
+
5 -6.19203
|
104 |
+
is -6.22921
|
105 |
+
" -6.23156
|
106 |
+
▁D -6.25522
|
107 |
+
el -6.25566
|
108 |
+
ne -6.27447
|
109 |
+
te -6.28033
|
110 |
+
ad -6.29411
|
111 |
+
▁G -6.29495
|
112 |
+
ment -6.29817
|
113 |
+
am -6.29912
|
114 |
+
▁F -6.29947
|
115 |
+
x -6.30442
|
116 |
+
▁T -6.32441
|
117 |
+
li -6.32652
|
118 |
+
▁m -6.33549
|
119 |
+
ol -6.34257
|
120 |
+
ive -6.35499
|
121 |
+
9 -6.3607
|
122 |
+
un -6.38235
|
123 |
+
▁con -6.38422
|
124 |
+
id -6.3859
|
125 |
+
ate -6.38848
|
126 |
+
est -6.3947
|
127 |
+
▁In -6.39701
|
128 |
+
ul -6.40068
|
129 |
+
ut -6.41284
|
130 |
+
0 -6.41971
|
131 |
+
▁t -6.42085
|
132 |
+
▁H -6.43357
|
133 |
+
et -6.44432
|
134 |
+
2 -6.44628
|
135 |
+
as -6.44759
|
136 |
+
▁se -6.4536
|
137 |
+
6 -6.45453
|
138 |
+
▁b -6.46467
|
139 |
+
7 -6.46587
|
140 |
+
la -6.4908
|
141 |
+
8 -6.49474
|
142 |
+
ist -6.49804
|
143 |
+
▁ex -6.50137
|
144 |
+
▁g -6.50505
|
145 |
+
S -6.50922
|
146 |
+
▁h -6.51419
|
147 |
+
4 -6.52466
|
148 |
+
▁which -6.54796
|
149 |
+
▁at -6.58108
|
150 |
+
▁W -6.5819
|
151 |
+
3 -6.58465
|
152 |
+
im -6.5961
|
153 |
+
om -6.59781
|
154 |
+
A -6.60127
|
155 |
+
age -6.60365
|
156 |
+
ies -6.60467
|
157 |
+
▁w -6.62078
|
158 |
+
ver -6.62924
|
159 |
+
▁N -6.63071
|
160 |
+
ers -6.63181
|
161 |
+
▁E -6.63282
|
162 |
+
C -6.63669
|
163 |
+
ve -6.63671
|
164 |
+
▁e -6.65324
|
165 |
+
▁has -6.66208
|
166 |
+
▁it -6.67689
|
167 |
+
ter -6.68174
|
168 |
+
ity -6.68823
|
169 |
+
mp -6.70881
|
170 |
+
▁his -6.72489
|
171 |
+
▁d -6.73116
|
172 |
+
um -6.7349
|
173 |
+
ge -6.73673
|
174 |
+
▁M -6.74175
|
175 |
+
me -6.74328
|
176 |
+
▁r -6.74662
|
177 |
+
▁1 -6.75046
|
178 |
+
qu -6.75189
|
179 |
+
▁I -6.75752
|
180 |
+
▁United -6.76143
|
181 |
+
nd -6.76592
|
182 |
+
lo -6.76616
|
183 |
+
▁ch -6.77466
|
184 |
+
▁also -6.7776
|
185 |
+
▁J -6.79458
|
186 |
+
▁po -6.80132
|
187 |
+
), -6.80651
|
188 |
+
▁It -6.81648
|
189 |
+
▁pro -6.81762
|
190 |
+
and -6.81885
|
191 |
+
▁he -6.8234
|
192 |
+
▁have -6.83154
|
193 |
+
z -6.8364
|
194 |
+
▁O -6.84215
|
195 |
+
ill -6.84536
|
196 |
+
ant -6.84949
|
197 |
+
▁R -6.85995
|
198 |
+
▁what -6.88048
|
199 |
+
ated -6.88381
|
200 |
+
▁States -6.88593
|
201 |
+
ine -6.89957
|
202 |
+
▁di -6.90808
|
203 |
+
ight -6.90919
|
204 |
+
ance -6.91298
|
205 |
+
ph -6.9194
|
206 |
+
▁other -6.92562
|
207 |
+
; -6.93669
|
208 |
+
co -6.94291
|
209 |
+
▁U -6.94648
|
210 |
+
tic -6.95711
|
211 |
+
ide -6.96324
|
212 |
+
ta -6.96777
|
213 |
+
▁its -6.9678
|
214 |
+
ect -6.97397
|
215 |
+
ud -6.97493
|
216 |
+
iv -6.98038
|
217 |
+
▁who -6.98122
|
218 |
+
▁mo -6.98793
|
219 |
+
I -6.99739
|
220 |
+
ot -7.01328
|
221 |
+
▁not -7.01789
|
222 |
+
▁most -7.02148
|
223 |
+
▁v -7.02259
|
224 |
+
ci -7.02331
|
225 |
+
▁were -7.03457
|
226 |
+
tion -7.04212
|
227 |
+
ow -7.04501
|
228 |
+
ry -7.04542
|
229 |
+
▁2 -7.05202
|
230 |
+
op -7.05275
|
231 |
+
▁first -7.0554
|
232 |
+
▁K -7.05685
|
233 |
+
all -7.0605
|
234 |
+
min -7.06175
|
235 |
+
▁can -7.06893
|
236 |
+
ia -7.07865
|
237 |
+
ac -7.08502
|
238 |
+
▁sp -7.09015
|
239 |
+
▁pa -7.09396
|
240 |
+
▁one -7.09743
|
241 |
+
). -7.10594
|
242 |
+
ther -7.11186
|
243 |
+
pe -7.1143
|
244 |
+
av -7.12624
|
245 |
+
mo -7.12761
|
246 |
+
▁Ch -7.13342
|
247 |
+
ical -7.13516
|
248 |
+
pp -7.13969
|
249 |
+
▁American -7.14112
|
250 |
+
▁un -7.14512
|
251 |
+
ian -7.14524
|
252 |
+
ig -7.14606
|
253 |
+
▁been -7.15507
|
254 |
+
ence -7.15667
|
255 |
+
▁used -7.15929
|
256 |
+
▁so -7.16047
|
257 |
+
ap -7.17222
|
258 |
+
▁St -7.17543
|
259 |
+
ven -7.18062
|
260 |
+
ke -7.18374
|
261 |
+
old -7.20342
|
262 |
+
▁ma -7.2115
|
263 |
+
▁form -7.21604
|
264 |
+
land -7.21658
|
265 |
+
▁ca -7.21738
|
266 |
+
▁state -7.21891
|
267 |
+
ck -7.22935
|
268 |
+
hi -7.23329
|
269 |
+
ted -7.24357
|
270 |
+
▁la -7.25031
|
271 |
+
▁such -7.2514
|
272 |
+
▁pre -7.25425
|
273 |
+
port -7.2548
|
274 |
+
ie -7.25505
|
275 |
+
D -7.25589
|
276 |
+
▁their -7.26005
|
277 |
+
▁part -7.26338
|
278 |
+
able -7.26411
|
279 |
+
▁Mo -7.2669
|
280 |
+
em -7.26987
|
281 |
+
T -7.27079
|
282 |
+
ma -7.27164
|
283 |
+
ub -7.27451
|
284 |
+
▁He -7.27531
|
285 |
+
ial -7.27582
|
286 |
+
ag -7.27696
|
287 |
+
ction -7.27945
|
288 |
+
P -7.29408
|
289 |
+
up -7.31156
|
290 |
+
▁V -7.31241
|
291 |
+
ard -7.31839
|
292 |
+
ous -7.32009
|
293 |
+
▁me -7.32062
|
294 |
+
ell -7.32153
|
295 |
+
: -7.32453
|
296 |
+
▁but -7.32773
|
297 |
+
he -7.33481
|
298 |
+
▁no -7.34059
|
299 |
+
▁over -7.34226
|
300 |
+
▁many -7.34398
|
301 |
+
ha -7.35318
|
302 |
+
mb -7.36081
|
303 |
+
bo -7.36412
|
304 |
+
if -7.36603
|
305 |
+
les -7.36806
|
306 |
+
ten -7.37112
|
307 |
+
▁into -7.3734
|
308 |
+
ally -7.37849
|
309 |
+
ust -7.37887
|
310 |
+
ish -7.37962
|
311 |
+
▁known -7.38086
|
312 |
+
▁two -7.38213
|
313 |
+
ary -7.38731
|
314 |
+
ang -7.39591
|
315 |
+
▁sh -7.39651
|
316 |
+
ho -7.40195
|
317 |
+
▁Ma -7.4021
|
318 |
+
▁all -7.40284
|
319 |
+
ti -7.40569
|
320 |
+
▁ho -7.40924
|
321 |
+
▁L -7.41168
|
322 |
+
ab -7.41502
|
323 |
+
com -7.42251
|
324 |
+
▁name -7.4232
|
325 |
+
▁3 -7.42434
|
326 |
+
uc -7.42528
|
327 |
+
ak -7.42852
|
328 |
+
to -7.43329
|
329 |
+
j -7.43401
|
330 |
+
day -7.44705
|
331 |
+
▁j -7.45545
|
332 |
+
B -7.45711
|
333 |
+
▁Re -7.4583
|
334 |
+
– -7.46056
|
335 |
+
▁use -7.46287
|
336 |
+
cent -7.46858
|
337 |
+
▁more -7.47239
|
338 |
+
▁18 -7.47506
|
339 |
+
mi -7.47913
|
340 |
+
▁Co -7.48482
|
341 |
+
ture -7.49362
|
342 |
+
po -7.50349
|
343 |
+
ca -7.50676
|
344 |
+
▁when -7.50816
|
345 |
+
▁ba -7.51262
|
346 |
+
E -7.51342
|
347 |
+
und -7.51527
|
348 |
+
▁br -7.51879
|
349 |
+
200 -7.52528
|
350 |
+
na -7.53136
|
351 |
+
ach -7.53575
|
352 |
+
▁act -7.53834
|
353 |
+
one -7.53944
|
354 |
+
▁time -7.54097
|
355 |
+
▁play -7.54584
|
356 |
+
ric -7.55652
|
357 |
+
M -7.55855
|
358 |
+
ue -7.55971
|
359 |
+
▁may -7.56174
|
360 |
+
ress -7.56233
|
361 |
+
tra -7.56266
|
362 |
+
▁include -7.56512
|
363 |
+
▁high -7.56513
|
364 |
+
▁car -7.5676
|
365 |
+
▁film -7.56876
|
366 |
+
ative -7.56917
|
367 |
+
▁La -7.57192
|
368 |
+
▁term -7.57839
|
369 |
+
no -7.58717
|
370 |
+
▁some -7.59031
|
371 |
+
lin -7.59239
|
372 |
+
▁New -7.59409
|
373 |
+
low -7.59432
|
374 |
+
▁do -7.595
|
375 |
+
▁after -7.59602
|
376 |
+
tro -7.59984
|
377 |
+
ru -7.60526
|
378 |
+
▁than -7.6062
|
379 |
+
▁bo -7.61657
|
380 |
+
ok -7.61903
|
381 |
+
▁number -7.62558
|
382 |
+
▁world -7.62936
|
383 |
+
ron -7.63126
|
384 |
+
ition -7.63362
|
385 |
+
ack -7.63495
|
386 |
+
ug -7.63745
|
387 |
+
vo -7.64372
|
388 |
+
▁per -7.64738
|
389 |
+
▁where -7.65822
|
390 |
+
▁lo -7.66202
|
391 |
+
man -7.66506
|
392 |
+
▁had -7.6653
|
393 |
+
▁Ro -7.66706
|
394 |
+
R -7.6693
|
395 |
+
N -7.67234
|
396 |
+
▁this -7.67473
|
397 |
+
▁De -7.68762
|
398 |
+
ank -7.69171
|
399 |
+
▁War -7.69455
|
400 |
+
▁inter -7.70337
|
401 |
+
▁Mar -7.70572
|
402 |
+
act -7.70587
|
403 |
+
▁k -7.71029
|
404 |
+
the -7.71248
|
405 |
+
▁gr -7.71417
|
406 |
+
mon -7.71636
|
407 |
+
▁her -7.72386
|
408 |
+
ual -7.72539
|
409 |
+
▁An -7.73173
|
410 |
+
▁only -7.7342
|
411 |
+
L -7.7428
|
412 |
+
▁system -7.74584
|
413 |
+
▁acc -7.75146
|
414 |
+
ship -7.75202
|
415 |
+
ton -7.75294
|
416 |
+
ities -7.75685
|
417 |
+
▁out -7.75767
|
418 |
+
▁Ar -7.76284
|
419 |
+
round -7.76685
|
420 |
+
▁This -7.76688
|
421 |
+
ism -7.76781
|
422 |
+
▁series -7.77408
|
423 |
+
▁refer -7.77481
|
424 |
+
io -7.77484
|
425 |
+
ice -7.77969
|
426 |
+
00 -7.78432
|
427 |
+
▁work -7.78498
|
428 |
+
ip -7.78704
|
429 |
+
ized -7.78924
|
430 |
+
▁million -7.79162
|
431 |
+
F -7.79665
|
432 |
+
cul -7.79869
|
433 |
+
over -7.79984
|
434 |
+
▁years -7.80147
|
435 |
+
▁war -7.80264
|
436 |
+
ep -7.80304
|
437 |
+
O -7.80382
|
438 |
+
▁Lo -7.8093
|
439 |
+
during -7.80962
|
440 |
+
▁4 -7.81569
|
441 |
+
▁how -7.82293
|
442 |
+
di -7.82509
|
443 |
+
▁common -7.83726
|
444 |
+
▁dis -7.8391
|
445 |
+
▁including -7.83956
|
446 |
+
▁game -7.84703
|
447 |
+
ick -7.85306
|
448 |
+
▁World -7.8537
|
449 |
+
▁under -7.8545
|
450 |
+
▁between -7.86084
|
451 |
+
ration -7.86217
|
452 |
+
ev -7.87153
|
453 |
+
▁well -7.87304
|
454 |
+
▁Ho -7.8788
|
455 |
+
way -7.87917
|
456 |
+
ize -7.88827
|
457 |
+
▁trans -7.89243
|
458 |
+
came -7.89553
|
459 |
+
present -7.8977
|
460 |
+
ga -7.90352
|
461 |
+
imp -7.90424
|
462 |
+
▁20 -7.91065
|
463 |
+
▁large -7.91385
|
464 |
+
▁new -7.92043
|
465 |
+
▁record -7.92244
|
466 |
+
▁four -7.9228
|
467 |
+
▁we -7.92322
|
468 |
+
▁major -7.93266
|
469 |
+
H -7.93297
|
470 |
+
▁often -7.93609
|
471 |
+
▁group -7.94299
|
472 |
+
uch -7.94534
|
473 |
+
▁up -7.94593
|
474 |
+
▁develop -7.94817
|
475 |
+
▁produce -7.95324
|
476 |
+
▁people -7.96394
|
477 |
+
ner -7.96649
|
478 |
+
% -7.97192
|
479 |
+
tter -7.97777
|
480 |
+
▁For -7.97864
|
481 |
+
▁plan -7.98045
|
482 |
+
▁Bo -7.98192
|
483 |
+
▁called -7.98275
|
484 |
+
bu -7.99349
|
485 |
+
▁about -7.99356
|
486 |
+
▁Me -7.99467
|
487 |
+
▁population -7.99625
|
488 |
+
con -7.99954
|
489 |
+
▁end -8.00591
|
490 |
+
▁second -8.01283
|
491 |
+
▁mi -8.01704
|
492 |
+
▁area -8.02148
|
493 |
+
▁show -8.02283
|
494 |
+
/ -8.02399
|
495 |
+
▁Con -8.0241
|
496 |
+
ttle -8.03169
|
497 |
+
▁since -8.03253
|
498 |
+
▁three -8.03533
|
499 |
+
▁To -8.03668
|
500 |
+
▁vi -8.03818
|
501 |
+
V -8.0431
|
502 |
+
ward -8.04836
|
503 |
+
▁season -8.05255
|
504 |
+
ib -8.05421
|
505 |
+
▁both -8.0575
|
506 |
+
▁America -8.06135
|
507 |
+
▁year -8.0631
|
508 |
+
? -8.07004
|
509 |
+
▁South -8.073
|
510 |
+
▁city -8.07512
|
511 |
+
▁through -8.07597
|
512 |
+
gu -8.07666
|
513 |
+
cri -8.07767
|
514 |
+
▁team -8.08249
|
515 |
+
▁product -8.08424
|
516 |
+
▁found -8.09697
|
517 |
+
▁main -8.10388
|
518 |
+
▁law -8.10683
|
519 |
+
▁sub -8.1072
|
520 |
+
▁Th -8.10747
|
521 |
+
va -8.11156
|
522 |
+
▁character -8.11215
|
523 |
+
▁follow -8.12453
|
524 |
+
▁government -8.12763
|
525 |
+
▁Mi -8.12877
|
526 |
+
▁North -8.13132
|
527 |
+
▁made -8.13142
|
528 |
+
▁man -8.13487
|
529 |
+
ign -8.13576
|
530 |
+
▁creat -8.14272
|
531 |
+
east -8.1504
|
532 |
+
▁human -8.15615
|
533 |
+
▁song -8.15634
|
534 |
+
ator -8.15765
|
535 |
+
▁Le -8.16108
|
536 |
+
▁lead -8.17645
|
537 |
+
▁different -8.17884
|
538 |
+
while -8.17924
|
539 |
+
direct -8.18304
|
540 |
+
,000 -8.18884
|
541 |
+
▁2010 -8.19207
|
542 |
+
▁long -8.19886
|
543 |
+
▁right -8.2005
|
544 |
+
▁John -8.2021
|
545 |
+
▁power -8.2024
|
546 |
+
▁does -8.20394
|
547 |
+
X -8.20547
|
548 |
+
▁several -8.2089
|
549 |
+
▁largest -8.21363
|
550 |
+
▁countries -8.21565
|
551 |
+
▁general -8.21566
|
552 |
+
▁life -8.21571
|
553 |
+
ible -8.22191
|
554 |
+
▁each -8.22319
|
555 |
+
G -8.2286
|
556 |
+
▁own -8.23473
|
557 |
+
▁US -8.23481
|
558 |
+
▁history -8.23978
|
559 |
+
▁On -8.24717
|
560 |
+
▁17 -8.26111
|
561 |
+
▁person -8.26485
|
562 |
+
▁single -8.26853
|
563 |
+
▁mean -8.26999
|
564 |
+
form -8.27906
|
565 |
+
▁2011 -8.28257
|
566 |
+
▁member -8.2826
|
567 |
+
▁album -8.28988
|
568 |
+
▁national -8.28992
|
569 |
+
▁Com -8.29855
|
570 |
+
$ -8.30094
|
571 |
+
▁public -8.30466
|
572 |
+
▁bi -8.30766
|
573 |
+
▁leg -8.30841
|
574 |
+
▁result -8.30842
|
575 |
+
▁later -8.30898
|
576 |
+
▁Award -8.30927
|
577 |
+
▁President -8.31214
|
578 |
+
▁process -8.31217
|
579 |
+
▁usually -8.3159
|
580 |
+
▁water -8.3162
|
581 |
+
— -8.31967
|
582 |
+
▁century -8.31968
|
583 |
+
▁appear -8.31968
|
584 |
+
▁music -8.32404
|
585 |
+
▁success -8.32726
|
586 |
+
▁service -8.33108
|
587 |
+
▁type -8.33118
|
588 |
+
▁president -8.33491
|
589 |
+
▁perform -8.34315
|
590 |
+
60 -8.35939
|
591 |
+
▁Li -8.36016
|
592 |
+
ness -8.3606
|
593 |
+
▁list -8.36139
|
594 |
+
▁featur -8.36218
|
595 |
+
▁operat -8.36292
|
596 |
+
U -8.36662
|
597 |
+
born -8.36936
|
598 |
+
▁released -8.37568
|
599 |
+
▁original -8.37602
|
600 |
+
▁Col -8.37608
|
601 |
+
▁before -8.37806
|
602 |
+
▁small -8.37808
|
603 |
+
▁cause -8.38501
|
604 |
+
▁cell -8.38604
|
605 |
+
▁early -8.38633
|
606 |
+
▁event -8.38638
|
607 |
+
ium -8.38872
|
608 |
+
▁design -8.39437
|
609 |
+
▁Man -8.3989
|
610 |
+
▁language -8.4024
|
611 |
+
▁would -8.40651
|
612 |
+
▁National -8.40663
|
613 |
+
mmuni -8.41256
|
614 |
+
log -8.41337
|
615 |
+
▁serve -8.4141
|
616 |
+
▁current -8.42735
|
617 |
+
▁country -8.43238
|
618 |
+
▁provide -8.44008
|
619 |
+
▁place -8.4419
|
620 |
+
vision -8.44221
|
621 |
+
ology -8.4486
|
622 |
+
▁German -8.44866
|
623 |
+
▁She -8.44989
|
624 |
+
▁electro -8.45295
|
625 |
+
▁live -8.45679
|
626 |
+
Y -8.45722
|
627 |
+
▁disc -8.45957
|
628 |
+
▁popular -8.46161
|
629 |
+
▁will -8.46457
|
630 |
+
▁death -8.46631
|
631 |
+
▁English -8.4881
|
632 |
+
▁same -8.48844
|
633 |
+
▁great -8.49289
|
634 |
+
▁based -8.49458
|
635 |
+
▁won -8.49533
|
636 |
+
tract -8.49707
|
637 |
+
▁2012 -8.50162
|
638 |
+
▁(19 -8.50623
|
639 |
+
▁sign -8.50888
|
640 |
+
▁role -8.50985
|
641 |
+
▁British -8.51073
|
642 |
+
▁10 -8.51193
|
643 |
+
▁program -8.51531
|
644 |
+
▁region -8.52019
|
645 |
+
▁unti -8.52285
|
646 |
+
W -8.53129
|
647 |
+
hose -8.53731
|
648 |
+
▁Africa -8.53858
|
649 |
+
▁take -8.54016
|
650 |
+
view -8.5449
|
651 |
+
ified -8.55788
|
652 |
+
struct -8.55972
|
653 |
+
spi -8.56224
|
654 |
+
▁occur -8.57207
|
655 |
+
▁considered -8.57694
|
656 |
+
▁period -8.57696
|
657 |
+
▁book -8.57841
|
658 |
+
▁slave -8.58197
|
659 |
+
▁short -8.58758
|
660 |
+
writ -8.59109
|
661 |
+
time -8.59155
|
662 |
+
▁television -8.59172
|
663 |
+
▁energy -8.5967
|
664 |
+
▁contain -8.59676
|
665 |
+
▁now -8.59796
|
666 |
+
▁require -8.60172
|
667 |
+
▁health -8.60182
|
668 |
+
▁body -8.60206
|
669 |
+
▁start -8.60416
|
670 |
+
▁began -8.60709
|
671 |
+
▁near -8.61413
|
672 |
+
▁count -8.61699
|
673 |
+
▁official -8.62195
|
674 |
+
▁home -8.62675
|
675 |
+
▁level -8.62709
|
676 |
+
▁Act -8.62953
|
677 |
+
▁economic -8.63223
|
678 |
+
▁political -8.63223
|
679 |
+
▁example -8.63224
|
680 |
+
▁After -8.63239
|
681 |
+
▁2009 -8.63243
|
682 |
+
▁become -8.63249
|
683 |
+
▁data -8.6328
|
684 |
+
▁support -8.63742
|
685 |
+
▁Europe -8.63864
|
686 |
+
▁because -8.64262
|
687 |
+
▁effect -8.64262
|
688 |
+
▁standard -8.64264
|
689 |
+
▁south -8.64309
|
690 |
+
▁European -8.65189
|
691 |
+
▁class -8.6532
|
692 |
+
▁various -8.65841
|
693 |
+
▁York -8.65841
|
694 |
+
▁company -8.65841
|
695 |
+
▁modern -8.65842
|
696 |
+
▁total -8.65873
|
697 |
+
▁back -8.66028
|
698 |
+
ization -8.66893
|
699 |
+
▁tax -8.66965
|
700 |
+
▁among -8.67466
|
701 |
+
▁continu -8.67987
|
702 |
+
▁remain -8.67997
|
703 |
+
▁Union -8.67998
|
704 |
+
▁Earth -8.68
|
705 |
+
▁market -8.6853
|
706 |
+
▁multi -8.69089
|
707 |
+
K -8.69409
|
708 |
+
é -8.69626
|
709 |
+
▁third -8.69627
|
710 |
+
▁control -8.6963
|
711 |
+
▁north -8.69726
|
712 |
+
▁computer -8.70178
|
713 |
+
mission -8.70196
|
714 |
+
▁Republic -8.70734
|
715 |
+
▁military -8.71292
|
716 |
+
▁version -8.7186
|
717 |
+
▁six -8.71863
|
718 |
+
ological -8.71869
|
719 |
+
spect -8.72371
|
720 |
+
▁However -8.72419
|
721 |
+
▁individual -8.72419
|
722 |
+
▁device -8.72421
|
723 |
+
▁Japan -8.72421
|
724 |
+
▁federal -8.72422
|
725 |
+
▁like -8.72453
|
726 |
+
▁word -8.73044
|
727 |
+
▁make -8.73128
|
728 |
+
▁allow -8.73458
|
729 |
+
▁located -8.73561
|
730 |
+
Z -8.74133
|
731 |
+
▁Great -8.74153
|
732 |
+
▁open -8.74226
|
733 |
+
▁Roman -8.74916
|
734 |
+
▁office -8.74921
|
735 |
+
▁Canada -8.75293
|
736 |
+
▁East -8.75446
|
737 |
+
▁though -8.75472
|
738 |
+
▁100 -8.75545
|
739 |
+
ootball -8.75878
|
740 |
+
▁2008 -8.76485
|
741 |
+
rmal -8.76922
|
742 |
+
▁establish -8.77653
|
743 |
+
▁addition -8.78253
|
744 |
+
field -8.78262
|
745 |
+
▁estimate -8.78858
|
746 |
+
▁species -8.7946
|
747 |
+
▁civil -8.79464
|
748 |
+
▁video -8.79465
|
749 |
+
▁issue -8.80662
|
750 |
+
▁January -8.80683
|
751 |
+
▁against -8.80684
|
752 |
+
ograph -8.80684
|
753 |
+
▁along -8.80688
|
754 |
+
▁title -8.80721
|
755 |
+
▁special -8.81301
|
756 |
+
▁engine -8.81301
|
757 |
+
▁colon -8.81368
|
758 |
+
▁specific -8.81922
|
759 |
+
▁tradition -8.82547
|
760 |
+
▁international -8.82547
|
761 |
+
▁qua -8.83622
|
762 |
+
▁April -8.83809
|
763 |
+
▁Some -8.83892
|
764 |
+
▁school -8.84446
|
765 |
+
▁measure -8.84447
|
766 |
+
▁free -8.84828
|
767 |
+
▁League -8.85087
|
768 |
+
▁family -8.85087
|
769 |
+
▁worldwide -8.85087
|
770 |
+
▁element -8.85097
|
771 |
+
▁although -8.85732
|
772 |
+
▁House -8.85756
|
773 |
+
▁food -8.86383
|
774 |
+
▁particular -8.87035
|
775 |
+
▁Kingdom -8.87035
|
776 |
+
▁Congress -8.87035
|
777 |
+
▁social -8.87701
|
778 |
+
▁July -8.8772
|
779 |
+
& -8.88355
|
780 |
+
▁California -8.88355
|
781 |
+
▁June -8.88382
|
782 |
+
▁range -8.88441
|
783 |
+
cycl -8.88772
|
784 |
+
▁sometime -8.89091
|
785 |
+
uff -8.89115
|
786 |
+
▁consist -8.89121
|
787 |
+
▁held -8.8913
|
788 |
+
▁describe -8.91049
|
789 |
+
▁written -8.91052
|
790 |
+
▁source -8.91054
|
791 |
+
▁space -8.91088
|
792 |
+
▁origin -8.91407
|
793 |
+
▁network -8.91734
|
794 |
+
▁author -8.91735
|
795 |
+
ability -8.91736
|
796 |
+
▁function -8.91737
|
797 |
+
▁treat -8.91873
|
798 |
+
▁India -8.92403
|
799 |
+
▁November -8.92423
|
800 |
+
▁increase -8.92423
|
801 |
+
▁artist -8.92428
|
802 |
+
▁2007 -8.92446
|
803 |
+
▁culture -8.93126
|
804 |
+
▁Super -8.93138
|
805 |
+
▁Christian -8.93817
|
806 |
+
▁super -8.94533
|
807 |
+
▁associat -8.95231
|
808 |
+
▁blood -8.95945
|
809 |
+
town -8.96151
|
810 |
+
▁natural -8.97389
|
811 |
+
▁France -8.97399
|
812 |
+
dependent -8.98119
|
813 |
+
▁vitamin -8.98119
|
814 |
+
▁animal -8.9814
|
815 |
+
▁model -8.98146
|
816 |
+
▁rock -8.98175
|
817 |
+
▁Australia -8.98854
|
818 |
+
▁September -8.98854
|
819 |
+
▁business -8.98854
|
820 |
+
▁significant -8.99595
|
821 |
+
▁University -9.00341
|
822 |
+
▁organization -9.00341
|
823 |
+
▁education -9.00342
|
824 |
+
▁throughout -9.00344
|
825 |
+
▁compet -9.00347
|
826 |
+
ification -9.011
|
827 |
+
▁story -9.01217
|
828 |
+
▁International -9.0185
|
829 |
+
▁important -9.0185
|
830 |
+
▁research -9.01851
|
831 |
+
▁2006 -9.01876
|
832 |
+
▁career -9.01964
|
833 |
+
▁October -9.03383
|
834 |
+
▁August -9.03384
|
835 |
+
▁women -9.03391
|
836 |
+
▁Although -9.04158
|
837 |
+
▁initial -9.04197
|
838 |
+
▁full -9.04731
|
839 |
+
▁billion -9.04943
|
840 |
+
▁novel -9.04949
|
841 |
+
▁limit -9.0573
|
842 |
+
▁Washington -9.0652
|
843 |
+
▁Bowl -9.06552
|
844 |
+
▁global -9.07321
|
845 |
+
▁widely -9.07326
|
846 |
+
▁another -9.07342
|
847 |
+
▁England -9.08127
|
848 |
+
▁disease -9.08128
|
849 |
+
▁With -9.08167
|
850 |
+
▁media -9.0849
|
851 |
+
▁surface -9.0894
|
852 |
+
▁oppos -9.08941
|
853 |
+
▁Qu -9.09002
|
854 |
+
▁collect -9.09766
|
855 |
+
▁Since -9.09805
|
856 |
+
▁help -9.10654
|
857 |
+
▁release -9.11081
|
858 |
+
▁close -9.11479
|
859 |
+
rough -9.1175
|
860 |
+
▁similar -9.1226
|
861 |
+
▁French -9.1226
|
862 |
+
▁white -9.12262
|
863 |
+
▁election -9.12265
|
864 |
+
▁information -9.12268
|
865 |
+
▁employ -9.13107
|
866 |
+
▁influence -9.13107
|
867 |
+
▁capital -9.13107
|
868 |
+
▁regard -9.13122
|
869 |
+
▁children -9.13962
|
870 |
+
▁episode -9.13962
|
871 |
+
▁Greek -9.13962
|
872 |
+
▁return -9.13964
|
873 |
+
▁1990 -9.13968
|
874 |
+
▁What -9.13984
|
875 |
+
▁making -9.1399
|
876 |
+
▁given -9.13997
|
877 |
+
J -9.1477
|
878 |
+
▁February -9.14824
|
879 |
+
▁amount -9.14824
|
880 |
+
▁psych -9.14827
|
881 |
+
▁application -9.15694
|
882 |
+
▁replac -9.15695
|
883 |
+
▁value -9.15699
|
884 |
+
▁every -9.15723
|
885 |
+
produc -9.15995
|
886 |
+
▁December -9.16571
|
887 |
+
▁typically -9.16571
|
888 |
+
▁movement -9.16573
|
889 |
+
▁left -9.16578
|
890 |
+
▁however -9.1658
|
891 |
+
▁previous -9.17456
|
892 |
+
▁claim -9.17462
|
893 |
+
▁Windows -9.18349
|
894 |
+
▁observ -9.18349
|
895 |
+
▁material -9.18349
|
896 |
+
▁object -9.19249
|
897 |
+
▁professional -9.19249
|
898 |
+
wood -9.19263
|
899 |
+
▁local -9.19306
|
900 |
+
▁trade -9.1939
|
901 |
+
▁Internet -9.20159
|
902 |
+
ought -9.20434
|
903 |
+
▁especial -9.21076
|
904 |
+
▁Western -9.21076
|
905 |
+
▁either -9.21083
|
906 |
+
pproximate -9.22002
|
907 |
+
▁County -9.22002
|
908 |
+
▁primary -9.22936
|
909 |
+
▁property -9.22936
|
910 |
+
▁account -9.22937
|
911 |
+
▁separate -9.22938
|
912 |
+
▁factor -9.22948
|
913 |
+
▁down -9.22964
|
914 |
+
▁commercial -9.2388
|
915 |
+
▁structure -9.24835
|
916 |
+
▁economy -9.26765
|
917 |
+
▁pressure -9.26765
|
918 |
+
▁attack -9.26776
|
919 |
+
▁condition -9.26778
|
920 |
+
▁decade -9.26783
|
921 |
+
▁week -9.26791
|
922 |
+
▁Confederate -9.27745
|
923 |
+
▁complete -9.27745
|
924 |
+
▁Spanish -9.28735
|
925 |
+
▁across -9.28736
|
926 |
+
▁growth -9.28736
|
927 |
+
▁central -9.28738
|
928 |
+
▁available -9.29735
|
929 |
+
▁certain -9.29735
|
930 |
+
▁2013 -9.29736
|
931 |
+
▁You -9.29745
|
932 |
+
▁Whil -9.30017
|
933 |
+
▁primari -9.30745
|
934 |
+
▁contribut -9.31766
|
935 |
+
▁Party -9.31768
|
936 |
+
▁drug -9.31777
|
937 |
+
▁Democrat -9.32797
|
938 |
+
▁campaign -9.32797
|
939 |
+
▁subsequent -9.32797
|
940 |
+
▁focus -9.32797
|
941 |
+
▁elected -9.32798
|
942 |
+
craft -9.32802
|
943 |
+
NFL -9.32802
|
944 |
+
▁environment -9.33838
|
945 |
+
▁chemical -9.33839
|
946 |
+
▁entire -9.33845
|
947 |
+
▁radio -9.34074
|
948 |
+
▁William -9.34891
|
949 |
+
▁complex -9.34891
|
950 |
+
▁financial -9.35955
|
951 |
+
▁George -9.35955
|
952 |
+
▁league -9.35955
|
953 |
+
▁policy -9.35956
|
954 |
+
▁project -9.35956
|
955 |
+
▁compos -9.35958
|
956 |
+
▁litera -9.36277
|
957 |
+
▁physical -9.3703
|
958 |
+
▁historical -9.3703
|
959 |
+
▁hydro -9.37031
|
960 |
+
▁defeat -9.37041
|
961 |
+
▁regulat -9.37057
|
962 |
+
▁According -9.38117
|
963 |
+
▁method -9.38117
|
964 |
+
▁generat -9.38195
|
965 |
+
known -9.39007
|
966 |
+
▁celebrat -9.39216
|
967 |
+
▁built -9.39216
|
968 |
+
▁practice -9.40327
|
969 |
+
▁purpose -9.41451
|
970 |
+
▁credit -9.41452
|
971 |
+
▁affect -9.42587
|
972 |
+
▁degree -9.4259
|
973 |
+
▁beginning -9.43736
|
974 |
+
▁symbol -9.43736
|
975 |
+
▁science -9.43738
|
976 |
+
▁Central -9.449
|
977 |
+
▁industry -9.46076
|
978 |
+
▁private -9.46076
|
979 |
+
▁subject -9.46076
|
980 |
+
▁western -9.46076
|
981 |
+
▁district -9.47266
|
982 |
+
▁community -9.47266
|
983 |
+
▁problem -9.47266
|
984 |
+
▁determine -9.47268
|
985 |
+
▁Constitution -9.48471
|
986 |
+
▁Texas -9.48471
|
987 |
+
▁distinct -9.48476
|
988 |
+
▁except -9.48476
|
989 |
+
▁Association -9.4969
|
990 |
+
▁institution -9.4969
|
991 |
+
▁nuclear -9.4969
|
992 |
+
▁technology -9.4969
|
993 |
+
▁Empire -9.49691
|
994 |
+
▁regular -9.49691
|
995 |
+
▁concept -9.49694
|
996 |
+
▁Mexico -9.50925
|
997 |
+
▁announced -9.50925
|
998 |
+
Q -9.69917
|
999 |
+
q -9.90537
|
1000 |
+
( -9.98015
|