amaanbadure commited on
Commit
3638108
1 Parent(s): a0c2c22

Upload tokenizer

Browse files
Files changed (5) hide show
  1. None.txt +1000 -0
  2. sentencepiece_tokenizer.py +82 -0
  3. special_tokens_map.json +1 -0
  4. tokenizer_config.json +14 -0
  5. vocab.txt +1000 -0
None.txt ADDED
@@ -0,0 +1,1000 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <pad> 0
2
+ <unk> 0
3
+ <s> 0
4
+ </s> 0
5
+ s -2.98325
6
+ ▁ -3.33613
7
+ ▁the -3.53659
8
+ , -3.96136
9
+ ▁of -4.11741
10
+ e -4.13254
11
+ . -4.1679
12
+ ▁a -4.32755
13
+ ▁and -4.33125
14
+ ▁in -4.37771
15
+ ed -4.40148
16
+ d -4.43306
17
+ t -4.4655
18
+ y -4.53252
19
+ ing -4.61545
20
+ er -4.6614
21
+ a -4.69442
22
+ l -4.74331
23
+ ▁to -4.74857
24
+ n -4.76571
25
+ o -4.80687
26
+ ▁, -4.92362
27
+ ▁is -4.93935
28
+ r -4.97962
29
+ al -4.99362
30
+ in -5.09839
31
+ ar -5.10752
32
+ p -5.16879
33
+ f -5.17396
34
+ or -5.20309
35
+ c -5.21379
36
+ g -5.21537
37
+ ▁The -5.26093
38
+ re -5.33666
39
+ - -5.37802
40
+ b -5.39736
41
+ ly -5.41386
42
+ ▁. -5.4411
43
+ en -5.45186
44
+ i -5.47261
45
+ ▁( -5.50639
46
+ ▁f -5.51352
47
+ an -5.54095
48
+ ▁as -5.54212
49
+ ur -5.55306
50
+ ▁S -5.57071
51
+ ▁re -5.58107
52
+ es -5.58272
53
+ ▁for -5.62901
54
+ ic -5.63297
55
+ m -5.64497
56
+ u -5.65596
57
+ ▁A -5.65812
58
+ le -5.66668
59
+ it -5.68914
60
+ ▁by -5.70114
61
+ ▁was -5.75532
62
+ on -5.79453
63
+ ri -5.79803
64
+ ▁B -5.80188
65
+ st -5.81431
66
+ ' -5.82833
67
+ ▁with -5.83968
68
+ th -5.84353
69
+ ▁on -5.87698
70
+ h -5.88915
71
+ ▁P -5.89336
72
+ w -5.89774
73
+ ▁or -5.91013
74
+ ra -5.92151
75
+ ation -5.92539
76
+ ▁be -5.9376
77
+ il -5.98519
78
+ ent -5.9883
79
+ ▁an -5.99257
80
+ ▁19 -6.01172
81
+ ion -6.01493
82
+ at -6.02207
83
+ ▁" -6.02294
84
+ ▁c -6.02546
85
+ ch -6.02773
86
+ ) -6.03923
87
+ k -6.04155
88
+ ▁co -6.04329
89
+ ▁are -6.05606
90
+ ro -6.0652
91
+ ▁C -6.07878
92
+ ▁p -6.11511
93
+ v -6.1246
94
+ us -6.13632
95
+ ▁de -6.14746
96
+ ▁st -6.15681
97
+ ▁that -6.16069
98
+ 1 -6.16222
99
+ se -6.17232
100
+ ce -6.18052
101
+ ir -6.18303
102
+ ▁from -6.18936
103
+ 5 -6.19203
104
+ is -6.22921
105
+ " -6.23156
106
+ ▁D -6.25522
107
+ el -6.25566
108
+ ne -6.27447
109
+ te -6.28033
110
+ ad -6.29411
111
+ ▁G -6.29495
112
+ ment -6.29817
113
+ am -6.29912
114
+ ▁F -6.29947
115
+ x -6.30442
116
+ ▁T -6.32441
117
+ li -6.32652
118
+ ▁m -6.33549
119
+ ol -6.34257
120
+ ive -6.35499
121
+ 9 -6.3607
122
+ un -6.38235
123
+ ▁con -6.38422
124
+ id -6.3859
125
+ ate -6.38848
126
+ est -6.3947
127
+ ▁In -6.39701
128
+ ul -6.40068
129
+ ut -6.41284
130
+ 0 -6.41971
131
+ ▁t -6.42085
132
+ ▁H -6.43357
133
+ et -6.44432
134
+ 2 -6.44628
135
+ as -6.44759
136
+ ▁se -6.4536
137
+ 6 -6.45453
138
+ ▁b -6.46467
139
+ 7 -6.46587
140
+ la -6.4908
141
+ 8 -6.49474
142
+ ist -6.49804
143
+ ▁ex -6.50137
144
+ ▁g -6.50505
145
+ S -6.50922
146
+ ▁h -6.51419
147
+ 4 -6.52466
148
+ ▁which -6.54796
149
+ ▁at -6.58108
150
+ ▁W -6.5819
151
+ 3 -6.58465
152
+ im -6.5961
153
+ om -6.59781
154
+ A -6.60127
155
+ age -6.60365
156
+ ies -6.60467
157
+ ▁w -6.62078
158
+ ver -6.62924
159
+ ▁N -6.63071
160
+ ers -6.63181
161
+ ▁E -6.63282
162
+ C -6.63669
163
+ ve -6.63671
164
+ ▁e -6.65324
165
+ ▁has -6.66208
166
+ ▁it -6.67689
167
+ ter -6.68174
168
+ ity -6.68823
169
+ mp -6.70881
170
+ ▁his -6.72489
171
+ ▁d -6.73116
172
+ um -6.7349
173
+ ge -6.73673
174
+ ▁M -6.74175
175
+ me -6.74328
176
+ ▁r -6.74662
177
+ ▁1 -6.75046
178
+ qu -6.75189
179
+ ▁I -6.75752
180
+ ▁United -6.76143
181
+ nd -6.76592
182
+ lo -6.76616
183
+ ▁ch -6.77466
184
+ ▁also -6.7776
185
+ ▁J -6.79458
186
+ ▁po -6.80132
187
+ ), -6.80651
188
+ ▁It -6.81648
189
+ ▁pro -6.81762
190
+ and -6.81885
191
+ ▁he -6.8234
192
+ ▁have -6.83154
193
+ z -6.8364
194
+ ▁O -6.84215
195
+ ill -6.84536
196
+ ant -6.84949
197
+ ▁R -6.85995
198
+ ▁what -6.88048
199
+ ated -6.88381
200
+ ▁States -6.88593
201
+ ine -6.89957
202
+ ▁di -6.90808
203
+ ight -6.90919
204
+ ance -6.91298
205
+ ph -6.9194
206
+ ▁other -6.92562
207
+ ; -6.93669
208
+ co -6.94291
209
+ ▁U -6.94648
210
+ tic -6.95711
211
+ ide -6.96324
212
+ ta -6.96777
213
+ ▁its -6.9678
214
+ ect -6.97397
215
+ ud -6.97493
216
+ iv -6.98038
217
+ ▁who -6.98122
218
+ ▁mo -6.98793
219
+ I -6.99739
220
+ ot -7.01328
221
+ ▁not -7.01789
222
+ ▁most -7.02148
223
+ ▁v -7.02259
224
+ ci -7.02331
225
+ ▁were -7.03457
226
+ tion -7.04212
227
+ ow -7.04501
228
+ ry -7.04542
229
+ ▁2 -7.05202
230
+ op -7.05275
231
+ ▁first -7.0554
232
+ ▁K -7.05685
233
+ all -7.0605
234
+ min -7.06175
235
+ ▁can -7.06893
236
+ ia -7.07865
237
+ ac -7.08502
238
+ ▁sp -7.09015
239
+ ▁pa -7.09396
240
+ ▁one -7.09743
241
+ ). -7.10594
242
+ ther -7.11186
243
+ pe -7.1143
244
+ av -7.12624
245
+ mo -7.12761
246
+ ▁Ch -7.13342
247
+ ical -7.13516
248
+ pp -7.13969
249
+ ▁American -7.14112
250
+ ▁un -7.14512
251
+ ian -7.14524
252
+ ig -7.14606
253
+ ▁been -7.15507
254
+ ence -7.15667
255
+ ▁used -7.15929
256
+ ▁so -7.16047
257
+ ap -7.17222
258
+ ▁St -7.17543
259
+ ven -7.18062
260
+ ke -7.18374
261
+ old -7.20342
262
+ ▁ma -7.2115
263
+ ▁form -7.21604
264
+ land -7.21658
265
+ ▁ca -7.21738
266
+ ▁state -7.21891
267
+ ck -7.22935
268
+ hi -7.23329
269
+ ted -7.24357
270
+ ▁la -7.25031
271
+ ▁such -7.2514
272
+ ▁pre -7.25425
273
+ port -7.2548
274
+ ie -7.25505
275
+ D -7.25589
276
+ ▁their -7.26005
277
+ ▁part -7.26338
278
+ able -7.26411
279
+ ▁Mo -7.2669
280
+ em -7.26987
281
+ T -7.27079
282
+ ma -7.27164
283
+ ub -7.27451
284
+ ▁He -7.27531
285
+ ial -7.27582
286
+ ag -7.27696
287
+ ction -7.27945
288
+ P -7.29408
289
+ up -7.31156
290
+ ▁V -7.31241
291
+ ard -7.31839
292
+ ous -7.32009
293
+ ▁me -7.32062
294
+ ell -7.32153
295
+ : -7.32453
296
+ ▁but -7.32773
297
+ he -7.33481
298
+ ▁no -7.34059
299
+ ▁over -7.34226
300
+ ▁many -7.34398
301
+ ha -7.35318
302
+ mb -7.36081
303
+ bo -7.36412
304
+ if -7.36603
305
+ les -7.36806
306
+ ten -7.37112
307
+ ▁into -7.3734
308
+ ally -7.37849
309
+ ust -7.37887
310
+ ish -7.37962
311
+ ▁known -7.38086
312
+ ▁two -7.38213
313
+ ary -7.38731
314
+ ang -7.39591
315
+ ▁sh -7.39651
316
+ ho -7.40195
317
+ ▁Ma -7.4021
318
+ ▁all -7.40284
319
+ ti -7.40569
320
+ ▁ho -7.40924
321
+ ▁L -7.41168
322
+ ab -7.41502
323
+ com -7.42251
324
+ ▁name -7.4232
325
+ ▁3 -7.42434
326
+ uc -7.42528
327
+ ak -7.42852
328
+ to -7.43329
329
+ j -7.43401
330
+ day -7.44705
331
+ ▁j -7.45545
332
+ B -7.45711
333
+ ▁Re -7.4583
334
+ – -7.46056
335
+ ▁use -7.46287
336
+ cent -7.46858
337
+ ▁more -7.47239
338
+ ▁18 -7.47506
339
+ mi -7.47913
340
+ ▁Co -7.48482
341
+ ture -7.49362
342
+ po -7.50349
343
+ ca -7.50676
344
+ ▁when -7.50816
345
+ ▁ba -7.51262
346
+ E -7.51342
347
+ und -7.51527
348
+ ▁br -7.51879
349
+ 200 -7.52528
350
+ na -7.53136
351
+ ach -7.53575
352
+ ▁act -7.53834
353
+ one -7.53944
354
+ ▁time -7.54097
355
+ ▁play -7.54584
356
+ ric -7.55652
357
+ M -7.55855
358
+ ue -7.55971
359
+ ▁may -7.56174
360
+ ress -7.56233
361
+ tra -7.56266
362
+ ▁include -7.56512
363
+ ▁high -7.56513
364
+ ▁car -7.5676
365
+ ▁film -7.56876
366
+ ative -7.56917
367
+ ▁La -7.57192
368
+ ▁term -7.57839
369
+ no -7.58717
370
+ ▁some -7.59031
371
+ lin -7.59239
372
+ ▁New -7.59409
373
+ low -7.59432
374
+ ▁do -7.595
375
+ ▁after -7.59602
376
+ tro -7.59984
377
+ ru -7.60526
378
+ ▁than -7.6062
379
+ ▁bo -7.61657
380
+ ok -7.61903
381
+ ▁number -7.62558
382
+ ▁world -7.62936
383
+ ron -7.63126
384
+ ition -7.63362
385
+ ack -7.63495
386
+ ug -7.63745
387
+ vo -7.64372
388
+ ▁per -7.64738
389
+ ▁where -7.65822
390
+ ▁lo -7.66202
391
+ man -7.66506
392
+ ▁had -7.6653
393
+ ▁Ro -7.66706
394
+ R -7.6693
395
+ N -7.67234
396
+ ▁this -7.67473
397
+ ▁De -7.68762
398
+ ank -7.69171
399
+ ▁War -7.69455
400
+ ▁inter -7.70337
401
+ ▁Mar -7.70572
402
+ act -7.70587
403
+ ▁k -7.71029
404
+ the -7.71248
405
+ ▁gr -7.71417
406
+ mon -7.71636
407
+ ▁her -7.72386
408
+ ual -7.72539
409
+ ▁An -7.73173
410
+ ▁only -7.7342
411
+ L -7.7428
412
+ ▁system -7.74584
413
+ ▁acc -7.75146
414
+ ship -7.75202
415
+ ton -7.75294
416
+ ities -7.75685
417
+ ▁out -7.75767
418
+ ▁Ar -7.76284
419
+ round -7.76685
420
+ ▁This -7.76688
421
+ ism -7.76781
422
+ ▁series -7.77408
423
+ ▁refer -7.77481
424
+ io -7.77484
425
+ ice -7.77969
426
+ 00 -7.78432
427
+ ▁work -7.78498
428
+ ip -7.78704
429
+ ized -7.78924
430
+ ▁million -7.79162
431
+ F -7.79665
432
+ cul -7.79869
433
+ over -7.79984
434
+ ▁years -7.80147
435
+ ▁war -7.80264
436
+ ep -7.80304
437
+ O -7.80382
438
+ ▁Lo -7.8093
439
+ during -7.80962
440
+ ▁4 -7.81569
441
+ ▁how -7.82293
442
+ di -7.82509
443
+ ▁common -7.83726
444
+ ▁dis -7.8391
445
+ ▁including -7.83956
446
+ ▁game -7.84703
447
+ ick -7.85306
448
+ ▁World -7.8537
449
+ ▁under -7.8545
450
+ ▁between -7.86084
451
+ ration -7.86217
452
+ ev -7.87153
453
+ ▁well -7.87304
454
+ ▁Ho -7.8788
455
+ way -7.87917
456
+ ize -7.88827
457
+ ▁trans -7.89243
458
+ came -7.89553
459
+ present -7.8977
460
+ ga -7.90352
461
+ imp -7.90424
462
+ ▁20 -7.91065
463
+ ▁large -7.91385
464
+ ▁new -7.92043
465
+ ▁record -7.92244
466
+ ▁four -7.9228
467
+ ▁we -7.92322
468
+ ▁major -7.93266
469
+ H -7.93297
470
+ ▁often -7.93609
471
+ ▁group -7.94299
472
+ uch -7.94534
473
+ ▁up -7.94593
474
+ ▁develop -7.94817
475
+ ▁produce -7.95324
476
+ ▁people -7.96394
477
+ ner -7.96649
478
+ % -7.97192
479
+ tter -7.97777
480
+ ▁For -7.97864
481
+ ▁plan -7.98045
482
+ ▁Bo -7.98192
483
+ ▁called -7.98275
484
+ bu -7.99349
485
+ ▁about -7.99356
486
+ ▁Me -7.99467
487
+ ▁population -7.99625
488
+ con -7.99954
489
+ ▁end -8.00591
490
+ ▁second -8.01283
491
+ ▁mi -8.01704
492
+ ▁area -8.02148
493
+ ▁show -8.02283
494
+ / -8.02399
495
+ ▁Con -8.0241
496
+ ttle -8.03169
497
+ ▁since -8.03253
498
+ ▁three -8.03533
499
+ ▁To -8.03668
500
+ ▁vi -8.03818
501
+ V -8.0431
502
+ ward -8.04836
503
+ ▁season -8.05255
504
+ ib -8.05421
505
+ ▁both -8.0575
506
+ ▁America -8.06135
507
+ ▁year -8.0631
508
+ ? -8.07004
509
+ ▁South -8.073
510
+ ▁city -8.07512
511
+ ▁through -8.07597
512
+ gu -8.07666
513
+ cri -8.07767
514
+ ▁team -8.08249
515
+ ▁product -8.08424
516
+ ▁found -8.09697
517
+ ▁main -8.10388
518
+ ▁law -8.10683
519
+ ▁sub -8.1072
520
+ ▁Th -8.10747
521
+ va -8.11156
522
+ ▁character -8.11215
523
+ ▁follow -8.12453
524
+ ▁government -8.12763
525
+ ▁Mi -8.12877
526
+ ▁North -8.13132
527
+ ▁made -8.13142
528
+ ▁man -8.13487
529
+ ign -8.13576
530
+ ▁creat -8.14272
531
+ east -8.1504
532
+ ▁human -8.15615
533
+ ▁song -8.15634
534
+ ator -8.15765
535
+ ▁Le -8.16108
536
+ ▁lead -8.17645
537
+ ▁different -8.17884
538
+ while -8.17924
539
+ direct -8.18304
540
+ ,000 -8.18884
541
+ ▁2010 -8.19207
542
+ ▁long -8.19886
543
+ ▁right -8.2005
544
+ ▁John -8.2021
545
+ ▁power -8.2024
546
+ ▁does -8.20394
547
+ X -8.20547
548
+ ▁several -8.2089
549
+ ▁largest -8.21363
550
+ ▁countries -8.21565
551
+ ▁general -8.21566
552
+ ▁life -8.21571
553
+ ible -8.22191
554
+ ▁each -8.22319
555
+ G -8.2286
556
+ ▁own -8.23473
557
+ ▁US -8.23481
558
+ ▁history -8.23978
559
+ ▁On -8.24717
560
+ ▁17 -8.26111
561
+ ▁person -8.26485
562
+ ▁single -8.26853
563
+ ▁mean -8.26999
564
+ form -8.27906
565
+ ▁2011 -8.28257
566
+ ▁member -8.2826
567
+ ▁album -8.28988
568
+ ▁national -8.28992
569
+ ▁Com -8.29855
570
+ $ -8.30094
571
+ ▁public -8.30466
572
+ ▁bi -8.30766
573
+ ▁leg -8.30841
574
+ ▁result -8.30842
575
+ ▁later -8.30898
576
+ ▁Award -8.30927
577
+ ▁President -8.31214
578
+ ▁process -8.31217
579
+ ▁usually -8.3159
580
+ ▁water -8.3162
581
+ — -8.31967
582
+ ▁century -8.31968
583
+ ▁appear -8.31968
584
+ ▁music -8.32404
585
+ ▁success -8.32726
586
+ ▁service -8.33108
587
+ ▁type -8.33118
588
+ ▁president -8.33491
589
+ ▁perform -8.34315
590
+ 60 -8.35939
591
+ ▁Li -8.36016
592
+ ness -8.3606
593
+ ▁list -8.36139
594
+ ▁featur -8.36218
595
+ ▁operat -8.36292
596
+ U -8.36662
597
+ born -8.36936
598
+ ▁released -8.37568
599
+ ▁original -8.37602
600
+ ▁Col -8.37608
601
+ ▁before -8.37806
602
+ ▁small -8.37808
603
+ ▁cause -8.38501
604
+ ▁cell -8.38604
605
+ ▁early -8.38633
606
+ ▁event -8.38638
607
+ ium -8.38872
608
+ ▁design -8.39437
609
+ ▁Man -8.3989
610
+ ▁language -8.4024
611
+ ▁would -8.40651
612
+ ▁National -8.40663
613
+ mmuni -8.41256
614
+ log -8.41337
615
+ ▁serve -8.4141
616
+ ▁current -8.42735
617
+ ▁country -8.43238
618
+ ▁provide -8.44008
619
+ ▁place -8.4419
620
+ vision -8.44221
621
+ ology -8.4486
622
+ ▁German -8.44866
623
+ ▁She -8.44989
624
+ ▁electro -8.45295
625
+ ▁live -8.45679
626
+ Y -8.45722
627
+ ▁disc -8.45957
628
+ ▁popular -8.46161
629
+ ▁will -8.46457
630
+ ▁death -8.46631
631
+ ▁English -8.4881
632
+ ▁same -8.48844
633
+ ▁great -8.49289
634
+ ▁based -8.49458
635
+ ▁won -8.49533
636
+ tract -8.49707
637
+ ▁2012 -8.50162
638
+ ▁(19 -8.50623
639
+ ▁sign -8.50888
640
+ ▁role -8.50985
641
+ ▁British -8.51073
642
+ ▁10 -8.51193
643
+ ▁program -8.51531
644
+ ▁region -8.52019
645
+ ▁unti -8.52285
646
+ W -8.53129
647
+ hose -8.53731
648
+ ▁Africa -8.53858
649
+ ▁take -8.54016
650
+ view -8.5449
651
+ ified -8.55788
652
+ struct -8.55972
653
+ spi -8.56224
654
+ ▁occur -8.57207
655
+ ▁considered -8.57694
656
+ ▁period -8.57696
657
+ ▁book -8.57841
658
+ ▁slave -8.58197
659
+ ▁short -8.58758
660
+ writ -8.59109
661
+ time -8.59155
662
+ ▁television -8.59172
663
+ ▁energy -8.5967
664
+ ▁contain -8.59676
665
+ ▁now -8.59796
666
+ ▁require -8.60172
667
+ ▁health -8.60182
668
+ ▁body -8.60206
669
+ ▁start -8.60416
670
+ ▁began -8.60709
671
+ ▁near -8.61413
672
+ ▁count -8.61699
673
+ ▁official -8.62195
674
+ ▁home -8.62675
675
+ ▁level -8.62709
676
+ ▁Act -8.62953
677
+ ▁economic -8.63223
678
+ ▁political -8.63223
679
+ ▁example -8.63224
680
+ ▁After -8.63239
681
+ ▁2009 -8.63243
682
+ ▁become -8.63249
683
+ ▁data -8.6328
684
+ ▁support -8.63742
685
+ ▁Europe -8.63864
686
+ ▁because -8.64262
687
+ ▁effect -8.64262
688
+ ▁standard -8.64264
689
+ ▁south -8.64309
690
+ ▁European -8.65189
691
+ ▁class -8.6532
692
+ ▁various -8.65841
693
+ ▁York -8.65841
694
+ ▁company -8.65841
695
+ ▁modern -8.65842
696
+ ▁total -8.65873
697
+ ▁back -8.66028
698
+ ization -8.66893
699
+ ▁tax -8.66965
700
+ ▁among -8.67466
701
+ ▁continu -8.67987
702
+ ▁remain -8.67997
703
+ ▁Union -8.67998
704
+ ▁Earth -8.68
705
+ ▁market -8.6853
706
+ ▁multi -8.69089
707
+ K -8.69409
708
+ é -8.69626
709
+ ▁third -8.69627
710
+ ▁control -8.6963
711
+ ▁north -8.69726
712
+ ▁computer -8.70178
713
+ mission -8.70196
714
+ ▁Republic -8.70734
715
+ ▁military -8.71292
716
+ ▁version -8.7186
717
+ ▁six -8.71863
718
+ ological -8.71869
719
+ spect -8.72371
720
+ ▁However -8.72419
721
+ ▁individual -8.72419
722
+ ▁device -8.72421
723
+ ▁Japan -8.72421
724
+ ▁federal -8.72422
725
+ ▁like -8.72453
726
+ ▁word -8.73044
727
+ ▁make -8.73128
728
+ ▁allow -8.73458
729
+ ▁located -8.73561
730
+ Z -8.74133
731
+ ▁Great -8.74153
732
+ ▁open -8.74226
733
+ ▁Roman -8.74916
734
+ ▁office -8.74921
735
+ ▁Canada -8.75293
736
+ ▁East -8.75446
737
+ ▁though -8.75472
738
+ ▁100 -8.75545
739
+ ootball -8.75878
740
+ ▁2008 -8.76485
741
+ rmal -8.76922
742
+ ▁establish -8.77653
743
+ ▁addition -8.78253
744
+ field -8.78262
745
+ ▁estimate -8.78858
746
+ ▁species -8.7946
747
+ ▁civil -8.79464
748
+ ▁video -8.79465
749
+ ▁issue -8.80662
750
+ ▁January -8.80683
751
+ ▁against -8.80684
752
+ ograph -8.80684
753
+ ▁along -8.80688
754
+ ▁title -8.80721
755
+ ▁special -8.81301
756
+ ▁engine -8.81301
757
+ ▁colon -8.81368
758
+ ▁specific -8.81922
759
+ ▁tradition -8.82547
760
+ ▁international -8.82547
761
+ ▁qua -8.83622
762
+ ▁April -8.83809
763
+ ▁Some -8.83892
764
+ ▁school -8.84446
765
+ ▁measure -8.84447
766
+ ▁free -8.84828
767
+ ▁League -8.85087
768
+ ▁family -8.85087
769
+ ▁worldwide -8.85087
770
+ ▁element -8.85097
771
+ ▁although -8.85732
772
+ ▁House -8.85756
773
+ ▁food -8.86383
774
+ ▁particular -8.87035
775
+ ▁Kingdom -8.87035
776
+ ▁Congress -8.87035
777
+ ▁social -8.87701
778
+ ▁July -8.8772
779
+ & -8.88355
780
+ ▁California -8.88355
781
+ ▁June -8.88382
782
+ ▁range -8.88441
783
+ cycl -8.88772
784
+ ▁sometime -8.89091
785
+ uff -8.89115
786
+ ▁consist -8.89121
787
+ ▁held -8.8913
788
+ ▁describe -8.91049
789
+ ▁written -8.91052
790
+ ▁source -8.91054
791
+ ▁space -8.91088
792
+ ▁origin -8.91407
793
+ ▁network -8.91734
794
+ ▁author -8.91735
795
+ ability -8.91736
796
+ ▁function -8.91737
797
+ ▁treat -8.91873
798
+ ▁India -8.92403
799
+ ▁November -8.92423
800
+ ▁increase -8.92423
801
+ ▁artist -8.92428
802
+ ▁2007 -8.92446
803
+ ▁culture -8.93126
804
+ ▁Super -8.93138
805
+ ▁Christian -8.93817
806
+ ▁super -8.94533
807
+ ▁associat -8.95231
808
+ ▁blood -8.95945
809
+ town -8.96151
810
+ ▁natural -8.97389
811
+ ▁France -8.97399
812
+ dependent -8.98119
813
+ ▁vitamin -8.98119
814
+ ▁animal -8.9814
815
+ ▁model -8.98146
816
+ ▁rock -8.98175
817
+ ▁Australia -8.98854
818
+ ▁September -8.98854
819
+ ▁business -8.98854
820
+ ▁significant -8.99595
821
+ ▁University -9.00341
822
+ ▁organization -9.00341
823
+ ▁education -9.00342
824
+ ▁throughout -9.00344
825
+ ▁compet -9.00347
826
+ ification -9.011
827
+ ▁story -9.01217
828
+ ▁International -9.0185
829
+ ▁important -9.0185
830
+ ▁research -9.01851
831
+ ▁2006 -9.01876
832
+ ▁career -9.01964
833
+ ▁October -9.03383
834
+ ▁August -9.03384
835
+ ▁women -9.03391
836
+ ▁Although -9.04158
837
+ ▁initial -9.04197
838
+ ▁full -9.04731
839
+ ▁billion -9.04943
840
+ ▁novel -9.04949
841
+ ▁limit -9.0573
842
+ ▁Washington -9.0652
843
+ ▁Bowl -9.06552
844
+ ▁global -9.07321
845
+ ▁widely -9.07326
846
+ ▁another -9.07342
847
+ ▁England -9.08127
848
+ ▁disease -9.08128
849
+ ▁With -9.08167
850
+ ▁media -9.0849
851
+ ▁surface -9.0894
852
+ ▁oppos -9.08941
853
+ ▁Qu -9.09002
854
+ ▁collect -9.09766
855
+ ▁Since -9.09805
856
+ ▁help -9.10654
857
+ ▁release -9.11081
858
+ ▁close -9.11479
859
+ rough -9.1175
860
+ ▁similar -9.1226
861
+ ▁French -9.1226
862
+ ▁white -9.12262
863
+ ▁election -9.12265
864
+ ▁information -9.12268
865
+ ▁employ -9.13107
866
+ ▁influence -9.13107
867
+ ▁capital -9.13107
868
+ ▁regard -9.13122
869
+ ▁children -9.13962
870
+ ▁episode -9.13962
871
+ ▁Greek -9.13962
872
+ ▁return -9.13964
873
+ ▁1990 -9.13968
874
+ ▁What -9.13984
875
+ ▁making -9.1399
876
+ ▁given -9.13997
877
+ J -9.1477
878
+ ▁February -9.14824
879
+ ▁amount -9.14824
880
+ ▁psych -9.14827
881
+ ▁application -9.15694
882
+ ▁replac -9.15695
883
+ ▁value -9.15699
884
+ ▁every -9.15723
885
+ produc -9.15995
886
+ ▁December -9.16571
887
+ ▁typically -9.16571
888
+ ▁movement -9.16573
889
+ ▁left -9.16578
890
+ ▁however -9.1658
891
+ ▁previous -9.17456
892
+ ▁claim -9.17462
893
+ ▁Windows -9.18349
894
+ ▁observ -9.18349
895
+ ▁material -9.18349
896
+ ▁object -9.19249
897
+ ▁professional -9.19249
898
+ wood -9.19263
899
+ ▁local -9.19306
900
+ ▁trade -9.1939
901
+ ▁Internet -9.20159
902
+ ought -9.20434
903
+ ▁especial -9.21076
904
+ ▁Western -9.21076
905
+ ▁either -9.21083
906
+ pproximate -9.22002
907
+ ▁County -9.22002
908
+ ▁primary -9.22936
909
+ ▁property -9.22936
910
+ ▁account -9.22937
911
+ ▁separate -9.22938
912
+ ▁factor -9.22948
913
+ ▁down -9.22964
914
+ ▁commercial -9.2388
915
+ ▁structure -9.24835
916
+ ▁economy -9.26765
917
+ ▁pressure -9.26765
918
+ ▁attack -9.26776
919
+ ▁condition -9.26778
920
+ ▁decade -9.26783
921
+ ▁week -9.26791
922
+ ▁Confederate -9.27745
923
+ ▁complete -9.27745
924
+ ▁Spanish -9.28735
925
+ ▁across -9.28736
926
+ ▁growth -9.28736
927
+ ▁central -9.28738
928
+ ▁available -9.29735
929
+ ▁certain -9.29735
930
+ ▁2013 -9.29736
931
+ ▁You -9.29745
932
+ ▁Whil -9.30017
933
+ ▁primari -9.30745
934
+ ▁contribut -9.31766
935
+ ▁Party -9.31768
936
+ ▁drug -9.31777
937
+ ▁Democrat -9.32797
938
+ ▁campaign -9.32797
939
+ ▁subsequent -9.32797
940
+ ▁focus -9.32797
941
+ ▁elected -9.32798
942
+ craft -9.32802
943
+ NFL -9.32802
944
+ ▁environment -9.33838
945
+ ▁chemical -9.33839
946
+ ▁entire -9.33845
947
+ ▁radio -9.34074
948
+ ▁William -9.34891
949
+ ▁complex -9.34891
950
+ ▁financial -9.35955
951
+ ▁George -9.35955
952
+ ▁league -9.35955
953
+ ▁policy -9.35956
954
+ ▁project -9.35956
955
+ ▁compos -9.35958
956
+ ▁litera -9.36277
957
+ ▁physical -9.3703
958
+ ▁historical -9.3703
959
+ ▁hydro -9.37031
960
+ ▁defeat -9.37041
961
+ ▁regulat -9.37057
962
+ ▁According -9.38117
963
+ ▁method -9.38117
964
+ ▁generat -9.38195
965
+ known -9.39007
966
+ ▁celebrat -9.39216
967
+ ▁built -9.39216
968
+ ▁practice -9.40327
969
+ ▁purpose -9.41451
970
+ ▁credit -9.41452
971
+ ▁affect -9.42587
972
+ ▁degree -9.4259
973
+ ▁beginning -9.43736
974
+ ▁symbol -9.43736
975
+ ▁science -9.43738
976
+ ▁Central -9.449
977
+ ▁industry -9.46076
978
+ ▁private -9.46076
979
+ ▁subject -9.46076
980
+ ▁western -9.46076
981
+ ▁district -9.47266
982
+ ▁community -9.47266
983
+ ▁problem -9.47266
984
+ ▁determine -9.47268
985
+ ▁Constitution -9.48471
986
+ ▁Texas -9.48471
987
+ ▁distinct -9.48476
988
+ ▁except -9.48476
989
+ ▁Association -9.4969
990
+ ▁institution -9.4969
991
+ ▁nuclear -9.4969
992
+ ▁technology -9.4969
993
+ ▁Empire -9.49691
994
+ ▁regular -9.49691
995
+ ▁concept -9.49694
996
+ ▁Mexico -9.50925
997
+ ▁announced -9.50925
998
+ Q -9.69917
999
+ q -9.90537
1000
+ ( -9.98015
sentencepiece_tokenizer.py ADDED
@@ -0,0 +1,82 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ from transformers import PreTrainedTokenizer
2
+ import sentencepiece as spm
3
+ import os
4
+ from logging import getLogger
5
+ from typing import List
6
+
7
+ logger = getLogger()
8
+
9
+ class SPTokenizer(PreTrainedTokenizer):
10
+ """Tokenizing and encoding/decoding text using SentencePiece."""
11
+
12
+ def __init__(self, model_path: str, vocab_file: str, **kwargs):
13
+ # Add 'vocab_file' to kwargs if it's not present
14
+ if 'vocab_file' not in kwargs:
15
+ kwargs['vocab_file'] = vocab_file
16
+
17
+ super().__init__(**kwargs)
18
+
19
+ # Store initialization arguments
20
+ self.init_kwargs = {"model_path": model_path, "vocab_file": vocab_file, **kwargs}
21
+
22
+ # Reload tokenizer
23
+ assert os.path.isfile(model_path), model_path
24
+ self.sp_model = spm.SentencePieceProcessor(model_file=model_path)
25
+ logger.info(f"Reloaded SentencePiece model from {model_path}")
26
+
27
+ # BOS / EOS token IDs
28
+ self.n_words: int = self.sp_model.vocab_size()
29
+ self.bos_id: int = self.sp_model.bos_id()
30
+ self.eos_id: int = self.sp_model.eos_id()
31
+ self.pad_id: int = self.sp_model.pad_id()
32
+ logger.info(
33
+ f"#words: {self.n_words} - BOS ID: {self.bos_id} - EOS ID: {self.eos_id}"
34
+ )
35
+ assert self.sp_model.vocab_size() == self.sp_model.get_piece_size()
36
+
37
+ def encode(self, s: str, bos: bool, eos: bool) -> List[int]:
38
+ t = self.sp_model.encode(s)
39
+ if bos:
40
+ t = [self.bos_id] + t
41
+ if eos:
42
+ t = t + [self.eos_id]
43
+ return t
44
+
45
+ def decode(self, t: List[int]) -> str:
46
+ return self.sp_model.decode(t)
47
+ @property
48
+ def vocab_size(self):
49
+ """Size of the base vocabulary (without the added tokens)."""
50
+ return self.n_words
51
+
52
+ def save_pretrained(self, save_directory: str, max_shard_size=None, safe_serialization=None):
53
+ # Save the SentencePiece model file
54
+ super().save_pretrained(save_directory, max_shard_size=None, safe_serialization=None)
55
+
56
+
57
+ # Save the vocabulary to a file
58
+ self.save_vocabulary(save_directory, filename_prefix="vocab")
59
+
60
+ @classmethod
61
+ def from_pretrained(cls, pretrained_model_name_or_path: str, **kwargs):
62
+ # Load the SentencePiece model file
63
+ model_file = os.path.join(pretrained_model_name_or_path, "spmodel_wikiqa.model")
64
+
65
+ # Load the vocabulary file path
66
+ vocab_file = os.path.join(pretrained_model_name_or_path, "spmodel_wikiqa.vocab")
67
+
68
+ return cls(model_path=model_file, vocab_file=vocab_file, **kwargs)
69
+ #return super().from_pretrained(cls, pretrained_model_name_or_path, **kwargs)
70
+
71
+ def get_vocab(self):
72
+ # Read vocabulary from the file
73
+ with open(self.init_kwargs["vocab_file"], "r", encoding="utf-8") as f:
74
+ vocab = {word.strip(): i for i, word in enumerate(f)}
75
+ return vocab
76
+
77
+ def save_vocabulary(self, save_directory, filename_prefix):
78
+ vocab_file = os.path.join(save_directory, f"{filename_prefix}.txt")
79
+ with open(vocab_file, "w", encoding="utf-8") as f:
80
+ for word, index in sorted(self.get_vocab().items(), key=lambda x: x[1]):
81
+ f.write(f"{word}\n")
82
+ return (vocab_file,)
special_tokens_map.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {}
tokenizer_config.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {},
3
+ "auto_map": {
4
+ "AutoTokenizer": [
5
+ "sentencepiece_tokenizer.Tokenizer",
6
+ null
7
+ ]
8
+ },
9
+ "clean_up_tokenization_spaces": true,
10
+ "model_max_length": 1000000000000000019884624838656,
11
+ "model_path": "./spmodel_wikiqa.model",
12
+ "tokenizer_class": "Tokenizer",
13
+ "vocab_file": "./spmodel_wikiqa.vocab"
14
+ }
vocab.txt ADDED
@@ -0,0 +1,1000 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <pad> 0
2
+ <unk> 0
3
+ <s> 0
4
+ </s> 0
5
+ s -2.98325
6
+ ▁ -3.33613
7
+ ▁the -3.53659
8
+ , -3.96136
9
+ ▁of -4.11741
10
+ e -4.13254
11
+ . -4.1679
12
+ ▁a -4.32755
13
+ ▁and -4.33125
14
+ ▁in -4.37771
15
+ ed -4.40148
16
+ d -4.43306
17
+ t -4.4655
18
+ y -4.53252
19
+ ing -4.61545
20
+ er -4.6614
21
+ a -4.69442
22
+ l -4.74331
23
+ ▁to -4.74857
24
+ n -4.76571
25
+ o -4.80687
26
+ ▁, -4.92362
27
+ ▁is -4.93935
28
+ r -4.97962
29
+ al -4.99362
30
+ in -5.09839
31
+ ar -5.10752
32
+ p -5.16879
33
+ f -5.17396
34
+ or -5.20309
35
+ c -5.21379
36
+ g -5.21537
37
+ ▁The -5.26093
38
+ re -5.33666
39
+ - -5.37802
40
+ b -5.39736
41
+ ly -5.41386
42
+ ▁. -5.4411
43
+ en -5.45186
44
+ i -5.47261
45
+ ▁( -5.50639
46
+ ▁f -5.51352
47
+ an -5.54095
48
+ ▁as -5.54212
49
+ ur -5.55306
50
+ ▁S -5.57071
51
+ ▁re -5.58107
52
+ es -5.58272
53
+ ▁for -5.62901
54
+ ic -5.63297
55
+ m -5.64497
56
+ u -5.65596
57
+ ▁A -5.65812
58
+ le -5.66668
59
+ it -5.68914
60
+ ▁by -5.70114
61
+ ▁was -5.75532
62
+ on -5.79453
63
+ ri -5.79803
64
+ ▁B -5.80188
65
+ st -5.81431
66
+ ' -5.82833
67
+ ▁with -5.83968
68
+ th -5.84353
69
+ ▁on -5.87698
70
+ h -5.88915
71
+ ▁P -5.89336
72
+ w -5.89774
73
+ ▁or -5.91013
74
+ ra -5.92151
75
+ ation -5.92539
76
+ ▁be -5.9376
77
+ il -5.98519
78
+ ent -5.9883
79
+ ▁an -5.99257
80
+ ▁19 -6.01172
81
+ ion -6.01493
82
+ at -6.02207
83
+ ▁" -6.02294
84
+ ▁c -6.02546
85
+ ch -6.02773
86
+ ) -6.03923
87
+ k -6.04155
88
+ ▁co -6.04329
89
+ ▁are -6.05606
90
+ ro -6.0652
91
+ ▁C -6.07878
92
+ ▁p -6.11511
93
+ v -6.1246
94
+ us -6.13632
95
+ ▁de -6.14746
96
+ ▁st -6.15681
97
+ ▁that -6.16069
98
+ 1 -6.16222
99
+ se -6.17232
100
+ ce -6.18052
101
+ ir -6.18303
102
+ ▁from -6.18936
103
+ 5 -6.19203
104
+ is -6.22921
105
+ " -6.23156
106
+ ▁D -6.25522
107
+ el -6.25566
108
+ ne -6.27447
109
+ te -6.28033
110
+ ad -6.29411
111
+ ▁G -6.29495
112
+ ment -6.29817
113
+ am -6.29912
114
+ ▁F -6.29947
115
+ x -6.30442
116
+ ▁T -6.32441
117
+ li -6.32652
118
+ ▁m -6.33549
119
+ ol -6.34257
120
+ ive -6.35499
121
+ 9 -6.3607
122
+ un -6.38235
123
+ ▁con -6.38422
124
+ id -6.3859
125
+ ate -6.38848
126
+ est -6.3947
127
+ ▁In -6.39701
128
+ ul -6.40068
129
+ ut -6.41284
130
+ 0 -6.41971
131
+ ▁t -6.42085
132
+ ▁H -6.43357
133
+ et -6.44432
134
+ 2 -6.44628
135
+ as -6.44759
136
+ ▁se -6.4536
137
+ 6 -6.45453
138
+ ▁b -6.46467
139
+ 7 -6.46587
140
+ la -6.4908
141
+ 8 -6.49474
142
+ ist -6.49804
143
+ ▁ex -6.50137
144
+ ▁g -6.50505
145
+ S -6.50922
146
+ ▁h -6.51419
147
+ 4 -6.52466
148
+ ▁which -6.54796
149
+ ▁at -6.58108
150
+ ▁W -6.5819
151
+ 3 -6.58465
152
+ im -6.5961
153
+ om -6.59781
154
+ A -6.60127
155
+ age -6.60365
156
+ ies -6.60467
157
+ ▁w -6.62078
158
+ ver -6.62924
159
+ ▁N -6.63071
160
+ ers -6.63181
161
+ ▁E -6.63282
162
+ C -6.63669
163
+ ve -6.63671
164
+ ▁e -6.65324
165
+ ▁has -6.66208
166
+ ▁it -6.67689
167
+ ter -6.68174
168
+ ity -6.68823
169
+ mp -6.70881
170
+ ▁his -6.72489
171
+ ▁d -6.73116
172
+ um -6.7349
173
+ ge -6.73673
174
+ ▁M -6.74175
175
+ me -6.74328
176
+ ▁r -6.74662
177
+ ▁1 -6.75046
178
+ qu -6.75189
179
+ ▁I -6.75752
180
+ ▁United -6.76143
181
+ nd -6.76592
182
+ lo -6.76616
183
+ ▁ch -6.77466
184
+ ▁also -6.7776
185
+ ▁J -6.79458
186
+ ▁po -6.80132
187
+ ), -6.80651
188
+ ▁It -6.81648
189
+ ▁pro -6.81762
190
+ and -6.81885
191
+ ▁he -6.8234
192
+ ▁have -6.83154
193
+ z -6.8364
194
+ ▁O -6.84215
195
+ ill -6.84536
196
+ ant -6.84949
197
+ ▁R -6.85995
198
+ ▁what -6.88048
199
+ ated -6.88381
200
+ ▁States -6.88593
201
+ ine -6.89957
202
+ ▁di -6.90808
203
+ ight -6.90919
204
+ ance -6.91298
205
+ ph -6.9194
206
+ ▁other -6.92562
207
+ ; -6.93669
208
+ co -6.94291
209
+ ▁U -6.94648
210
+ tic -6.95711
211
+ ide -6.96324
212
+ ta -6.96777
213
+ ▁its -6.9678
214
+ ect -6.97397
215
+ ud -6.97493
216
+ iv -6.98038
217
+ ▁who -6.98122
218
+ ▁mo -6.98793
219
+ I -6.99739
220
+ ot -7.01328
221
+ ▁not -7.01789
222
+ ▁most -7.02148
223
+ ▁v -7.02259
224
+ ci -7.02331
225
+ ▁were -7.03457
226
+ tion -7.04212
227
+ ow -7.04501
228
+ ry -7.04542
229
+ ▁2 -7.05202
230
+ op -7.05275
231
+ ▁first -7.0554
232
+ ▁K -7.05685
233
+ all -7.0605
234
+ min -7.06175
235
+ ▁can -7.06893
236
+ ia -7.07865
237
+ ac -7.08502
238
+ ▁sp -7.09015
239
+ ▁pa -7.09396
240
+ ▁one -7.09743
241
+ ). -7.10594
242
+ ther -7.11186
243
+ pe -7.1143
244
+ av -7.12624
245
+ mo -7.12761
246
+ ▁Ch -7.13342
247
+ ical -7.13516
248
+ pp -7.13969
249
+ ▁American -7.14112
250
+ ▁un -7.14512
251
+ ian -7.14524
252
+ ig -7.14606
253
+ ▁been -7.15507
254
+ ence -7.15667
255
+ ▁used -7.15929
256
+ ▁so -7.16047
257
+ ap -7.17222
258
+ ▁St -7.17543
259
+ ven -7.18062
260
+ ke -7.18374
261
+ old -7.20342
262
+ ▁ma -7.2115
263
+ ▁form -7.21604
264
+ land -7.21658
265
+ ▁ca -7.21738
266
+ ▁state -7.21891
267
+ ck -7.22935
268
+ hi -7.23329
269
+ ted -7.24357
270
+ ▁la -7.25031
271
+ ▁such -7.2514
272
+ ▁pre -7.25425
273
+ port -7.2548
274
+ ie -7.25505
275
+ D -7.25589
276
+ ▁their -7.26005
277
+ ▁part -7.26338
278
+ able -7.26411
279
+ ▁Mo -7.2669
280
+ em -7.26987
281
+ T -7.27079
282
+ ma -7.27164
283
+ ub -7.27451
284
+ ▁He -7.27531
285
+ ial -7.27582
286
+ ag -7.27696
287
+ ction -7.27945
288
+ P -7.29408
289
+ up -7.31156
290
+ ▁V -7.31241
291
+ ard -7.31839
292
+ ous -7.32009
293
+ ▁me -7.32062
294
+ ell -7.32153
295
+ : -7.32453
296
+ ▁but -7.32773
297
+ he -7.33481
298
+ ▁no -7.34059
299
+ ▁over -7.34226
300
+ ▁many -7.34398
301
+ ha -7.35318
302
+ mb -7.36081
303
+ bo -7.36412
304
+ if -7.36603
305
+ les -7.36806
306
+ ten -7.37112
307
+ ▁into -7.3734
308
+ ally -7.37849
309
+ ust -7.37887
310
+ ish -7.37962
311
+ ▁known -7.38086
312
+ ▁two -7.38213
313
+ ary -7.38731
314
+ ang -7.39591
315
+ ▁sh -7.39651
316
+ ho -7.40195
317
+ ▁Ma -7.4021
318
+ ▁all -7.40284
319
+ ti -7.40569
320
+ ▁ho -7.40924
321
+ ▁L -7.41168
322
+ ab -7.41502
323
+ com -7.42251
324
+ ▁name -7.4232
325
+ ▁3 -7.42434
326
+ uc -7.42528
327
+ ak -7.42852
328
+ to -7.43329
329
+ j -7.43401
330
+ day -7.44705
331
+ ▁j -7.45545
332
+ B -7.45711
333
+ ▁Re -7.4583
334
+ – -7.46056
335
+ ▁use -7.46287
336
+ cent -7.46858
337
+ ▁more -7.47239
338
+ ▁18 -7.47506
339
+ mi -7.47913
340
+ ▁Co -7.48482
341
+ ture -7.49362
342
+ po -7.50349
343
+ ca -7.50676
344
+ ▁when -7.50816
345
+ ▁ba -7.51262
346
+ E -7.51342
347
+ und -7.51527
348
+ ▁br -7.51879
349
+ 200 -7.52528
350
+ na -7.53136
351
+ ach -7.53575
352
+ ▁act -7.53834
353
+ one -7.53944
354
+ ▁time -7.54097
355
+ ▁play -7.54584
356
+ ric -7.55652
357
+ M -7.55855
358
+ ue -7.55971
359
+ ▁may -7.56174
360
+ ress -7.56233
361
+ tra -7.56266
362
+ ▁include -7.56512
363
+ ▁high -7.56513
364
+ ▁car -7.5676
365
+ ▁film -7.56876
366
+ ative -7.56917
367
+ ▁La -7.57192
368
+ ▁term -7.57839
369
+ no -7.58717
370
+ ▁some -7.59031
371
+ lin -7.59239
372
+ ▁New -7.59409
373
+ low -7.59432
374
+ ▁do -7.595
375
+ ▁after -7.59602
376
+ tro -7.59984
377
+ ru -7.60526
378
+ ▁than -7.6062
379
+ ▁bo -7.61657
380
+ ok -7.61903
381
+ ▁number -7.62558
382
+ ▁world -7.62936
383
+ ron -7.63126
384
+ ition -7.63362
385
+ ack -7.63495
386
+ ug -7.63745
387
+ vo -7.64372
388
+ ▁per -7.64738
389
+ ▁where -7.65822
390
+ ▁lo -7.66202
391
+ man -7.66506
392
+ ▁had -7.6653
393
+ ▁Ro -7.66706
394
+ R -7.6693
395
+ N -7.67234
396
+ ▁this -7.67473
397
+ ▁De -7.68762
398
+ ank -7.69171
399
+ ▁War -7.69455
400
+ ▁inter -7.70337
401
+ ▁Mar -7.70572
402
+ act -7.70587
403
+ ▁k -7.71029
404
+ the -7.71248
405
+ ▁gr -7.71417
406
+ mon -7.71636
407
+ ▁her -7.72386
408
+ ual -7.72539
409
+ ▁An -7.73173
410
+ ▁only -7.7342
411
+ L -7.7428
412
+ ▁system -7.74584
413
+ ▁acc -7.75146
414
+ ship -7.75202
415
+ ton -7.75294
416
+ ities -7.75685
417
+ ▁out -7.75767
418
+ ▁Ar -7.76284
419
+ round -7.76685
420
+ ▁This -7.76688
421
+ ism -7.76781
422
+ ▁series -7.77408
423
+ ▁refer -7.77481
424
+ io -7.77484
425
+ ice -7.77969
426
+ 00 -7.78432
427
+ ▁work -7.78498
428
+ ip -7.78704
429
+ ized -7.78924
430
+ ▁million -7.79162
431
+ F -7.79665
432
+ cul -7.79869
433
+ over -7.79984
434
+ ▁years -7.80147
435
+ ▁war -7.80264
436
+ ep -7.80304
437
+ O -7.80382
438
+ ▁Lo -7.8093
439
+ during -7.80962
440
+ ▁4 -7.81569
441
+ ▁how -7.82293
442
+ di -7.82509
443
+ ▁common -7.83726
444
+ ▁dis -7.8391
445
+ ▁including -7.83956
446
+ ▁game -7.84703
447
+ ick -7.85306
448
+ ▁World -7.8537
449
+ ▁under -7.8545
450
+ ▁between -7.86084
451
+ ration -7.86217
452
+ ev -7.87153
453
+ ▁well -7.87304
454
+ ▁Ho -7.8788
455
+ way -7.87917
456
+ ize -7.88827
457
+ ▁trans -7.89243
458
+ came -7.89553
459
+ present -7.8977
460
+ ga -7.90352
461
+ imp -7.90424
462
+ ▁20 -7.91065
463
+ ▁large -7.91385
464
+ ▁new -7.92043
465
+ ▁record -7.92244
466
+ ▁four -7.9228
467
+ ▁we -7.92322
468
+ ▁major -7.93266
469
+ H -7.93297
470
+ ▁often -7.93609
471
+ ▁group -7.94299
472
+ uch -7.94534
473
+ ▁up -7.94593
474
+ ▁develop -7.94817
475
+ ▁produce -7.95324
476
+ ▁people -7.96394
477
+ ner -7.96649
478
+ % -7.97192
479
+ tter -7.97777
480
+ ▁For -7.97864
481
+ ▁plan -7.98045
482
+ ▁Bo -7.98192
483
+ ▁called -7.98275
484
+ bu -7.99349
485
+ ▁about -7.99356
486
+ ▁Me -7.99467
487
+ ▁population -7.99625
488
+ con -7.99954
489
+ ▁end -8.00591
490
+ ▁second -8.01283
491
+ ▁mi -8.01704
492
+ ▁area -8.02148
493
+ ▁show -8.02283
494
+ / -8.02399
495
+ ▁Con -8.0241
496
+ ttle -8.03169
497
+ ▁since -8.03253
498
+ ▁three -8.03533
499
+ ▁To -8.03668
500
+ ▁vi -8.03818
501
+ V -8.0431
502
+ ward -8.04836
503
+ ▁season -8.05255
504
+ ib -8.05421
505
+ ▁both -8.0575
506
+ ▁America -8.06135
507
+ ▁year -8.0631
508
+ ? -8.07004
509
+ ▁South -8.073
510
+ ▁city -8.07512
511
+ ▁through -8.07597
512
+ gu -8.07666
513
+ cri -8.07767
514
+ ▁team -8.08249
515
+ ▁product -8.08424
516
+ ▁found -8.09697
517
+ ▁main -8.10388
518
+ ▁law -8.10683
519
+ ▁sub -8.1072
520
+ ▁Th -8.10747
521
+ va -8.11156
522
+ ▁character -8.11215
523
+ ▁follow -8.12453
524
+ ▁government -8.12763
525
+ ▁Mi -8.12877
526
+ ▁North -8.13132
527
+ ▁made -8.13142
528
+ ▁man -8.13487
529
+ ign -8.13576
530
+ ▁creat -8.14272
531
+ east -8.1504
532
+ ▁human -8.15615
533
+ ▁song -8.15634
534
+ ator -8.15765
535
+ ▁Le -8.16108
536
+ ▁lead -8.17645
537
+ ▁different -8.17884
538
+ while -8.17924
539
+ direct -8.18304
540
+ ,000 -8.18884
541
+ ▁2010 -8.19207
542
+ ▁long -8.19886
543
+ ▁right -8.2005
544
+ ▁John -8.2021
545
+ ▁power -8.2024
546
+ ▁does -8.20394
547
+ X -8.20547
548
+ ▁several -8.2089
549
+ ▁largest -8.21363
550
+ ▁countries -8.21565
551
+ ▁general -8.21566
552
+ ▁life -8.21571
553
+ ible -8.22191
554
+ ▁each -8.22319
555
+ G -8.2286
556
+ ▁own -8.23473
557
+ ▁US -8.23481
558
+ ▁history -8.23978
559
+ ▁On -8.24717
560
+ ▁17 -8.26111
561
+ ▁person -8.26485
562
+ ▁single -8.26853
563
+ ▁mean -8.26999
564
+ form -8.27906
565
+ ▁2011 -8.28257
566
+ ▁member -8.2826
567
+ ▁album -8.28988
568
+ ▁national -8.28992
569
+ ▁Com -8.29855
570
+ $ -8.30094
571
+ ▁public -8.30466
572
+ ▁bi -8.30766
573
+ ▁leg -8.30841
574
+ ▁result -8.30842
575
+ ▁later -8.30898
576
+ ▁Award -8.30927
577
+ ▁President -8.31214
578
+ ▁process -8.31217
579
+ ▁usually -8.3159
580
+ ▁water -8.3162
581
+ — -8.31967
582
+ ▁century -8.31968
583
+ ▁appear -8.31968
584
+ ▁music -8.32404
585
+ ▁success -8.32726
586
+ ▁service -8.33108
587
+ ▁type -8.33118
588
+ ▁president -8.33491
589
+ ▁perform -8.34315
590
+ 60 -8.35939
591
+ ▁Li -8.36016
592
+ ness -8.3606
593
+ ▁list -8.36139
594
+ ▁featur -8.36218
595
+ ▁operat -8.36292
596
+ U -8.36662
597
+ born -8.36936
598
+ ▁released -8.37568
599
+ ▁original -8.37602
600
+ ▁Col -8.37608
601
+ ▁before -8.37806
602
+ ▁small -8.37808
603
+ ▁cause -8.38501
604
+ ▁cell -8.38604
605
+ ▁early -8.38633
606
+ ▁event -8.38638
607
+ ium -8.38872
608
+ ▁design -8.39437
609
+ ▁Man -8.3989
610
+ ▁language -8.4024
611
+ ▁would -8.40651
612
+ ▁National -8.40663
613
+ mmuni -8.41256
614
+ log -8.41337
615
+ ▁serve -8.4141
616
+ ▁current -8.42735
617
+ ▁country -8.43238
618
+ ▁provide -8.44008
619
+ ▁place -8.4419
620
+ vision -8.44221
621
+ ology -8.4486
622
+ ▁German -8.44866
623
+ ▁She -8.44989
624
+ ▁electro -8.45295
625
+ ▁live -8.45679
626
+ Y -8.45722
627
+ ▁disc -8.45957
628
+ ▁popular -8.46161
629
+ ▁will -8.46457
630
+ ▁death -8.46631
631
+ ▁English -8.4881
632
+ ▁same -8.48844
633
+ ▁great -8.49289
634
+ ▁based -8.49458
635
+ ▁won -8.49533
636
+ tract -8.49707
637
+ ▁2012 -8.50162
638
+ ▁(19 -8.50623
639
+ ▁sign -8.50888
640
+ ▁role -8.50985
641
+ ▁British -8.51073
642
+ ▁10 -8.51193
643
+ ▁program -8.51531
644
+ ▁region -8.52019
645
+ ▁unti -8.52285
646
+ W -8.53129
647
+ hose -8.53731
648
+ ▁Africa -8.53858
649
+ ▁take -8.54016
650
+ view -8.5449
651
+ ified -8.55788
652
+ struct -8.55972
653
+ spi -8.56224
654
+ ▁occur -8.57207
655
+ ▁considered -8.57694
656
+ ▁period -8.57696
657
+ ▁book -8.57841
658
+ ▁slave -8.58197
659
+ ▁short -8.58758
660
+ writ -8.59109
661
+ time -8.59155
662
+ ▁television -8.59172
663
+ ▁energy -8.5967
664
+ ▁contain -8.59676
665
+ ▁now -8.59796
666
+ ▁require -8.60172
667
+ ▁health -8.60182
668
+ ▁body -8.60206
669
+ ▁start -8.60416
670
+ ▁began -8.60709
671
+ ▁near -8.61413
672
+ ▁count -8.61699
673
+ ▁official -8.62195
674
+ ▁home -8.62675
675
+ ▁level -8.62709
676
+ ▁Act -8.62953
677
+ ▁economic -8.63223
678
+ ▁political -8.63223
679
+ ▁example -8.63224
680
+ ▁After -8.63239
681
+ ▁2009 -8.63243
682
+ ▁become -8.63249
683
+ ▁data -8.6328
684
+ ▁support -8.63742
685
+ ▁Europe -8.63864
686
+ ▁because -8.64262
687
+ ▁effect -8.64262
688
+ ▁standard -8.64264
689
+ ▁south -8.64309
690
+ ▁European -8.65189
691
+ ▁class -8.6532
692
+ ▁various -8.65841
693
+ ▁York -8.65841
694
+ ▁company -8.65841
695
+ ▁modern -8.65842
696
+ ▁total -8.65873
697
+ ▁back -8.66028
698
+ ization -8.66893
699
+ ▁tax -8.66965
700
+ ▁among -8.67466
701
+ ▁continu -8.67987
702
+ ▁remain -8.67997
703
+ ▁Union -8.67998
704
+ ▁Earth -8.68
705
+ ▁market -8.6853
706
+ ▁multi -8.69089
707
+ K -8.69409
708
+ é -8.69626
709
+ ▁third -8.69627
710
+ ▁control -8.6963
711
+ ▁north -8.69726
712
+ ▁computer -8.70178
713
+ mission -8.70196
714
+ ▁Republic -8.70734
715
+ ▁military -8.71292
716
+ ▁version -8.7186
717
+ ▁six -8.71863
718
+ ological -8.71869
719
+ spect -8.72371
720
+ ▁However -8.72419
721
+ ▁individual -8.72419
722
+ ▁device -8.72421
723
+ ▁Japan -8.72421
724
+ ▁federal -8.72422
725
+ ▁like -8.72453
726
+ ▁word -8.73044
727
+ ▁make -8.73128
728
+ ▁allow -8.73458
729
+ ▁located -8.73561
730
+ Z -8.74133
731
+ ▁Great -8.74153
732
+ ▁open -8.74226
733
+ ▁Roman -8.74916
734
+ ▁office -8.74921
735
+ ▁Canada -8.75293
736
+ ▁East -8.75446
737
+ ▁though -8.75472
738
+ ▁100 -8.75545
739
+ ootball -8.75878
740
+ ▁2008 -8.76485
741
+ rmal -8.76922
742
+ ▁establish -8.77653
743
+ ▁addition -8.78253
744
+ field -8.78262
745
+ ▁estimate -8.78858
746
+ ▁species -8.7946
747
+ ▁civil -8.79464
748
+ ▁video -8.79465
749
+ ▁issue -8.80662
750
+ ▁January -8.80683
751
+ ▁against -8.80684
752
+ ograph -8.80684
753
+ ▁along -8.80688
754
+ ▁title -8.80721
755
+ ▁special -8.81301
756
+ ▁engine -8.81301
757
+ ▁colon -8.81368
758
+ ▁specific -8.81922
759
+ ▁tradition -8.82547
760
+ ▁international -8.82547
761
+ ▁qua -8.83622
762
+ ▁April -8.83809
763
+ ▁Some -8.83892
764
+ ▁school -8.84446
765
+ ▁measure -8.84447
766
+ ▁free -8.84828
767
+ ▁League -8.85087
768
+ ▁family -8.85087
769
+ ▁worldwide -8.85087
770
+ ▁element -8.85097
771
+ ▁although -8.85732
772
+ ▁House -8.85756
773
+ ▁food -8.86383
774
+ ▁particular -8.87035
775
+ ▁Kingdom -8.87035
776
+ ▁Congress -8.87035
777
+ ▁social -8.87701
778
+ ▁July -8.8772
779
+ & -8.88355
780
+ ▁California -8.88355
781
+ ▁June -8.88382
782
+ ▁range -8.88441
783
+ cycl -8.88772
784
+ ▁sometime -8.89091
785
+ uff -8.89115
786
+ ▁consist -8.89121
787
+ ▁held -8.8913
788
+ ▁describe -8.91049
789
+ ▁written -8.91052
790
+ ▁source -8.91054
791
+ ▁space -8.91088
792
+ ▁origin -8.91407
793
+ ▁network -8.91734
794
+ ▁author -8.91735
795
+ ability -8.91736
796
+ ▁function -8.91737
797
+ ▁treat -8.91873
798
+ ▁India -8.92403
799
+ ▁November -8.92423
800
+ ▁increase -8.92423
801
+ ▁artist -8.92428
802
+ ▁2007 -8.92446
803
+ ▁culture -8.93126
804
+ ▁Super -8.93138
805
+ ▁Christian -8.93817
806
+ ▁super -8.94533
807
+ ▁associat -8.95231
808
+ ▁blood -8.95945
809
+ town -8.96151
810
+ ▁natural -8.97389
811
+ ▁France -8.97399
812
+ dependent -8.98119
813
+ ▁vitamin -8.98119
814
+ ▁animal -8.9814
815
+ ▁model -8.98146
816
+ ▁rock -8.98175
817
+ ▁Australia -8.98854
818
+ ▁September -8.98854
819
+ ▁business -8.98854
820
+ ▁significant -8.99595
821
+ ▁University -9.00341
822
+ ▁organization -9.00341
823
+ ▁education -9.00342
824
+ ▁throughout -9.00344
825
+ ▁compet -9.00347
826
+ ification -9.011
827
+ ▁story -9.01217
828
+ ▁International -9.0185
829
+ ▁important -9.0185
830
+ ▁research -9.01851
831
+ ▁2006 -9.01876
832
+ ▁career -9.01964
833
+ ▁October -9.03383
834
+ ▁August -9.03384
835
+ ▁women -9.03391
836
+ ▁Although -9.04158
837
+ ▁initial -9.04197
838
+ ▁full -9.04731
839
+ ▁billion -9.04943
840
+ ▁novel -9.04949
841
+ ▁limit -9.0573
842
+ ▁Washington -9.0652
843
+ ▁Bowl -9.06552
844
+ ▁global -9.07321
845
+ ▁widely -9.07326
846
+ ▁another -9.07342
847
+ ▁England -9.08127
848
+ ▁disease -9.08128
849
+ ▁With -9.08167
850
+ ▁media -9.0849
851
+ ▁surface -9.0894
852
+ ▁oppos -9.08941
853
+ ▁Qu -9.09002
854
+ ▁collect -9.09766
855
+ ▁Since -9.09805
856
+ ▁help -9.10654
857
+ ▁release -9.11081
858
+ ▁close -9.11479
859
+ rough -9.1175
860
+ ▁similar -9.1226
861
+ ▁French -9.1226
862
+ ▁white -9.12262
863
+ ▁election -9.12265
864
+ ▁information -9.12268
865
+ ▁employ -9.13107
866
+ ▁influence -9.13107
867
+ ▁capital -9.13107
868
+ ▁regard -9.13122
869
+ ▁children -9.13962
870
+ ▁episode -9.13962
871
+ ▁Greek -9.13962
872
+ ▁return -9.13964
873
+ ▁1990 -9.13968
874
+ ▁What -9.13984
875
+ ▁making -9.1399
876
+ ▁given -9.13997
877
+ J -9.1477
878
+ ▁February -9.14824
879
+ ▁amount -9.14824
880
+ ▁psych -9.14827
881
+ ▁application -9.15694
882
+ ▁replac -9.15695
883
+ ▁value -9.15699
884
+ ▁every -9.15723
885
+ produc -9.15995
886
+ ▁December -9.16571
887
+ ▁typically -9.16571
888
+ ▁movement -9.16573
889
+ ▁left -9.16578
890
+ ▁however -9.1658
891
+ ▁previous -9.17456
892
+ ▁claim -9.17462
893
+ ▁Windows -9.18349
894
+ ▁observ -9.18349
895
+ ▁material -9.18349
896
+ ▁object -9.19249
897
+ ▁professional -9.19249
898
+ wood -9.19263
899
+ ▁local -9.19306
900
+ ▁trade -9.1939
901
+ ▁Internet -9.20159
902
+ ought -9.20434
903
+ ▁especial -9.21076
904
+ ▁Western -9.21076
905
+ ▁either -9.21083
906
+ pproximate -9.22002
907
+ ▁County -9.22002
908
+ ▁primary -9.22936
909
+ ▁property -9.22936
910
+ ▁account -9.22937
911
+ ▁separate -9.22938
912
+ ▁factor -9.22948
913
+ ▁down -9.22964
914
+ ▁commercial -9.2388
915
+ ▁structure -9.24835
916
+ ▁economy -9.26765
917
+ ▁pressure -9.26765
918
+ ▁attack -9.26776
919
+ ▁condition -9.26778
920
+ ▁decade -9.26783
921
+ ▁week -9.26791
922
+ ▁Confederate -9.27745
923
+ ▁complete -9.27745
924
+ ▁Spanish -9.28735
925
+ ▁across -9.28736
926
+ ▁growth -9.28736
927
+ ▁central -9.28738
928
+ ▁available -9.29735
929
+ ▁certain -9.29735
930
+ ▁2013 -9.29736
931
+ ▁You -9.29745
932
+ ▁Whil -9.30017
933
+ ▁primari -9.30745
934
+ ▁contribut -9.31766
935
+ ▁Party -9.31768
936
+ ▁drug -9.31777
937
+ ▁Democrat -9.32797
938
+ ▁campaign -9.32797
939
+ ▁subsequent -9.32797
940
+ ▁focus -9.32797
941
+ ▁elected -9.32798
942
+ craft -9.32802
943
+ NFL -9.32802
944
+ ▁environment -9.33838
945
+ ▁chemical -9.33839
946
+ ▁entire -9.33845
947
+ ▁radio -9.34074
948
+ ▁William -9.34891
949
+ ▁complex -9.34891
950
+ ▁financial -9.35955
951
+ ▁George -9.35955
952
+ ▁league -9.35955
953
+ ▁policy -9.35956
954
+ ▁project -9.35956
955
+ ▁compos -9.35958
956
+ ▁litera -9.36277
957
+ ▁physical -9.3703
958
+ ▁historical -9.3703
959
+ ▁hydro -9.37031
960
+ ▁defeat -9.37041
961
+ ▁regulat -9.37057
962
+ ▁According -9.38117
963
+ ▁method -9.38117
964
+ ▁generat -9.38195
965
+ known -9.39007
966
+ ▁celebrat -9.39216
967
+ ▁built -9.39216
968
+ ▁practice -9.40327
969
+ ▁purpose -9.41451
970
+ ▁credit -9.41452
971
+ ▁affect -9.42587
972
+ ▁degree -9.4259
973
+ ▁beginning -9.43736
974
+ ▁symbol -9.43736
975
+ ▁science -9.43738
976
+ ▁Central -9.449
977
+ ▁industry -9.46076
978
+ ▁private -9.46076
979
+ ▁subject -9.46076
980
+ ▁western -9.46076
981
+ ▁district -9.47266
982
+ ▁community -9.47266
983
+ ▁problem -9.47266
984
+ ▁determine -9.47268
985
+ ▁Constitution -9.48471
986
+ ▁Texas -9.48471
987
+ ▁distinct -9.48476
988
+ ▁except -9.48476
989
+ ▁Association -9.4969
990
+ ▁institution -9.4969
991
+ ▁nuclear -9.4969
992
+ ▁technology -9.4969
993
+ ▁Empire -9.49691
994
+ ▁regular -9.49691
995
+ ▁concept -9.49694
996
+ ▁Mexico -9.50925
997
+ ▁announced -9.50925
998
+ Q -9.69917
999
+ q -9.90537
1000
+ ( -9.98015