mort666 commited on
Commit
467e8c2
1 Parent(s): 61fd538
Files changed (5) hide show
  1. README.md +140 -0
  2. config.json +1390 -0
  3. model.bin +3 -0
  4. tokenizer.json +0 -0
  5. vocabulary.txt +0 -0
README.md ADDED
@@ -0,0 +1,140 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - en
4
+ - zh
5
+ - de
6
+ - es
7
+ - ru
8
+ - ko
9
+ - fr
10
+ - ja
11
+ - pt
12
+ - tr
13
+ - pl
14
+ - ca
15
+ - nl
16
+ - ar
17
+ - sv
18
+ - it
19
+ - id
20
+ - hi
21
+ - fi
22
+ - vi
23
+ - he
24
+ - uk
25
+ - el
26
+ - ms
27
+ - cs
28
+ - ro
29
+ - da
30
+ - hu
31
+ - ta
32
+ - 'no'
33
+ - th
34
+ - ur
35
+ - hr
36
+ - bg
37
+ - lt
38
+ - la
39
+ - mi
40
+ - ml
41
+ - cy
42
+ - sk
43
+ - te
44
+ - fa
45
+ - lv
46
+ - bn
47
+ - sr
48
+ - az
49
+ - sl
50
+ - kn
51
+ - et
52
+ - mk
53
+ - br
54
+ - eu
55
+ - is
56
+ - hy
57
+ - ne
58
+ - mn
59
+ - bs
60
+ - kk
61
+ - sq
62
+ - sw
63
+ - gl
64
+ - mr
65
+ - pa
66
+ - si
67
+ - km
68
+ - sn
69
+ - yo
70
+ - so
71
+ - af
72
+ - oc
73
+ - ka
74
+ - be
75
+ - tg
76
+ - sd
77
+ - gu
78
+ - am
79
+ - yi
80
+ - lo
81
+ - uz
82
+ - fo
83
+ - ht
84
+ - ps
85
+ - tk
86
+ - nn
87
+ - mt
88
+ - sa
89
+ - lb
90
+ - my
91
+ - bo
92
+ - tl
93
+ - mg
94
+ - as
95
+ - tt
96
+ - haw
97
+ - ln
98
+ - ha
99
+ - ba
100
+ - jw
101
+ - su
102
+ tags:
103
+ - audio
104
+ - automatic-speech-recognition
105
+ license: mit
106
+ library_name: ctranslate2
107
+ ---
108
+
109
+ # Whisper large-v2 model for CTranslate2
110
+
111
+ This repository contains the conversion of [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) to the [CTranslate2](https://github.com/OpenNMT/CTranslate2) model format.
112
+
113
+ This model can be used in CTranslate2 or projects based on CTranslate2 such as [faster-whisper](https://github.com/guillaumekln/faster-whisper).
114
+
115
+ ## Example
116
+
117
+ ```python
118
+ from faster_whisper import WhisperModel
119
+
120
+ model = WhisperModel("large-v2")
121
+
122
+ segments, info = model.transcribe("audio.mp3")
123
+ for segment in segments:
124
+ print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))
125
+ ```
126
+
127
+ ## Conversion details
128
+
129
+ The original model was converted with the following command:
130
+
131
+ ```
132
+ ct2-transformers-converter --model openai/whisper-large-v2 --output_dir faster-whisper-large-v2 \
133
+ --copy_files tokenizer.json --quantization float16
134
+ ```
135
+
136
+ Note that the model weights are saved in FP16. This type can be changed when the model is loaded using the [`compute_type` option in CTranslate2](https://opennmt.net/CTranslate2/quantization.html).
137
+
138
+ ## More information
139
+
140
+ **For more information about the original model, see its [model card](https://huggingface.co/openai/whisper-large-v2).**
config.json ADDED
@@ -0,0 +1,1390 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "alignment_heads": [
3
+ [
4
+ 16,
5
+ 0
6
+ ],
7
+ [
8
+ 16,
9
+ 1
10
+ ],
11
+ [
12
+ 16,
13
+ 2
14
+ ],
15
+ [
16
+ 16,
17
+ 3
18
+ ],
19
+ [
20
+ 16,
21
+ 4
22
+ ],
23
+ [
24
+ 16,
25
+ 5
26
+ ],
27
+ [
28
+ 16,
29
+ 6
30
+ ],
31
+ [
32
+ 16,
33
+ 7
34
+ ],
35
+ [
36
+ 16,
37
+ 8
38
+ ],
39
+ [
40
+ 16,
41
+ 9
42
+ ],
43
+ [
44
+ 16,
45
+ 10
46
+ ],
47
+ [
48
+ 16,
49
+ 11
50
+ ],
51
+ [
52
+ 16,
53
+ 12
54
+ ],
55
+ [
56
+ 16,
57
+ 13
58
+ ],
59
+ [
60
+ 16,
61
+ 14
62
+ ],
63
+ [
64
+ 16,
65
+ 15
66
+ ],
67
+ [
68
+ 16,
69
+ 16
70
+ ],
71
+ [
72
+ 16,
73
+ 17
74
+ ],
75
+ [
76
+ 16,
77
+ 18
78
+ ],
79
+ [
80
+ 16,
81
+ 19
82
+ ],
83
+ [
84
+ 17,
85
+ 0
86
+ ],
87
+ [
88
+ 17,
89
+ 1
90
+ ],
91
+ [
92
+ 17,
93
+ 2
94
+ ],
95
+ [
96
+ 17,
97
+ 3
98
+ ],
99
+ [
100
+ 17,
101
+ 4
102
+ ],
103
+ [
104
+ 17,
105
+ 5
106
+ ],
107
+ [
108
+ 17,
109
+ 6
110
+ ],
111
+ [
112
+ 17,
113
+ 7
114
+ ],
115
+ [
116
+ 17,
117
+ 8
118
+ ],
119
+ [
120
+ 17,
121
+ 9
122
+ ],
123
+ [
124
+ 17,
125
+ 10
126
+ ],
127
+ [
128
+ 17,
129
+ 11
130
+ ],
131
+ [
132
+ 17,
133
+ 12
134
+ ],
135
+ [
136
+ 17,
137
+ 13
138
+ ],
139
+ [
140
+ 17,
141
+ 14
142
+ ],
143
+ [
144
+ 17,
145
+ 15
146
+ ],
147
+ [
148
+ 17,
149
+ 16
150
+ ],
151
+ [
152
+ 17,
153
+ 17
154
+ ],
155
+ [
156
+ 17,
157
+ 18
158
+ ],
159
+ [
160
+ 17,
161
+ 19
162
+ ],
163
+ [
164
+ 18,
165
+ 0
166
+ ],
167
+ [
168
+ 18,
169
+ 1
170
+ ],
171
+ [
172
+ 18,
173
+ 2
174
+ ],
175
+ [
176
+ 18,
177
+ 3
178
+ ],
179
+ [
180
+ 18,
181
+ 4
182
+ ],
183
+ [
184
+ 18,
185
+ 5
186
+ ],
187
+ [
188
+ 18,
189
+ 6
190
+ ],
191
+ [
192
+ 18,
193
+ 7
194
+ ],
195
+ [
196
+ 18,
197
+ 8
198
+ ],
199
+ [
200
+ 18,
201
+ 9
202
+ ],
203
+ [
204
+ 18,
205
+ 10
206
+ ],
207
+ [
208
+ 18,
209
+ 11
210
+ ],
211
+ [
212
+ 18,
213
+ 12
214
+ ],
215
+ [
216
+ 18,
217
+ 13
218
+ ],
219
+ [
220
+ 18,
221
+ 14
222
+ ],
223
+ [
224
+ 18,
225
+ 15
226
+ ],
227
+ [
228
+ 18,
229
+ 16
230
+ ],
231
+ [
232
+ 18,
233
+ 17
234
+ ],
235
+ [
236
+ 18,
237
+ 18
238
+ ],
239
+ [
240
+ 18,
241
+ 19
242
+ ],
243
+ [
244
+ 19,
245
+ 0
246
+ ],
247
+ [
248
+ 19,
249
+ 1
250
+ ],
251
+ [
252
+ 19,
253
+ 2
254
+ ],
255
+ [
256
+ 19,
257
+ 3
258
+ ],
259
+ [
260
+ 19,
261
+ 4
262
+ ],
263
+ [
264
+ 19,
265
+ 5
266
+ ],
267
+ [
268
+ 19,
269
+ 6
270
+ ],
271
+ [
272
+ 19,
273
+ 7
274
+ ],
275
+ [
276
+ 19,
277
+ 8
278
+ ],
279
+ [
280
+ 19,
281
+ 9
282
+ ],
283
+ [
284
+ 19,
285
+ 10
286
+ ],
287
+ [
288
+ 19,
289
+ 11
290
+ ],
291
+ [
292
+ 19,
293
+ 12
294
+ ],
295
+ [
296
+ 19,
297
+ 13
298
+ ],
299
+ [
300
+ 19,
301
+ 14
302
+ ],
303
+ [
304
+ 19,
305
+ 15
306
+ ],
307
+ [
308
+ 19,
309
+ 16
310
+ ],
311
+ [
312
+ 19,
313
+ 17
314
+ ],
315
+ [
316
+ 19,
317
+ 18
318
+ ],
319
+ [
320
+ 19,
321
+ 19
322
+ ],
323
+ [
324
+ 20,
325
+ 0
326
+ ],
327
+ [
328
+ 20,
329
+ 1
330
+ ],
331
+ [
332
+ 20,
333
+ 2
334
+ ],
335
+ [
336
+ 20,
337
+ 3
338
+ ],
339
+ [
340
+ 20,
341
+ 4
342
+ ],
343
+ [
344
+ 20,
345
+ 5
346
+ ],
347
+ [
348
+ 20,
349
+ 6
350
+ ],
351
+ [
352
+ 20,
353
+ 7
354
+ ],
355
+ [
356
+ 20,
357
+ 8
358
+ ],
359
+ [
360
+ 20,
361
+ 9
362
+ ],
363
+ [
364
+ 20,
365
+ 10
366
+ ],
367
+ [
368
+ 20,
369
+ 11
370
+ ],
371
+ [
372
+ 20,
373
+ 12
374
+ ],
375
+ [
376
+ 20,
377
+ 13
378
+ ],
379
+ [
380
+ 20,
381
+ 14
382
+ ],
383
+ [
384
+ 20,
385
+ 15
386
+ ],
387
+ [
388
+ 20,
389
+ 16
390
+ ],
391
+ [
392
+ 20,
393
+ 17
394
+ ],
395
+ [
396
+ 20,
397
+ 18
398
+ ],
399
+ [
400
+ 20,
401
+ 19
402
+ ],
403
+ [
404
+ 21,
405
+ 0
406
+ ],
407
+ [
408
+ 21,
409
+ 1
410
+ ],
411
+ [
412
+ 21,
413
+ 2
414
+ ],
415
+ [
416
+ 21,
417
+ 3
418
+ ],
419
+ [
420
+ 21,
421
+ 4
422
+ ],
423
+ [
424
+ 21,
425
+ 5
426
+ ],
427
+ [
428
+ 21,
429
+ 6
430
+ ],
431
+ [
432
+ 21,
433
+ 7
434
+ ],
435
+ [
436
+ 21,
437
+ 8
438
+ ],
439
+ [
440
+ 21,
441
+ 9
442
+ ],
443
+ [
444
+ 21,
445
+ 10
446
+ ],
447
+ [
448
+ 21,
449
+ 11
450
+ ],
451
+ [
452
+ 21,
453
+ 12
454
+ ],
455
+ [
456
+ 21,
457
+ 13
458
+ ],
459
+ [
460
+ 21,
461
+ 14
462
+ ],
463
+ [
464
+ 21,
465
+ 15
466
+ ],
467
+ [
468
+ 21,
469
+ 16
470
+ ],
471
+ [
472
+ 21,
473
+ 17
474
+ ],
475
+ [
476
+ 21,
477
+ 18
478
+ ],
479
+ [
480
+ 21,
481
+ 19
482
+ ],
483
+ [
484
+ 22,
485
+ 0
486
+ ],
487
+ [
488
+ 22,
489
+ 1
490
+ ],
491
+ [
492
+ 22,
493
+ 2
494
+ ],
495
+ [
496
+ 22,
497
+ 3
498
+ ],
499
+ [
500
+ 22,
501
+ 4
502
+ ],
503
+ [
504
+ 22,
505
+ 5
506
+ ],
507
+ [
508
+ 22,
509
+ 6
510
+ ],
511
+ [
512
+ 22,
513
+ 7
514
+ ],
515
+ [
516
+ 22,
517
+ 8
518
+ ],
519
+ [
520
+ 22,
521
+ 9
522
+ ],
523
+ [
524
+ 22,
525
+ 10
526
+ ],
527
+ [
528
+ 22,
529
+ 11
530
+ ],
531
+ [
532
+ 22,
533
+ 12
534
+ ],
535
+ [
536
+ 22,
537
+ 13
538
+ ],
539
+ [
540
+ 22,
541
+ 14
542
+ ],
543
+ [
544
+ 22,
545
+ 15
546
+ ],
547
+ [
548
+ 22,
549
+ 16
550
+ ],
551
+ [
552
+ 22,
553
+ 17
554
+ ],
555
+ [
556
+ 22,
557
+ 18
558
+ ],
559
+ [
560
+ 22,
561
+ 19
562
+ ],
563
+ [
564
+ 23,
565
+ 0
566
+ ],
567
+ [
568
+ 23,
569
+ 1
570
+ ],
571
+ [
572
+ 23,
573
+ 2
574
+ ],
575
+ [
576
+ 23,
577
+ 3
578
+ ],
579
+ [
580
+ 23,
581
+ 4
582
+ ],
583
+ [
584
+ 23,
585
+ 5
586
+ ],
587
+ [
588
+ 23,
589
+ 6
590
+ ],
591
+ [
592
+ 23,
593
+ 7
594
+ ],
595
+ [
596
+ 23,
597
+ 8
598
+ ],
599
+ [
600
+ 23,
601
+ 9
602
+ ],
603
+ [
604
+ 23,
605
+ 10
606
+ ],
607
+ [
608
+ 23,
609
+ 11
610
+ ],
611
+ [
612
+ 23,
613
+ 12
614
+ ],
615
+ [
616
+ 23,
617
+ 13
618
+ ],
619
+ [
620
+ 23,
621
+ 14
622
+ ],
623
+ [
624
+ 23,
625
+ 15
626
+ ],
627
+ [
628
+ 23,
629
+ 16
630
+ ],
631
+ [
632
+ 23,
633
+ 17
634
+ ],
635
+ [
636
+ 23,
637
+ 18
638
+ ],
639
+ [
640
+ 23,
641
+ 19
642
+ ],
643
+ [
644
+ 24,
645
+ 0
646
+ ],
647
+ [
648
+ 24,
649
+ 1
650
+ ],
651
+ [
652
+ 24,
653
+ 2
654
+ ],
655
+ [
656
+ 24,
657
+ 3
658
+ ],
659
+ [
660
+ 24,
661
+ 4
662
+ ],
663
+ [
664
+ 24,
665
+ 5
666
+ ],
667
+ [
668
+ 24,
669
+ 6
670
+ ],
671
+ [
672
+ 24,
673
+ 7
674
+ ],
675
+ [
676
+ 24,
677
+ 8
678
+ ],
679
+ [
680
+ 24,
681
+ 9
682
+ ],
683
+ [
684
+ 24,
685
+ 10
686
+ ],
687
+ [
688
+ 24,
689
+ 11
690
+ ],
691
+ [
692
+ 24,
693
+ 12
694
+ ],
695
+ [
696
+ 24,
697
+ 13
698
+ ],
699
+ [
700
+ 24,
701
+ 14
702
+ ],
703
+ [
704
+ 24,
705
+ 15
706
+ ],
707
+ [
708
+ 24,
709
+ 16
710
+ ],
711
+ [
712
+ 24,
713
+ 17
714
+ ],
715
+ [
716
+ 24,
717
+ 18
718
+ ],
719
+ [
720
+ 24,
721
+ 19
722
+ ],
723
+ [
724
+ 25,
725
+ 0
726
+ ],
727
+ [
728
+ 25,
729
+ 1
730
+ ],
731
+ [
732
+ 25,
733
+ 2
734
+ ],
735
+ [
736
+ 25,
737
+ 3
738
+ ],
739
+ [
740
+ 25,
741
+ 4
742
+ ],
743
+ [
744
+ 25,
745
+ 5
746
+ ],
747
+ [
748
+ 25,
749
+ 6
750
+ ],
751
+ [
752
+ 25,
753
+ 7
754
+ ],
755
+ [
756
+ 25,
757
+ 8
758
+ ],
759
+ [
760
+ 25,
761
+ 9
762
+ ],
763
+ [
764
+ 25,
765
+ 10
766
+ ],
767
+ [
768
+ 25,
769
+ 11
770
+ ],
771
+ [
772
+ 25,
773
+ 12
774
+ ],
775
+ [
776
+ 25,
777
+ 13
778
+ ],
779
+ [
780
+ 25,
781
+ 14
782
+ ],
783
+ [
784
+ 25,
785
+ 15
786
+ ],
787
+ [
788
+ 25,
789
+ 16
790
+ ],
791
+ [
792
+ 25,
793
+ 17
794
+ ],
795
+ [
796
+ 25,
797
+ 18
798
+ ],
799
+ [
800
+ 25,
801
+ 19
802
+ ],
803
+ [
804
+ 26,
805
+ 0
806
+ ],
807
+ [
808
+ 26,
809
+ 1
810
+ ],
811
+ [
812
+ 26,
813
+ 2
814
+ ],
815
+ [
816
+ 26,
817
+ 3
818
+ ],
819
+ [
820
+ 26,
821
+ 4
822
+ ],
823
+ [
824
+ 26,
825
+ 5
826
+ ],
827
+ [
828
+ 26,
829
+ 6
830
+ ],
831
+ [
832
+ 26,
833
+ 7
834
+ ],
835
+ [
836
+ 26,
837
+ 8
838
+ ],
839
+ [
840
+ 26,
841
+ 9
842
+ ],
843
+ [
844
+ 26,
845
+ 10
846
+ ],
847
+ [
848
+ 26,
849
+ 11
850
+ ],
851
+ [
852
+ 26,
853
+ 12
854
+ ],
855
+ [
856
+ 26,
857
+ 13
858
+ ],
859
+ [
860
+ 26,
861
+ 14
862
+ ],
863
+ [
864
+ 26,
865
+ 15
866
+ ],
867
+ [
868
+ 26,
869
+ 16
870
+ ],
871
+ [
872
+ 26,
873
+ 17
874
+ ],
875
+ [
876
+ 26,
877
+ 18
878
+ ],
879
+ [
880
+ 26,
881
+ 19
882
+ ],
883
+ [
884
+ 27,
885
+ 0
886
+ ],
887
+ [
888
+ 27,
889
+ 1
890
+ ],
891
+ [
892
+ 27,
893
+ 2
894
+ ],
895
+ [
896
+ 27,
897
+ 3
898
+ ],
899
+ [
900
+ 27,
901
+ 4
902
+ ],
903
+ [
904
+ 27,
905
+ 5
906
+ ],
907
+ [
908
+ 27,
909
+ 6
910
+ ],
911
+ [
912
+ 27,
913
+ 7
914
+ ],
915
+ [
916
+ 27,
917
+ 8
918
+ ],
919
+ [
920
+ 27,
921
+ 9
922
+ ],
923
+ [
924
+ 27,
925
+ 10
926
+ ],
927
+ [
928
+ 27,
929
+ 11
930
+ ],
931
+ [
932
+ 27,
933
+ 12
934
+ ],
935
+ [
936
+ 27,
937
+ 13
938
+ ],
939
+ [
940
+ 27,
941
+ 14
942
+ ],
943
+ [
944
+ 27,
945
+ 15
946
+ ],
947
+ [
948
+ 27,
949
+ 16
950
+ ],
951
+ [
952
+ 27,
953
+ 17
954
+ ],
955
+ [
956
+ 27,
957
+ 18
958
+ ],
959
+ [
960
+ 27,
961
+ 19
962
+ ],
963
+ [
964
+ 28,
965
+ 0
966
+ ],
967
+ [
968
+ 28,
969
+ 1
970
+ ],
971
+ [
972
+ 28,
973
+ 2
974
+ ],
975
+ [
976
+ 28,
977
+ 3
978
+ ],
979
+ [
980
+ 28,
981
+ 4
982
+ ],
983
+ [
984
+ 28,
985
+ 5
986
+ ],
987
+ [
988
+ 28,
989
+ 6
990
+ ],
991
+ [
992
+ 28,
993
+ 7
994
+ ],
995
+ [
996
+ 28,
997
+ 8
998
+ ],
999
+ [
1000
+ 28,
1001
+ 9
1002
+ ],
1003
+ [
1004
+ 28,
1005
+ 10
1006
+ ],
1007
+ [
1008
+ 28,
1009
+ 11
1010
+ ],
1011
+ [
1012
+ 28,
1013
+ 12
1014
+ ],
1015
+ [
1016
+ 28,
1017
+ 13
1018
+ ],
1019
+ [
1020
+ 28,
1021
+ 14
1022
+ ],
1023
+ [
1024
+ 28,
1025
+ 15
1026
+ ],
1027
+ [
1028
+ 28,
1029
+ 16
1030
+ ],
1031
+ [
1032
+ 28,
1033
+ 17
1034
+ ],
1035
+ [
1036
+ 28,
1037
+ 18
1038
+ ],
1039
+ [
1040
+ 28,
1041
+ 19
1042
+ ],
1043
+ [
1044
+ 29,
1045
+ 0
1046
+ ],
1047
+ [
1048
+ 29,
1049
+ 1
1050
+ ],
1051
+ [
1052
+ 29,
1053
+ 2
1054
+ ],
1055
+ [
1056
+ 29,
1057
+ 3
1058
+ ],
1059
+ [
1060
+ 29,
1061
+ 4
1062
+ ],
1063
+ [
1064
+ 29,
1065
+ 5
1066
+ ],
1067
+ [
1068
+ 29,
1069
+ 6
1070
+ ],
1071
+ [
1072
+ 29,
1073
+ 7
1074
+ ],
1075
+ [
1076
+ 29,
1077
+ 8
1078
+ ],
1079
+ [
1080
+ 29,
1081
+ 9
1082
+ ],
1083
+ [
1084
+ 29,
1085
+ 10
1086
+ ],
1087
+ [
1088
+ 29,
1089
+ 11
1090
+ ],
1091
+ [
1092
+ 29,
1093
+ 12
1094
+ ],
1095
+ [
1096
+ 29,
1097
+ 13
1098
+ ],
1099
+ [
1100
+ 29,
1101
+ 14
1102
+ ],
1103
+ [
1104
+ 29,
1105
+ 15
1106
+ ],
1107
+ [
1108
+ 29,
1109
+ 16
1110
+ ],
1111
+ [
1112
+ 29,
1113
+ 17
1114
+ ],
1115
+ [
1116
+ 29,
1117
+ 18
1118
+ ],
1119
+ [
1120
+ 29,
1121
+ 19
1122
+ ],
1123
+ [
1124
+ 30,
1125
+ 0
1126
+ ],
1127
+ [
1128
+ 30,
1129
+ 1
1130
+ ],
1131
+ [
1132
+ 30,
1133
+ 2
1134
+ ],
1135
+ [
1136
+ 30,
1137
+ 3
1138
+ ],
1139
+ [
1140
+ 30,
1141
+ 4
1142
+ ],
1143
+ [
1144
+ 30,
1145
+ 5
1146
+ ],
1147
+ [
1148
+ 30,
1149
+ 6
1150
+ ],
1151
+ [
1152
+ 30,
1153
+ 7
1154
+ ],
1155
+ [
1156
+ 30,
1157
+ 8
1158
+ ],
1159
+ [
1160
+ 30,
1161
+ 9
1162
+ ],
1163
+ [
1164
+ 30,
1165
+ 10
1166
+ ],
1167
+ [
1168
+ 30,
1169
+ 11
1170
+ ],
1171
+ [
1172
+ 30,
1173
+ 12
1174
+ ],
1175
+ [
1176
+ 30,
1177
+ 13
1178
+ ],
1179
+ [
1180
+ 30,
1181
+ 14
1182
+ ],
1183
+ [
1184
+ 30,
1185
+ 15
1186
+ ],
1187
+ [
1188
+ 30,
1189
+ 16
1190
+ ],
1191
+ [
1192
+ 30,
1193
+ 17
1194
+ ],
1195
+ [
1196
+ 30,
1197
+ 18
1198
+ ],
1199
+ [
1200
+ 30,
1201
+ 19
1202
+ ],
1203
+ [
1204
+ 31,
1205
+ 0
1206
+ ],
1207
+ [
1208
+ 31,
1209
+ 1
1210
+ ],
1211
+ [
1212
+ 31,
1213
+ 2
1214
+ ],
1215
+ [
1216
+ 31,
1217
+ 3
1218
+ ],
1219
+ [
1220
+ 31,
1221
+ 4
1222
+ ],
1223
+ [
1224
+ 31,
1225
+ 5
1226
+ ],
1227
+ [
1228
+ 31,
1229
+ 6
1230
+ ],
1231
+ [
1232
+ 31,
1233
+ 7
1234
+ ],
1235
+ [
1236
+ 31,
1237
+ 8
1238
+ ],
1239
+ [
1240
+ 31,
1241
+ 9
1242
+ ],
1243
+ [
1244
+ 31,
1245
+ 10
1246
+ ],
1247
+ [
1248
+ 31,
1249
+ 11
1250
+ ],
1251
+ [
1252
+ 31,
1253
+ 12
1254
+ ],
1255
+ [
1256
+ 31,
1257
+ 13
1258
+ ],
1259
+ [
1260
+ 31,
1261
+ 14
1262
+ ],
1263
+ [
1264
+ 31,
1265
+ 15
1266
+ ],
1267
+ [
1268
+ 31,
1269
+ 16
1270
+ ],
1271
+ [
1272
+ 31,
1273
+ 17
1274
+ ],
1275
+ [
1276
+ 31,
1277
+ 18
1278
+ ],
1279
+ [
1280
+ 31,
1281
+ 19
1282
+ ]
1283
+ ],
1284
+ "lang_ids": [
1285
+ 50259,
1286
+ 50260,
1287
+ 50261,
1288
+ 50262,
1289
+ 50263,
1290
+ 50264,
1291
+ 50265,
1292
+ 50266,
1293
+ 50267,
1294
+ 50268,
1295
+ 50269,
1296
+ 50270,
1297
+ 50271,
1298
+ 50272,
1299
+ 50273,
1300
+ 50274,
1301
+ 50275,
1302
+ 50276,
1303
+ 50277,
1304
+ 50278,
1305
+ 50279,
1306
+ 50280,
1307
+ 50281,
1308
+ 50282,
1309
+ 50283,
1310
+ 50284,
1311
+ 50285,
1312
+ 50286,
1313
+ 50287,
1314
+ 50288,
1315
+ 50289,
1316
+ 50290,
1317
+ 50291,
1318
+ 50292,
1319
+ 50293,
1320
+ 50294,
1321
+ 50295,
1322
+ 50296,
1323
+ 50297,
1324
+ 50298,
1325
+ 50299,
1326
+ 50300,
1327
+ 50301,
1328
+ 50302,
1329
+ 50303,
1330
+ 50304,
1331
+ 50305,
1332
+ 50306,
1333
+ 50307,
1334
+ 50308,
1335
+ 50309,
1336
+ 50310,
1337
+ 50311,
1338
+ 50312,
1339
+ 50313,
1340
+ 50314,
1341
+ 50315,
1342
+ 50316,
1343
+ 50317,
1344
+ 50318,
1345
+ 50319,
1346
+ 50320,
1347
+ 50321,
1348
+ 50322,
1349
+ 50323,
1350
+ 50324,
1351
+ 50325,
1352
+ 50326,
1353
+ 50327,
1354
+ 50328,
1355
+ 50329,
1356
+ 50330,
1357
+ 50331,
1358
+ 50332,
1359
+ 50333,
1360
+ 50334,
1361
+ 50335,
1362
+ 50336,
1363
+ 50337,
1364
+ 50338,
1365
+ 50339,
1366
+ 50340,
1367
+ 50341,
1368
+ 50342,
1369
+ 50343,
1370
+ 50344,
1371
+ 50345,
1372
+ 50346,
1373
+ 50347,
1374
+ 50348,
1375
+ 50349,
1376
+ 50350,
1377
+ 50351,
1378
+ 50352,
1379
+ 50353,
1380
+ 50354,
1381
+ 50355,
1382
+ 50356,
1383
+ 50357
1384
+ ],
1385
+ "suppress_ids": null,
1386
+ "suppress_ids_begin": [
1387
+ 220,
1388
+ 50257
1389
+ ]
1390
+ }
model.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:349bd1f50dfd7086d4a0d4a5d9321acd8d4eddc7de7fd03f5bbaa6853d8edf4f
3
+ size 3086917906
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
vocabulary.txt ADDED
The diff for this file is too large to render. See raw diff