cmeraki commited on
Commit
8ac6e4c
1 Parent(s): 834b4ea

Upload tokenizer

Browse files
Files changed (5) hide show
  1. README.md +4 -4
  2. added_tokens.json +78 -78
  3. special_tokens_map.json +3 -21
  4. tokenizer.json +79 -79
  5. tokenizer_config.json +80 -80
README.md CHANGED
@@ -1,5 +1,6 @@
1
  ---
2
- license: cc-by-sa-4.0
 
3
  datasets:
4
  - speechcolab/gigaspeech
5
  - parler-tts/mls_eng_10k
@@ -11,10 +12,9 @@ datasets:
11
  language:
12
  - en
13
  - hi
14
- base_model:
15
- - openai-community/gpt2
16
- pipeline_tag: text-to-speech
17
  library_name: transformers
 
 
18
  ---
19
 
20
  | Platform | Link |
 
1
  ---
2
+ base_model:
3
+ - openai-community/gpt2
4
  datasets:
5
  - speechcolab/gigaspeech
6
  - parler-tts/mls_eng_10k
 
12
  language:
13
  - en
14
  - hi
 
 
 
15
  library_name: transformers
16
+ license: cc-by-sa-4.0
17
+ pipeline_tag: text-to-speech
18
  ---
19
 
20
  | Platform | Link |
added_tokens.json CHANGED
@@ -16386,85 +16386,85 @@
16386
  "[continue]": 66644,
16387
  "[convert]": 66643,
16388
  "[mimi]": 66642,
16389
- "[spkr_expresso_ex01]": 66698,
16390
- "[spkr_expresso_ex02]": 66695,
16391
- "[spkr_expresso_ex03]": 66696,
16392
- "[spkr_expresso_ex04]": 66697,
16393
- "[spkr_hifi_tts_6097]": 66693,
16394
- "[spkr_hifi_tts_9017]": 66692,
16395
- "[spkr_hifi_tts_92]": 66694,
16396
- "[spkr_jenny_jenny]": 66699,
16397
- "[spkr_mls_eng_10k_10191]": 66657,
16398
- "[spkr_mls_eng_10k_10244]": 66676,
16399
- "[spkr_mls_eng_10k_10463]": 66691,
16400
- "[spkr_mls_eng_10k_107]": 66664,
16401
- "[spkr_mls_eng_10k_10801]": 66648,
16402
- "[spkr_mls_eng_10k_11667]": 66671,
16403
- "[spkr_mls_eng_10k_11697]": 66658,
16404
- "[spkr_mls_eng_10k_1259]": 66665,
16405
- "[spkr_mls_eng_10k_1401]": 66659,
16406
- "[spkr_mls_eng_10k_1724]": 66669,
16407
- "[spkr_mls_eng_10k_204]": 66662,
16408
- "[spkr_mls_eng_10k_2156]": 66651,
16409
- "[spkr_mls_eng_10k_2234]": 66675,
16410
- "[spkr_mls_eng_10k_2607]": 66668,
16411
- "[spkr_mls_eng_10k_3003]": 66679,
16412
- "[spkr_mls_eng_10k_3157]": 66654,
16413
- "[spkr_mls_eng_10k_3488]": 66656,
16414
- "[spkr_mls_eng_10k_3595]": 66686,
16415
- "[spkr_mls_eng_10k_3645]": 66652,
16416
- "[spkr_mls_eng_10k_3657]": 66688,
16417
- "[spkr_mls_eng_10k_3681]": 66672,
16418
- "[spkr_mls_eng_10k_3699]": 66678,
16419
- "[spkr_mls_eng_10k_3967]": 66689,
16420
- "[spkr_mls_eng_10k_4018]": 66660,
16421
- "[spkr_mls_eng_10k_4064]": 66687,
16422
- "[spkr_mls_eng_10k_4078]": 66650,
16423
- "[spkr_mls_eng_10k_4174]": 66680,
16424
- "[spkr_mls_eng_10k_4788]": 66670,
16425
- "[spkr_mls_eng_10k_5304]": 66683,
16426
- "[spkr_mls_eng_10k_5717]": 66655,
16427
- "[spkr_mls_eng_10k_5968]": 66667,
16428
- "[spkr_mls_eng_10k_5985]": 66677,
16429
- "[spkr_mls_eng_10k_6454]": 66647,
16430
- "[spkr_mls_eng_10k_6497]": 66685,
16431
- "[spkr_mls_eng_10k_6660]": 66681,
16432
- "[spkr_mls_eng_10k_6670]": 66674,
16433
- "[spkr_mls_eng_10k_6671]": 66673,
16434
- "[spkr_mls_eng_10k_6687]": 66684,
16435
- "[spkr_mls_eng_10k_7756]": 66649,
16436
- "[spkr_mls_eng_10k_7879]": 66661,
16437
- "[spkr_mls_eng_10k_8011]": 66690,
16438
- "[spkr_mls_eng_10k_8138]": 66666,
16439
- "[spkr_mls_eng_10k_8677]": 66663,
16440
- "[spkr_mls_eng_10k_8713]": 66653,
16441
- "[spkr_mls_eng_10k_9017]": 66682,
16442
- "[spkr_shrutilipi_hi_shrutilipi]": 66720,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
16443
  "[spkr_unk]": 66646,
16444
- "[spkr_youtube_webds_en_akshat]": 66705,
16445
- "[spkr_youtube_webds_en_attenborough]": 66723,
16446
- "[spkr_youtube_webds_en_derekperkins]": 66721,
16447
- "[spkr_youtube_webds_en_historyofindia]": 66710,
16448
- "[spkr_youtube_webds_en_mkbhd]": 66714,
16449
- "[spkr_youtube_webds_en_mukesh]": 66722,
16450
- "[spkr_youtube_webds_en_secondhandstories]": 66715,
16451
- "[spkr_youtube_webds_en_storiesofmahabharatha]": 66716,
16452
- "[spkr_youtube_webds_en_teded]": 66703,
16453
- "[spkr_youtube_webds_hi_a2motivation]": 66717,
16454
- "[spkr_youtube_webds_hi_akshat]": 66719,
16455
- "[spkr_youtube_webds_hi_dhruvrathee]": 66706,
16456
- "[spkr_youtube_webds_hi_hindiaudiobooks]": 66709,
16457
- "[spkr_youtube_webds_hi_kabitaskitchen]": 66700,
16458
- "[spkr_youtube_webds_hi_mrbeast]": 66718,
16459
- "[spkr_youtube_webds_hi_neelimaaudiobooks]": 66707,
16460
- "[spkr_youtube_webds_hi_physicswallah]": 66704,
16461
- "[spkr_youtube_webds_hi_pmmodi]": 66713,
16462
- "[spkr_youtube_webds_hi_ranveerallahbadia]": 66708,
16463
- "[spkr_youtube_webds_hi_sandeepmaheshwari]": 66712,
16464
- "[spkr_youtube_webds_hi_technicalguruji]": 66702,
16465
- "[spkr_youtube_webds_hi_unacademyjee]": 66701,
16466
- "[spkr_youtube_webds_hi_vivekbindra]": 66711,
16467
- "[spkr_youtube_webds_hi_warikoo]": 66724,
16468
  "[stop]": 66645,
16469
  "[text]": 66641
16470
  }
 
16386
  "[continue]": 66644,
16387
  "[convert]": 66643,
16388
  "[mimi]": 66642,
16389
+ "[spkr_0]": 66647,
16390
+ "[spkr_10]": 66657,
16391
+ "[spkr_11]": 66658,
16392
+ "[spkr_12]": 66659,
16393
+ "[spkr_13]": 66660,
16394
+ "[spkr_14]": 66661,
16395
+ "[spkr_15]": 66662,
16396
+ "[spkr_16]": 66663,
16397
+ "[spkr_17]": 66664,
16398
+ "[spkr_18]": 66665,
16399
+ "[spkr_19]": 66666,
16400
+ "[spkr_1]": 66648,
16401
+ "[spkr_20]": 66667,
16402
+ "[spkr_21]": 66668,
16403
+ "[spkr_22]": 66669,
16404
+ "[spkr_23]": 66670,
16405
+ "[spkr_24]": 66671,
16406
+ "[spkr_25]": 66672,
16407
+ "[spkr_26]": 66673,
16408
+ "[spkr_27]": 66674,
16409
+ "[spkr_28]": 66675,
16410
+ "[spkr_29]": 66676,
16411
+ "[spkr_2]": 66649,
16412
+ "[spkr_30]": 66677,
16413
+ "[spkr_31]": 66678,
16414
+ "[spkr_32]": 66679,
16415
+ "[spkr_33]": 66680,
16416
+ "[spkr_34]": 66681,
16417
+ "[spkr_35]": 66682,
16418
+ "[spkr_36]": 66683,
16419
+ "[spkr_37]": 66684,
16420
+ "[spkr_38]": 66685,
16421
+ "[spkr_39]": 66686,
16422
+ "[spkr_3]": 66650,
16423
+ "[spkr_40]": 66687,
16424
+ "[spkr_41]": 66688,
16425
+ "[spkr_42]": 66689,
16426
+ "[spkr_43]": 66690,
16427
+ "[spkr_44]": 66691,
16428
+ "[spkr_45]": 66692,
16429
+ "[spkr_46]": 66693,
16430
+ "[spkr_47]": 66694,
16431
+ "[spkr_48]": 66695,
16432
+ "[spkr_49]": 66696,
16433
+ "[spkr_4]": 66651,
16434
+ "[spkr_50]": 66697,
16435
+ "[spkr_51]": 66698,
16436
+ "[spkr_52]": 66699,
16437
+ "[spkr_53]": 66700,
16438
+ "[spkr_54]": 66701,
16439
+ "[spkr_55]": 66702,
16440
+ "[spkr_56]": 66703,
16441
+ "[spkr_57]": 66704,
16442
+ "[spkr_58]": 66705,
16443
+ "[spkr_59]": 66706,
16444
+ "[spkr_5]": 66652,
16445
+ "[spkr_60]": 66707,
16446
+ "[spkr_61]": 66708,
16447
+ "[spkr_62]": 66709,
16448
+ "[spkr_63]": 66710,
16449
+ "[spkr_64]": 66711,
16450
+ "[spkr_65]": 66712,
16451
+ "[spkr_66]": 66713,
16452
+ "[spkr_67]": 66714,
16453
+ "[spkr_68]": 66715,
16454
+ "[spkr_69]": 66716,
16455
+ "[spkr_6]": 66653,
16456
+ "[spkr_70]": 66717,
16457
+ "[spkr_71]": 66718,
16458
+ "[spkr_72]": 66719,
16459
+ "[spkr_73]": 66720,
16460
+ "[spkr_74]": 66721,
16461
+ "[spkr_75]": 66722,
16462
+ "[spkr_76]": 66723,
16463
+ "[spkr_77]": 66724,
16464
+ "[spkr_7]": 66654,
16465
+ "[spkr_8]": 66655,
16466
+ "[spkr_9]": 66656,
16467
  "[spkr_unk]": 66646,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
16468
  "[stop]": 66645,
16469
  "[text]": 66641
16470
  }
special_tokens_map.json CHANGED
@@ -1,23 +1,5 @@
1
  {
2
- "bos_token": {
3
- "content": "<|endoftext|>",
4
- "lstrip": false,
5
- "normalized": true,
6
- "rstrip": false,
7
- "single_word": false
8
- },
9
- "eos_token": {
10
- "content": "<|endoftext|>",
11
- "lstrip": false,
12
- "normalized": true,
13
- "rstrip": false,
14
- "single_word": false
15
- },
16
- "unk_token": {
17
- "content": "<|endoftext|>",
18
- "lstrip": false,
19
- "normalized": true,
20
- "rstrip": false,
21
- "single_word": false
22
- }
23
  }
 
1
  {
2
+ "bos_token": "<|endoftext|>",
3
+ "eos_token": "<|endoftext|>",
4
+ "unk_token": "<|endoftext|>"
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
5
  }
tokenizer.json CHANGED
@@ -10,7 +10,7 @@
10
  "lstrip": false,
11
  "rstrip": false,
12
  "normalized": true,
13
- "special": true
14
  },
15
  {
16
  "id": 50257,
@@ -147524,7 +147524,7 @@
147524
  },
147525
  {
147526
  "id": 66647,
147527
- "content": "[spkr_mls_eng_10k_6454]",
147528
  "single_word": false,
147529
  "lstrip": false,
147530
  "rstrip": false,
@@ -147533,7 +147533,7 @@
147533
  },
147534
  {
147535
  "id": 66648,
147536
- "content": "[spkr_mls_eng_10k_10801]",
147537
  "single_word": false,
147538
  "lstrip": false,
147539
  "rstrip": false,
@@ -147542,7 +147542,7 @@
147542
  },
147543
  {
147544
  "id": 66649,
147545
- "content": "[spkr_mls_eng_10k_7756]",
147546
  "single_word": false,
147547
  "lstrip": false,
147548
  "rstrip": false,
@@ -147551,7 +147551,7 @@
147551
  },
147552
  {
147553
  "id": 66650,
147554
- "content": "[spkr_mls_eng_10k_4078]",
147555
  "single_word": false,
147556
  "lstrip": false,
147557
  "rstrip": false,
@@ -147560,7 +147560,7 @@
147560
  },
147561
  {
147562
  "id": 66651,
147563
- "content": "[spkr_mls_eng_10k_2156]",
147564
  "single_word": false,
147565
  "lstrip": false,
147566
  "rstrip": false,
@@ -147569,7 +147569,7 @@
147569
  },
147570
  {
147571
  "id": 66652,
147572
- "content": "[spkr_mls_eng_10k_3645]",
147573
  "single_word": false,
147574
  "lstrip": false,
147575
  "rstrip": false,
@@ -147578,7 +147578,7 @@
147578
  },
147579
  {
147580
  "id": 66653,
147581
- "content": "[spkr_mls_eng_10k_8713]",
147582
  "single_word": false,
147583
  "lstrip": false,
147584
  "rstrip": false,
@@ -147587,7 +147587,7 @@
147587
  },
147588
  {
147589
  "id": 66654,
147590
- "content": "[spkr_mls_eng_10k_3157]",
147591
  "single_word": false,
147592
  "lstrip": false,
147593
  "rstrip": false,
@@ -147596,7 +147596,7 @@
147596
  },
147597
  {
147598
  "id": 66655,
147599
- "content": "[spkr_mls_eng_10k_5717]",
147600
  "single_word": false,
147601
  "lstrip": false,
147602
  "rstrip": false,
@@ -147605,7 +147605,7 @@
147605
  },
147606
  {
147607
  "id": 66656,
147608
- "content": "[spkr_mls_eng_10k_3488]",
147609
  "single_word": false,
147610
  "lstrip": false,
147611
  "rstrip": false,
@@ -147614,7 +147614,7 @@
147614
  },
147615
  {
147616
  "id": 66657,
147617
- "content": "[spkr_mls_eng_10k_10191]",
147618
  "single_word": false,
147619
  "lstrip": false,
147620
  "rstrip": false,
@@ -147623,7 +147623,7 @@
147623
  },
147624
  {
147625
  "id": 66658,
147626
- "content": "[spkr_mls_eng_10k_11697]",
147627
  "single_word": false,
147628
  "lstrip": false,
147629
  "rstrip": false,
@@ -147632,7 +147632,7 @@
147632
  },
147633
  {
147634
  "id": 66659,
147635
- "content": "[spkr_mls_eng_10k_1401]",
147636
  "single_word": false,
147637
  "lstrip": false,
147638
  "rstrip": false,
@@ -147641,7 +147641,7 @@
147641
  },
147642
  {
147643
  "id": 66660,
147644
- "content": "[spkr_mls_eng_10k_4018]",
147645
  "single_word": false,
147646
  "lstrip": false,
147647
  "rstrip": false,
@@ -147650,7 +147650,7 @@
147650
  },
147651
  {
147652
  "id": 66661,
147653
- "content": "[spkr_mls_eng_10k_7879]",
147654
  "single_word": false,
147655
  "lstrip": false,
147656
  "rstrip": false,
@@ -147659,7 +147659,7 @@
147659
  },
147660
  {
147661
  "id": 66662,
147662
- "content": "[spkr_mls_eng_10k_204]",
147663
  "single_word": false,
147664
  "lstrip": false,
147665
  "rstrip": false,
@@ -147668,7 +147668,7 @@
147668
  },
147669
  {
147670
  "id": 66663,
147671
- "content": "[spkr_mls_eng_10k_8677]",
147672
  "single_word": false,
147673
  "lstrip": false,
147674
  "rstrip": false,
@@ -147677,7 +147677,7 @@
147677
  },
147678
  {
147679
  "id": 66664,
147680
- "content": "[spkr_mls_eng_10k_107]",
147681
  "single_word": false,
147682
  "lstrip": false,
147683
  "rstrip": false,
@@ -147686,7 +147686,7 @@
147686
  },
147687
  {
147688
  "id": 66665,
147689
- "content": "[spkr_mls_eng_10k_1259]",
147690
  "single_word": false,
147691
  "lstrip": false,
147692
  "rstrip": false,
@@ -147695,7 +147695,7 @@
147695
  },
147696
  {
147697
  "id": 66666,
147698
- "content": "[spkr_mls_eng_10k_8138]",
147699
  "single_word": false,
147700
  "lstrip": false,
147701
  "rstrip": false,
@@ -147704,7 +147704,7 @@
147704
  },
147705
  {
147706
  "id": 66667,
147707
- "content": "[spkr_mls_eng_10k_5968]",
147708
  "single_word": false,
147709
  "lstrip": false,
147710
  "rstrip": false,
@@ -147713,7 +147713,7 @@
147713
  },
147714
  {
147715
  "id": 66668,
147716
- "content": "[spkr_mls_eng_10k_2607]",
147717
  "single_word": false,
147718
  "lstrip": false,
147719
  "rstrip": false,
@@ -147722,7 +147722,7 @@
147722
  },
147723
  {
147724
  "id": 66669,
147725
- "content": "[spkr_mls_eng_10k_1724]",
147726
  "single_word": false,
147727
  "lstrip": false,
147728
  "rstrip": false,
@@ -147731,7 +147731,7 @@
147731
  },
147732
  {
147733
  "id": 66670,
147734
- "content": "[spkr_mls_eng_10k_4788]",
147735
  "single_word": false,
147736
  "lstrip": false,
147737
  "rstrip": false,
@@ -147740,7 +147740,7 @@
147740
  },
147741
  {
147742
  "id": 66671,
147743
- "content": "[spkr_mls_eng_10k_11667]",
147744
  "single_word": false,
147745
  "lstrip": false,
147746
  "rstrip": false,
@@ -147749,7 +147749,7 @@
147749
  },
147750
  {
147751
  "id": 66672,
147752
- "content": "[spkr_mls_eng_10k_3681]",
147753
  "single_word": false,
147754
  "lstrip": false,
147755
  "rstrip": false,
@@ -147758,7 +147758,7 @@
147758
  },
147759
  {
147760
  "id": 66673,
147761
- "content": "[spkr_mls_eng_10k_6671]",
147762
  "single_word": false,
147763
  "lstrip": false,
147764
  "rstrip": false,
@@ -147767,7 +147767,7 @@
147767
  },
147768
  {
147769
  "id": 66674,
147770
- "content": "[spkr_mls_eng_10k_6670]",
147771
  "single_word": false,
147772
  "lstrip": false,
147773
  "rstrip": false,
@@ -147776,7 +147776,7 @@
147776
  },
147777
  {
147778
  "id": 66675,
147779
- "content": "[spkr_mls_eng_10k_2234]",
147780
  "single_word": false,
147781
  "lstrip": false,
147782
  "rstrip": false,
@@ -147785,7 +147785,7 @@
147785
  },
147786
  {
147787
  "id": 66676,
147788
- "content": "[spkr_mls_eng_10k_10244]",
147789
  "single_word": false,
147790
  "lstrip": false,
147791
  "rstrip": false,
@@ -147794,7 +147794,7 @@
147794
  },
147795
  {
147796
  "id": 66677,
147797
- "content": "[spkr_mls_eng_10k_5985]",
147798
  "single_word": false,
147799
  "lstrip": false,
147800
  "rstrip": false,
@@ -147803,7 +147803,7 @@
147803
  },
147804
  {
147805
  "id": 66678,
147806
- "content": "[spkr_mls_eng_10k_3699]",
147807
  "single_word": false,
147808
  "lstrip": false,
147809
  "rstrip": false,
@@ -147812,7 +147812,7 @@
147812
  },
147813
  {
147814
  "id": 66679,
147815
- "content": "[spkr_mls_eng_10k_3003]",
147816
  "single_word": false,
147817
  "lstrip": false,
147818
  "rstrip": false,
@@ -147821,7 +147821,7 @@
147821
  },
147822
  {
147823
  "id": 66680,
147824
- "content": "[spkr_mls_eng_10k_4174]",
147825
  "single_word": false,
147826
  "lstrip": false,
147827
  "rstrip": false,
@@ -147830,7 +147830,7 @@
147830
  },
147831
  {
147832
  "id": 66681,
147833
- "content": "[spkr_mls_eng_10k_6660]",
147834
  "single_word": false,
147835
  "lstrip": false,
147836
  "rstrip": false,
@@ -147839,7 +147839,7 @@
147839
  },
147840
  {
147841
  "id": 66682,
147842
- "content": "[spkr_mls_eng_10k_9017]",
147843
  "single_word": false,
147844
  "lstrip": false,
147845
  "rstrip": false,
@@ -147848,7 +147848,7 @@
147848
  },
147849
  {
147850
  "id": 66683,
147851
- "content": "[spkr_mls_eng_10k_5304]",
147852
  "single_word": false,
147853
  "lstrip": false,
147854
  "rstrip": false,
@@ -147857,7 +147857,7 @@
147857
  },
147858
  {
147859
  "id": 66684,
147860
- "content": "[spkr_mls_eng_10k_6687]",
147861
  "single_word": false,
147862
  "lstrip": false,
147863
  "rstrip": false,
@@ -147866,7 +147866,7 @@
147866
  },
147867
  {
147868
  "id": 66685,
147869
- "content": "[spkr_mls_eng_10k_6497]",
147870
  "single_word": false,
147871
  "lstrip": false,
147872
  "rstrip": false,
@@ -147875,7 +147875,7 @@
147875
  },
147876
  {
147877
  "id": 66686,
147878
- "content": "[spkr_mls_eng_10k_3595]",
147879
  "single_word": false,
147880
  "lstrip": false,
147881
  "rstrip": false,
@@ -147884,7 +147884,7 @@
147884
  },
147885
  {
147886
  "id": 66687,
147887
- "content": "[spkr_mls_eng_10k_4064]",
147888
  "single_word": false,
147889
  "lstrip": false,
147890
  "rstrip": false,
@@ -147893,7 +147893,7 @@
147893
  },
147894
  {
147895
  "id": 66688,
147896
- "content": "[spkr_mls_eng_10k_3657]",
147897
  "single_word": false,
147898
  "lstrip": false,
147899
  "rstrip": false,
@@ -147902,7 +147902,7 @@
147902
  },
147903
  {
147904
  "id": 66689,
147905
- "content": "[spkr_mls_eng_10k_3967]",
147906
  "single_word": false,
147907
  "lstrip": false,
147908
  "rstrip": false,
@@ -147911,7 +147911,7 @@
147911
  },
147912
  {
147913
  "id": 66690,
147914
- "content": "[spkr_mls_eng_10k_8011]",
147915
  "single_word": false,
147916
  "lstrip": false,
147917
  "rstrip": false,
@@ -147920,7 +147920,7 @@
147920
  },
147921
  {
147922
  "id": 66691,
147923
- "content": "[spkr_mls_eng_10k_10463]",
147924
  "single_word": false,
147925
  "lstrip": false,
147926
  "rstrip": false,
@@ -147929,7 +147929,7 @@
147929
  },
147930
  {
147931
  "id": 66692,
147932
- "content": "[spkr_hifi_tts_9017]",
147933
  "single_word": false,
147934
  "lstrip": false,
147935
  "rstrip": false,
@@ -147938,7 +147938,7 @@
147938
  },
147939
  {
147940
  "id": 66693,
147941
- "content": "[spkr_hifi_tts_6097]",
147942
  "single_word": false,
147943
  "lstrip": false,
147944
  "rstrip": false,
@@ -147947,7 +147947,7 @@
147947
  },
147948
  {
147949
  "id": 66694,
147950
- "content": "[spkr_hifi_tts_92]",
147951
  "single_word": false,
147952
  "lstrip": false,
147953
  "rstrip": false,
@@ -147956,7 +147956,7 @@
147956
  },
147957
  {
147958
  "id": 66695,
147959
- "content": "[spkr_expresso_ex02]",
147960
  "single_word": false,
147961
  "lstrip": false,
147962
  "rstrip": false,
@@ -147965,7 +147965,7 @@
147965
  },
147966
  {
147967
  "id": 66696,
147968
- "content": "[spkr_expresso_ex03]",
147969
  "single_word": false,
147970
  "lstrip": false,
147971
  "rstrip": false,
@@ -147974,7 +147974,7 @@
147974
  },
147975
  {
147976
  "id": 66697,
147977
- "content": "[spkr_expresso_ex04]",
147978
  "single_word": false,
147979
  "lstrip": false,
147980
  "rstrip": false,
@@ -147983,7 +147983,7 @@
147983
  },
147984
  {
147985
  "id": 66698,
147986
- "content": "[spkr_expresso_ex01]",
147987
  "single_word": false,
147988
  "lstrip": false,
147989
  "rstrip": false,
@@ -147992,7 +147992,7 @@
147992
  },
147993
  {
147994
  "id": 66699,
147995
- "content": "[spkr_jenny_jenny]",
147996
  "single_word": false,
147997
  "lstrip": false,
147998
  "rstrip": false,
@@ -148001,7 +148001,7 @@
148001
  },
148002
  {
148003
  "id": 66700,
148004
- "content": "[spkr_youtube_webds_hi_kabitaskitchen]",
148005
  "single_word": false,
148006
  "lstrip": false,
148007
  "rstrip": false,
@@ -148010,7 +148010,7 @@
148010
  },
148011
  {
148012
  "id": 66701,
148013
- "content": "[spkr_youtube_webds_hi_unacademyjee]",
148014
  "single_word": false,
148015
  "lstrip": false,
148016
  "rstrip": false,
@@ -148019,7 +148019,7 @@
148019
  },
148020
  {
148021
  "id": 66702,
148022
- "content": "[spkr_youtube_webds_hi_technicalguruji]",
148023
  "single_word": false,
148024
  "lstrip": false,
148025
  "rstrip": false,
@@ -148028,7 +148028,7 @@
148028
  },
148029
  {
148030
  "id": 66703,
148031
- "content": "[spkr_youtube_webds_en_teded]",
148032
  "single_word": false,
148033
  "lstrip": false,
148034
  "rstrip": false,
@@ -148037,7 +148037,7 @@
148037
  },
148038
  {
148039
  "id": 66704,
148040
- "content": "[spkr_youtube_webds_hi_physicswallah]",
148041
  "single_word": false,
148042
  "lstrip": false,
148043
  "rstrip": false,
@@ -148046,7 +148046,7 @@
148046
  },
148047
  {
148048
  "id": 66705,
148049
- "content": "[spkr_youtube_webds_en_akshat]",
148050
  "single_word": false,
148051
  "lstrip": false,
148052
  "rstrip": false,
@@ -148055,7 +148055,7 @@
148055
  },
148056
  {
148057
  "id": 66706,
148058
- "content": "[spkr_youtube_webds_hi_dhruvrathee]",
148059
  "single_word": false,
148060
  "lstrip": false,
148061
  "rstrip": false,
@@ -148064,7 +148064,7 @@
148064
  },
148065
  {
148066
  "id": 66707,
148067
- "content": "[spkr_youtube_webds_hi_neelimaaudiobooks]",
148068
  "single_word": false,
148069
  "lstrip": false,
148070
  "rstrip": false,
@@ -148073,7 +148073,7 @@
148073
  },
148074
  {
148075
  "id": 66708,
148076
- "content": "[spkr_youtube_webds_hi_ranveerallahbadia]",
148077
  "single_word": false,
148078
  "lstrip": false,
148079
  "rstrip": false,
@@ -148082,7 +148082,7 @@
148082
  },
148083
  {
148084
  "id": 66709,
148085
- "content": "[spkr_youtube_webds_hi_hindiaudiobooks]",
148086
  "single_word": false,
148087
  "lstrip": false,
148088
  "rstrip": false,
@@ -148091,7 +148091,7 @@
148091
  },
148092
  {
148093
  "id": 66710,
148094
- "content": "[spkr_youtube_webds_en_historyofindia]",
148095
  "single_word": false,
148096
  "lstrip": false,
148097
  "rstrip": false,
@@ -148100,7 +148100,7 @@
148100
  },
148101
  {
148102
  "id": 66711,
148103
- "content": "[spkr_youtube_webds_hi_vivekbindra]",
148104
  "single_word": false,
148105
  "lstrip": false,
148106
  "rstrip": false,
@@ -148109,7 +148109,7 @@
148109
  },
148110
  {
148111
  "id": 66712,
148112
- "content": "[spkr_youtube_webds_hi_sandeepmaheshwari]",
148113
  "single_word": false,
148114
  "lstrip": false,
148115
  "rstrip": false,
@@ -148118,7 +148118,7 @@
148118
  },
148119
  {
148120
  "id": 66713,
148121
- "content": "[spkr_youtube_webds_hi_pmmodi]",
148122
  "single_word": false,
148123
  "lstrip": false,
148124
  "rstrip": false,
@@ -148127,7 +148127,7 @@
148127
  },
148128
  {
148129
  "id": 66714,
148130
- "content": "[spkr_youtube_webds_en_mkbhd]",
148131
  "single_word": false,
148132
  "lstrip": false,
148133
  "rstrip": false,
@@ -148136,7 +148136,7 @@
148136
  },
148137
  {
148138
  "id": 66715,
148139
- "content": "[spkr_youtube_webds_en_secondhandstories]",
148140
  "single_word": false,
148141
  "lstrip": false,
148142
  "rstrip": false,
@@ -148145,7 +148145,7 @@
148145
  },
148146
  {
148147
  "id": 66716,
148148
- "content": "[spkr_youtube_webds_en_storiesofmahabharatha]",
148149
  "single_word": false,
148150
  "lstrip": false,
148151
  "rstrip": false,
@@ -148154,7 +148154,7 @@
148154
  },
148155
  {
148156
  "id": 66717,
148157
- "content": "[spkr_youtube_webds_hi_a2motivation]",
148158
  "single_word": false,
148159
  "lstrip": false,
148160
  "rstrip": false,
@@ -148163,7 +148163,7 @@
148163
  },
148164
  {
148165
  "id": 66718,
148166
- "content": "[spkr_youtube_webds_hi_mrbeast]",
148167
  "single_word": false,
148168
  "lstrip": false,
148169
  "rstrip": false,
@@ -148172,7 +148172,7 @@
148172
  },
148173
  {
148174
  "id": 66719,
148175
- "content": "[spkr_youtube_webds_hi_akshat]",
148176
  "single_word": false,
148177
  "lstrip": false,
148178
  "rstrip": false,
@@ -148181,7 +148181,7 @@
148181
  },
148182
  {
148183
  "id": 66720,
148184
- "content": "[spkr_shrutilipi_hi_shrutilipi]",
148185
  "single_word": false,
148186
  "lstrip": false,
148187
  "rstrip": false,
@@ -148190,7 +148190,7 @@
148190
  },
148191
  {
148192
  "id": 66721,
148193
- "content": "[spkr_youtube_webds_en_derekperkins]",
148194
  "single_word": false,
148195
  "lstrip": false,
148196
  "rstrip": false,
@@ -148199,7 +148199,7 @@
148199
  },
148200
  {
148201
  "id": 66722,
148202
- "content": "[spkr_youtube_webds_en_mukesh]",
148203
  "single_word": false,
148204
  "lstrip": false,
148205
  "rstrip": false,
@@ -148208,7 +148208,7 @@
148208
  },
148209
  {
148210
  "id": 66723,
148211
- "content": "[spkr_youtube_webds_en_attenborough]",
148212
  "single_word": false,
148213
  "lstrip": false,
148214
  "rstrip": false,
@@ -148217,7 +148217,7 @@
148217
  },
148218
  {
148219
  "id": 66724,
148220
- "content": "[spkr_youtube_webds_hi_warikoo]",
148221
  "single_word": false,
148222
  "lstrip": false,
148223
  "rstrip": false,
 
10
  "lstrip": false,
11
  "rstrip": false,
12
  "normalized": true,
13
+ "special": false
14
  },
15
  {
16
  "id": 50257,
 
147524
  },
147525
  {
147526
  "id": 66647,
147527
+ "content": "[spkr_0]",
147528
  "single_word": false,
147529
  "lstrip": false,
147530
  "rstrip": false,
 
147533
  },
147534
  {
147535
  "id": 66648,
147536
+ "content": "[spkr_1]",
147537
  "single_word": false,
147538
  "lstrip": false,
147539
  "rstrip": false,
 
147542
  },
147543
  {
147544
  "id": 66649,
147545
+ "content": "[spkr_2]",
147546
  "single_word": false,
147547
  "lstrip": false,
147548
  "rstrip": false,
 
147551
  },
147552
  {
147553
  "id": 66650,
147554
+ "content": "[spkr_3]",
147555
  "single_word": false,
147556
  "lstrip": false,
147557
  "rstrip": false,
 
147560
  },
147561
  {
147562
  "id": 66651,
147563
+ "content": "[spkr_4]",
147564
  "single_word": false,
147565
  "lstrip": false,
147566
  "rstrip": false,
 
147569
  },
147570
  {
147571
  "id": 66652,
147572
+ "content": "[spkr_5]",
147573
  "single_word": false,
147574
  "lstrip": false,
147575
  "rstrip": false,
 
147578
  },
147579
  {
147580
  "id": 66653,
147581
+ "content": "[spkr_6]",
147582
  "single_word": false,
147583
  "lstrip": false,
147584
  "rstrip": false,
 
147587
  },
147588
  {
147589
  "id": 66654,
147590
+ "content": "[spkr_7]",
147591
  "single_word": false,
147592
  "lstrip": false,
147593
  "rstrip": false,
 
147596
  },
147597
  {
147598
  "id": 66655,
147599
+ "content": "[spkr_8]",
147600
  "single_word": false,
147601
  "lstrip": false,
147602
  "rstrip": false,
 
147605
  },
147606
  {
147607
  "id": 66656,
147608
+ "content": "[spkr_9]",
147609
  "single_word": false,
147610
  "lstrip": false,
147611
  "rstrip": false,
 
147614
  },
147615
  {
147616
  "id": 66657,
147617
+ "content": "[spkr_10]",
147618
  "single_word": false,
147619
  "lstrip": false,
147620
  "rstrip": false,
 
147623
  },
147624
  {
147625
  "id": 66658,
147626
+ "content": "[spkr_11]",
147627
  "single_word": false,
147628
  "lstrip": false,
147629
  "rstrip": false,
 
147632
  },
147633
  {
147634
  "id": 66659,
147635
+ "content": "[spkr_12]",
147636
  "single_word": false,
147637
  "lstrip": false,
147638
  "rstrip": false,
 
147641
  },
147642
  {
147643
  "id": 66660,
147644
+ "content": "[spkr_13]",
147645
  "single_word": false,
147646
  "lstrip": false,
147647
  "rstrip": false,
 
147650
  },
147651
  {
147652
  "id": 66661,
147653
+ "content": "[spkr_14]",
147654
  "single_word": false,
147655
  "lstrip": false,
147656
  "rstrip": false,
 
147659
  },
147660
  {
147661
  "id": 66662,
147662
+ "content": "[spkr_15]",
147663
  "single_word": false,
147664
  "lstrip": false,
147665
  "rstrip": false,
 
147668
  },
147669
  {
147670
  "id": 66663,
147671
+ "content": "[spkr_16]",
147672
  "single_word": false,
147673
  "lstrip": false,
147674
  "rstrip": false,
 
147677
  },
147678
  {
147679
  "id": 66664,
147680
+ "content": "[spkr_17]",
147681
  "single_word": false,
147682
  "lstrip": false,
147683
  "rstrip": false,
 
147686
  },
147687
  {
147688
  "id": 66665,
147689
+ "content": "[spkr_18]",
147690
  "single_word": false,
147691
  "lstrip": false,
147692
  "rstrip": false,
 
147695
  },
147696
  {
147697
  "id": 66666,
147698
+ "content": "[spkr_19]",
147699
  "single_word": false,
147700
  "lstrip": false,
147701
  "rstrip": false,
 
147704
  },
147705
  {
147706
  "id": 66667,
147707
+ "content": "[spkr_20]",
147708
  "single_word": false,
147709
  "lstrip": false,
147710
  "rstrip": false,
 
147713
  },
147714
  {
147715
  "id": 66668,
147716
+ "content": "[spkr_21]",
147717
  "single_word": false,
147718
  "lstrip": false,
147719
  "rstrip": false,
 
147722
  },
147723
  {
147724
  "id": 66669,
147725
+ "content": "[spkr_22]",
147726
  "single_word": false,
147727
  "lstrip": false,
147728
  "rstrip": false,
 
147731
  },
147732
  {
147733
  "id": 66670,
147734
+ "content": "[spkr_23]",
147735
  "single_word": false,
147736
  "lstrip": false,
147737
  "rstrip": false,
 
147740
  },
147741
  {
147742
  "id": 66671,
147743
+ "content": "[spkr_24]",
147744
  "single_word": false,
147745
  "lstrip": false,
147746
  "rstrip": false,
 
147749
  },
147750
  {
147751
  "id": 66672,
147752
+ "content": "[spkr_25]",
147753
  "single_word": false,
147754
  "lstrip": false,
147755
  "rstrip": false,
 
147758
  },
147759
  {
147760
  "id": 66673,
147761
+ "content": "[spkr_26]",
147762
  "single_word": false,
147763
  "lstrip": false,
147764
  "rstrip": false,
 
147767
  },
147768
  {
147769
  "id": 66674,
147770
+ "content": "[spkr_27]",
147771
  "single_word": false,
147772
  "lstrip": false,
147773
  "rstrip": false,
 
147776
  },
147777
  {
147778
  "id": 66675,
147779
+ "content": "[spkr_28]",
147780
  "single_word": false,
147781
  "lstrip": false,
147782
  "rstrip": false,
 
147785
  },
147786
  {
147787
  "id": 66676,
147788
+ "content": "[spkr_29]",
147789
  "single_word": false,
147790
  "lstrip": false,
147791
  "rstrip": false,
 
147794
  },
147795
  {
147796
  "id": 66677,
147797
+ "content": "[spkr_30]",
147798
  "single_word": false,
147799
  "lstrip": false,
147800
  "rstrip": false,
 
147803
  },
147804
  {
147805
  "id": 66678,
147806
+ "content": "[spkr_31]",
147807
  "single_word": false,
147808
  "lstrip": false,
147809
  "rstrip": false,
 
147812
  },
147813
  {
147814
  "id": 66679,
147815
+ "content": "[spkr_32]",
147816
  "single_word": false,
147817
  "lstrip": false,
147818
  "rstrip": false,
 
147821
  },
147822
  {
147823
  "id": 66680,
147824
+ "content": "[spkr_33]",
147825
  "single_word": false,
147826
  "lstrip": false,
147827
  "rstrip": false,
 
147830
  },
147831
  {
147832
  "id": 66681,
147833
+ "content": "[spkr_34]",
147834
  "single_word": false,
147835
  "lstrip": false,
147836
  "rstrip": false,
 
147839
  },
147840
  {
147841
  "id": 66682,
147842
+ "content": "[spkr_35]",
147843
  "single_word": false,
147844
  "lstrip": false,
147845
  "rstrip": false,
 
147848
  },
147849
  {
147850
  "id": 66683,
147851
+ "content": "[spkr_36]",
147852
  "single_word": false,
147853
  "lstrip": false,
147854
  "rstrip": false,
 
147857
  },
147858
  {
147859
  "id": 66684,
147860
+ "content": "[spkr_37]",
147861
  "single_word": false,
147862
  "lstrip": false,
147863
  "rstrip": false,
 
147866
  },
147867
  {
147868
  "id": 66685,
147869
+ "content": "[spkr_38]",
147870
  "single_word": false,
147871
  "lstrip": false,
147872
  "rstrip": false,
 
147875
  },
147876
  {
147877
  "id": 66686,
147878
+ "content": "[spkr_39]",
147879
  "single_word": false,
147880
  "lstrip": false,
147881
  "rstrip": false,
 
147884
  },
147885
  {
147886
  "id": 66687,
147887
+ "content": "[spkr_40]",
147888
  "single_word": false,
147889
  "lstrip": false,
147890
  "rstrip": false,
 
147893
  },
147894
  {
147895
  "id": 66688,
147896
+ "content": "[spkr_41]",
147897
  "single_word": false,
147898
  "lstrip": false,
147899
  "rstrip": false,
 
147902
  },
147903
  {
147904
  "id": 66689,
147905
+ "content": "[spkr_42]",
147906
  "single_word": false,
147907
  "lstrip": false,
147908
  "rstrip": false,
 
147911
  },
147912
  {
147913
  "id": 66690,
147914
+ "content": "[spkr_43]",
147915
  "single_word": false,
147916
  "lstrip": false,
147917
  "rstrip": false,
 
147920
  },
147921
  {
147922
  "id": 66691,
147923
+ "content": "[spkr_44]",
147924
  "single_word": false,
147925
  "lstrip": false,
147926
  "rstrip": false,
 
147929
  },
147930
  {
147931
  "id": 66692,
147932
+ "content": "[spkr_45]",
147933
  "single_word": false,
147934
  "lstrip": false,
147935
  "rstrip": false,
 
147938
  },
147939
  {
147940
  "id": 66693,
147941
+ "content": "[spkr_46]",
147942
  "single_word": false,
147943
  "lstrip": false,
147944
  "rstrip": false,
 
147947
  },
147948
  {
147949
  "id": 66694,
147950
+ "content": "[spkr_47]",
147951
  "single_word": false,
147952
  "lstrip": false,
147953
  "rstrip": false,
 
147956
  },
147957
  {
147958
  "id": 66695,
147959
+ "content": "[spkr_48]",
147960
  "single_word": false,
147961
  "lstrip": false,
147962
  "rstrip": false,
 
147965
  },
147966
  {
147967
  "id": 66696,
147968
+ "content": "[spkr_49]",
147969
  "single_word": false,
147970
  "lstrip": false,
147971
  "rstrip": false,
 
147974
  },
147975
  {
147976
  "id": 66697,
147977
+ "content": "[spkr_50]",
147978
  "single_word": false,
147979
  "lstrip": false,
147980
  "rstrip": false,
 
147983
  },
147984
  {
147985
  "id": 66698,
147986
+ "content": "[spkr_51]",
147987
  "single_word": false,
147988
  "lstrip": false,
147989
  "rstrip": false,
 
147992
  },
147993
  {
147994
  "id": 66699,
147995
+ "content": "[spkr_52]",
147996
  "single_word": false,
147997
  "lstrip": false,
147998
  "rstrip": false,
 
148001
  },
148002
  {
148003
  "id": 66700,
148004
+ "content": "[spkr_53]",
148005
  "single_word": false,
148006
  "lstrip": false,
148007
  "rstrip": false,
 
148010
  },
148011
  {
148012
  "id": 66701,
148013
+ "content": "[spkr_54]",
148014
  "single_word": false,
148015
  "lstrip": false,
148016
  "rstrip": false,
 
148019
  },
148020
  {
148021
  "id": 66702,
148022
+ "content": "[spkr_55]",
148023
  "single_word": false,
148024
  "lstrip": false,
148025
  "rstrip": false,
 
148028
  },
148029
  {
148030
  "id": 66703,
148031
+ "content": "[spkr_56]",
148032
  "single_word": false,
148033
  "lstrip": false,
148034
  "rstrip": false,
 
148037
  },
148038
  {
148039
  "id": 66704,
148040
+ "content": "[spkr_57]",
148041
  "single_word": false,
148042
  "lstrip": false,
148043
  "rstrip": false,
 
148046
  },
148047
  {
148048
  "id": 66705,
148049
+ "content": "[spkr_58]",
148050
  "single_word": false,
148051
  "lstrip": false,
148052
  "rstrip": false,
 
148055
  },
148056
  {
148057
  "id": 66706,
148058
+ "content": "[spkr_59]",
148059
  "single_word": false,
148060
  "lstrip": false,
148061
  "rstrip": false,
 
148064
  },
148065
  {
148066
  "id": 66707,
148067
+ "content": "[spkr_60]",
148068
  "single_word": false,
148069
  "lstrip": false,
148070
  "rstrip": false,
 
148073
  },
148074
  {
148075
  "id": 66708,
148076
+ "content": "[spkr_61]",
148077
  "single_word": false,
148078
  "lstrip": false,
148079
  "rstrip": false,
 
148082
  },
148083
  {
148084
  "id": 66709,
148085
+ "content": "[spkr_62]",
148086
  "single_word": false,
148087
  "lstrip": false,
148088
  "rstrip": false,
 
148091
  },
148092
  {
148093
  "id": 66710,
148094
+ "content": "[spkr_63]",
148095
  "single_word": false,
148096
  "lstrip": false,
148097
  "rstrip": false,
 
148100
  },
148101
  {
148102
  "id": 66711,
148103
+ "content": "[spkr_64]",
148104
  "single_word": false,
148105
  "lstrip": false,
148106
  "rstrip": false,
 
148109
  },
148110
  {
148111
  "id": 66712,
148112
+ "content": "[spkr_65]",
148113
  "single_word": false,
148114
  "lstrip": false,
148115
  "rstrip": false,
 
148118
  },
148119
  {
148120
  "id": 66713,
148121
+ "content": "[spkr_66]",
148122
  "single_word": false,
148123
  "lstrip": false,
148124
  "rstrip": false,
 
148127
  },
148128
  {
148129
  "id": 66714,
148130
+ "content": "[spkr_67]",
148131
  "single_word": false,
148132
  "lstrip": false,
148133
  "rstrip": false,
 
148136
  },
148137
  {
148138
  "id": 66715,
148139
+ "content": "[spkr_68]",
148140
  "single_word": false,
148141
  "lstrip": false,
148142
  "rstrip": false,
 
148145
  },
148146
  {
148147
  "id": 66716,
148148
+ "content": "[spkr_69]",
148149
  "single_word": false,
148150
  "lstrip": false,
148151
  "rstrip": false,
 
148154
  },
148155
  {
148156
  "id": 66717,
148157
+ "content": "[spkr_70]",
148158
  "single_word": false,
148159
  "lstrip": false,
148160
  "rstrip": false,
 
148163
  },
148164
  {
148165
  "id": 66718,
148166
+ "content": "[spkr_71]",
148167
  "single_word": false,
148168
  "lstrip": false,
148169
  "rstrip": false,
 
148172
  },
148173
  {
148174
  "id": 66719,
148175
+ "content": "[spkr_72]",
148176
  "single_word": false,
148177
  "lstrip": false,
148178
  "rstrip": false,
 
148181
  },
148182
  {
148183
  "id": 66720,
148184
+ "content": "[spkr_73]",
148185
  "single_word": false,
148186
  "lstrip": false,
148187
  "rstrip": false,
 
148190
  },
148191
  {
148192
  "id": 66721,
148193
+ "content": "[spkr_74]",
148194
  "single_word": false,
148195
  "lstrip": false,
148196
  "rstrip": false,
 
148199
  },
148200
  {
148201
  "id": 66722,
148202
+ "content": "[spkr_75]",
148203
  "single_word": false,
148204
  "lstrip": false,
148205
  "rstrip": false,
 
148208
  },
148209
  {
148210
  "id": 66723,
148211
+ "content": "[spkr_76]",
148212
  "single_word": false,
148213
  "lstrip": false,
148214
  "rstrip": false,
 
148217
  },
148218
  {
148219
  "id": 66724,
148220
+ "content": "[spkr_77]",
148221
  "single_word": false,
148222
  "lstrip": false,
148223
  "rstrip": false,
tokenizer_config.json CHANGED
@@ -7,7 +7,7 @@
7
  "normalized": true,
8
  "rstrip": false,
9
  "single_word": false,
10
- "special": true
11
  },
12
  "50257": {
13
  "content": "[aco_0]",
@@ -131130,7 +131130,7 @@
131130
  "special": false
131131
  },
131132
  "66647": {
131133
- "content": "[spkr_mls_eng_10k_6454]",
131134
  "lstrip": false,
131135
  "normalized": true,
131136
  "rstrip": false,
@@ -131138,7 +131138,7 @@
131138
  "special": false
131139
  },
131140
  "66648": {
131141
- "content": "[spkr_mls_eng_10k_10801]",
131142
  "lstrip": false,
131143
  "normalized": true,
131144
  "rstrip": false,
@@ -131146,7 +131146,7 @@
131146
  "special": false
131147
  },
131148
  "66649": {
131149
- "content": "[spkr_mls_eng_10k_7756]",
131150
  "lstrip": false,
131151
  "normalized": true,
131152
  "rstrip": false,
@@ -131154,7 +131154,7 @@
131154
  "special": false
131155
  },
131156
  "66650": {
131157
- "content": "[spkr_mls_eng_10k_4078]",
131158
  "lstrip": false,
131159
  "normalized": true,
131160
  "rstrip": false,
@@ -131162,7 +131162,7 @@
131162
  "special": false
131163
  },
131164
  "66651": {
131165
- "content": "[spkr_mls_eng_10k_2156]",
131166
  "lstrip": false,
131167
  "normalized": true,
131168
  "rstrip": false,
@@ -131170,7 +131170,7 @@
131170
  "special": false
131171
  },
131172
  "66652": {
131173
- "content": "[spkr_mls_eng_10k_3645]",
131174
  "lstrip": false,
131175
  "normalized": true,
131176
  "rstrip": false,
@@ -131178,7 +131178,7 @@
131178
  "special": false
131179
  },
131180
  "66653": {
131181
- "content": "[spkr_mls_eng_10k_8713]",
131182
  "lstrip": false,
131183
  "normalized": true,
131184
  "rstrip": false,
@@ -131186,7 +131186,7 @@
131186
  "special": false
131187
  },
131188
  "66654": {
131189
- "content": "[spkr_mls_eng_10k_3157]",
131190
  "lstrip": false,
131191
  "normalized": true,
131192
  "rstrip": false,
@@ -131194,7 +131194,7 @@
131194
  "special": false
131195
  },
131196
  "66655": {
131197
- "content": "[spkr_mls_eng_10k_5717]",
131198
  "lstrip": false,
131199
  "normalized": true,
131200
  "rstrip": false,
@@ -131202,7 +131202,7 @@
131202
  "special": false
131203
  },
131204
  "66656": {
131205
- "content": "[spkr_mls_eng_10k_3488]",
131206
  "lstrip": false,
131207
  "normalized": true,
131208
  "rstrip": false,
@@ -131210,7 +131210,7 @@
131210
  "special": false
131211
  },
131212
  "66657": {
131213
- "content": "[spkr_mls_eng_10k_10191]",
131214
  "lstrip": false,
131215
  "normalized": true,
131216
  "rstrip": false,
@@ -131218,7 +131218,7 @@
131218
  "special": false
131219
  },
131220
  "66658": {
131221
- "content": "[spkr_mls_eng_10k_11697]",
131222
  "lstrip": false,
131223
  "normalized": true,
131224
  "rstrip": false,
@@ -131226,7 +131226,7 @@
131226
  "special": false
131227
  },
131228
  "66659": {
131229
- "content": "[spkr_mls_eng_10k_1401]",
131230
  "lstrip": false,
131231
  "normalized": true,
131232
  "rstrip": false,
@@ -131234,7 +131234,7 @@
131234
  "special": false
131235
  },
131236
  "66660": {
131237
- "content": "[spkr_mls_eng_10k_4018]",
131238
  "lstrip": false,
131239
  "normalized": true,
131240
  "rstrip": false,
@@ -131242,7 +131242,7 @@
131242
  "special": false
131243
  },
131244
  "66661": {
131245
- "content": "[spkr_mls_eng_10k_7879]",
131246
  "lstrip": false,
131247
  "normalized": true,
131248
  "rstrip": false,
@@ -131250,7 +131250,7 @@
131250
  "special": false
131251
  },
131252
  "66662": {
131253
- "content": "[spkr_mls_eng_10k_204]",
131254
  "lstrip": false,
131255
  "normalized": true,
131256
  "rstrip": false,
@@ -131258,7 +131258,7 @@
131258
  "special": false
131259
  },
131260
  "66663": {
131261
- "content": "[spkr_mls_eng_10k_8677]",
131262
  "lstrip": false,
131263
  "normalized": true,
131264
  "rstrip": false,
@@ -131266,7 +131266,7 @@
131266
  "special": false
131267
  },
131268
  "66664": {
131269
- "content": "[spkr_mls_eng_10k_107]",
131270
  "lstrip": false,
131271
  "normalized": true,
131272
  "rstrip": false,
@@ -131274,7 +131274,7 @@
131274
  "special": false
131275
  },
131276
  "66665": {
131277
- "content": "[spkr_mls_eng_10k_1259]",
131278
  "lstrip": false,
131279
  "normalized": true,
131280
  "rstrip": false,
@@ -131282,7 +131282,7 @@
131282
  "special": false
131283
  },
131284
  "66666": {
131285
- "content": "[spkr_mls_eng_10k_8138]",
131286
  "lstrip": false,
131287
  "normalized": true,
131288
  "rstrip": false,
@@ -131290,7 +131290,7 @@
131290
  "special": false
131291
  },
131292
  "66667": {
131293
- "content": "[spkr_mls_eng_10k_5968]",
131294
  "lstrip": false,
131295
  "normalized": true,
131296
  "rstrip": false,
@@ -131298,7 +131298,7 @@
131298
  "special": false
131299
  },
131300
  "66668": {
131301
- "content": "[spkr_mls_eng_10k_2607]",
131302
  "lstrip": false,
131303
  "normalized": true,
131304
  "rstrip": false,
@@ -131306,7 +131306,7 @@
131306
  "special": false
131307
  },
131308
  "66669": {
131309
- "content": "[spkr_mls_eng_10k_1724]",
131310
  "lstrip": false,
131311
  "normalized": true,
131312
  "rstrip": false,
@@ -131314,7 +131314,7 @@
131314
  "special": false
131315
  },
131316
  "66670": {
131317
- "content": "[spkr_mls_eng_10k_4788]",
131318
  "lstrip": false,
131319
  "normalized": true,
131320
  "rstrip": false,
@@ -131322,7 +131322,7 @@
131322
  "special": false
131323
  },
131324
  "66671": {
131325
- "content": "[spkr_mls_eng_10k_11667]",
131326
  "lstrip": false,
131327
  "normalized": true,
131328
  "rstrip": false,
@@ -131330,7 +131330,7 @@
131330
  "special": false
131331
  },
131332
  "66672": {
131333
- "content": "[spkr_mls_eng_10k_3681]",
131334
  "lstrip": false,
131335
  "normalized": true,
131336
  "rstrip": false,
@@ -131338,7 +131338,7 @@
131338
  "special": false
131339
  },
131340
  "66673": {
131341
- "content": "[spkr_mls_eng_10k_6671]",
131342
  "lstrip": false,
131343
  "normalized": true,
131344
  "rstrip": false,
@@ -131346,7 +131346,7 @@
131346
  "special": false
131347
  },
131348
  "66674": {
131349
- "content": "[spkr_mls_eng_10k_6670]",
131350
  "lstrip": false,
131351
  "normalized": true,
131352
  "rstrip": false,
@@ -131354,7 +131354,7 @@
131354
  "special": false
131355
  },
131356
  "66675": {
131357
- "content": "[spkr_mls_eng_10k_2234]",
131358
  "lstrip": false,
131359
  "normalized": true,
131360
  "rstrip": false,
@@ -131362,7 +131362,7 @@
131362
  "special": false
131363
  },
131364
  "66676": {
131365
- "content": "[spkr_mls_eng_10k_10244]",
131366
  "lstrip": false,
131367
  "normalized": true,
131368
  "rstrip": false,
@@ -131370,7 +131370,7 @@
131370
  "special": false
131371
  },
131372
  "66677": {
131373
- "content": "[spkr_mls_eng_10k_5985]",
131374
  "lstrip": false,
131375
  "normalized": true,
131376
  "rstrip": false,
@@ -131378,7 +131378,7 @@
131378
  "special": false
131379
  },
131380
  "66678": {
131381
- "content": "[spkr_mls_eng_10k_3699]",
131382
  "lstrip": false,
131383
  "normalized": true,
131384
  "rstrip": false,
@@ -131386,7 +131386,7 @@
131386
  "special": false
131387
  },
131388
  "66679": {
131389
- "content": "[spkr_mls_eng_10k_3003]",
131390
  "lstrip": false,
131391
  "normalized": true,
131392
  "rstrip": false,
@@ -131394,7 +131394,7 @@
131394
  "special": false
131395
  },
131396
  "66680": {
131397
- "content": "[spkr_mls_eng_10k_4174]",
131398
  "lstrip": false,
131399
  "normalized": true,
131400
  "rstrip": false,
@@ -131402,7 +131402,7 @@
131402
  "special": false
131403
  },
131404
  "66681": {
131405
- "content": "[spkr_mls_eng_10k_6660]",
131406
  "lstrip": false,
131407
  "normalized": true,
131408
  "rstrip": false,
@@ -131410,7 +131410,7 @@
131410
  "special": false
131411
  },
131412
  "66682": {
131413
- "content": "[spkr_mls_eng_10k_9017]",
131414
  "lstrip": false,
131415
  "normalized": true,
131416
  "rstrip": false,
@@ -131418,7 +131418,7 @@
131418
  "special": false
131419
  },
131420
  "66683": {
131421
- "content": "[spkr_mls_eng_10k_5304]",
131422
  "lstrip": false,
131423
  "normalized": true,
131424
  "rstrip": false,
@@ -131426,7 +131426,7 @@
131426
  "special": false
131427
  },
131428
  "66684": {
131429
- "content": "[spkr_mls_eng_10k_6687]",
131430
  "lstrip": false,
131431
  "normalized": true,
131432
  "rstrip": false,
@@ -131434,7 +131434,7 @@
131434
  "special": false
131435
  },
131436
  "66685": {
131437
- "content": "[spkr_mls_eng_10k_6497]",
131438
  "lstrip": false,
131439
  "normalized": true,
131440
  "rstrip": false,
@@ -131442,7 +131442,7 @@
131442
  "special": false
131443
  },
131444
  "66686": {
131445
- "content": "[spkr_mls_eng_10k_3595]",
131446
  "lstrip": false,
131447
  "normalized": true,
131448
  "rstrip": false,
@@ -131450,7 +131450,7 @@
131450
  "special": false
131451
  },
131452
  "66687": {
131453
- "content": "[spkr_mls_eng_10k_4064]",
131454
  "lstrip": false,
131455
  "normalized": true,
131456
  "rstrip": false,
@@ -131458,7 +131458,7 @@
131458
  "special": false
131459
  },
131460
  "66688": {
131461
- "content": "[spkr_mls_eng_10k_3657]",
131462
  "lstrip": false,
131463
  "normalized": true,
131464
  "rstrip": false,
@@ -131466,7 +131466,7 @@
131466
  "special": false
131467
  },
131468
  "66689": {
131469
- "content": "[spkr_mls_eng_10k_3967]",
131470
  "lstrip": false,
131471
  "normalized": true,
131472
  "rstrip": false,
@@ -131474,7 +131474,7 @@
131474
  "special": false
131475
  },
131476
  "66690": {
131477
- "content": "[spkr_mls_eng_10k_8011]",
131478
  "lstrip": false,
131479
  "normalized": true,
131480
  "rstrip": false,
@@ -131482,7 +131482,7 @@
131482
  "special": false
131483
  },
131484
  "66691": {
131485
- "content": "[spkr_mls_eng_10k_10463]",
131486
  "lstrip": false,
131487
  "normalized": true,
131488
  "rstrip": false,
@@ -131490,7 +131490,7 @@
131490
  "special": false
131491
  },
131492
  "66692": {
131493
- "content": "[spkr_hifi_tts_9017]",
131494
  "lstrip": false,
131495
  "normalized": true,
131496
  "rstrip": false,
@@ -131498,7 +131498,7 @@
131498
  "special": false
131499
  },
131500
  "66693": {
131501
- "content": "[spkr_hifi_tts_6097]",
131502
  "lstrip": false,
131503
  "normalized": true,
131504
  "rstrip": false,
@@ -131506,7 +131506,7 @@
131506
  "special": false
131507
  },
131508
  "66694": {
131509
- "content": "[spkr_hifi_tts_92]",
131510
  "lstrip": false,
131511
  "normalized": true,
131512
  "rstrip": false,
@@ -131514,7 +131514,7 @@
131514
  "special": false
131515
  },
131516
  "66695": {
131517
- "content": "[spkr_expresso_ex02]",
131518
  "lstrip": false,
131519
  "normalized": true,
131520
  "rstrip": false,
@@ -131522,7 +131522,7 @@
131522
  "special": false
131523
  },
131524
  "66696": {
131525
- "content": "[spkr_expresso_ex03]",
131526
  "lstrip": false,
131527
  "normalized": true,
131528
  "rstrip": false,
@@ -131530,7 +131530,7 @@
131530
  "special": false
131531
  },
131532
  "66697": {
131533
- "content": "[spkr_expresso_ex04]",
131534
  "lstrip": false,
131535
  "normalized": true,
131536
  "rstrip": false,
@@ -131538,7 +131538,7 @@
131538
  "special": false
131539
  },
131540
  "66698": {
131541
- "content": "[spkr_expresso_ex01]",
131542
  "lstrip": false,
131543
  "normalized": true,
131544
  "rstrip": false,
@@ -131546,7 +131546,7 @@
131546
  "special": false
131547
  },
131548
  "66699": {
131549
- "content": "[spkr_jenny_jenny]",
131550
  "lstrip": false,
131551
  "normalized": true,
131552
  "rstrip": false,
@@ -131554,7 +131554,7 @@
131554
  "special": false
131555
  },
131556
  "66700": {
131557
- "content": "[spkr_youtube_webds_hi_kabitaskitchen]",
131558
  "lstrip": false,
131559
  "normalized": true,
131560
  "rstrip": false,
@@ -131562,7 +131562,7 @@
131562
  "special": false
131563
  },
131564
  "66701": {
131565
- "content": "[spkr_youtube_webds_hi_unacademyjee]",
131566
  "lstrip": false,
131567
  "normalized": true,
131568
  "rstrip": false,
@@ -131570,7 +131570,7 @@
131570
  "special": false
131571
  },
131572
  "66702": {
131573
- "content": "[spkr_youtube_webds_hi_technicalguruji]",
131574
  "lstrip": false,
131575
  "normalized": true,
131576
  "rstrip": false,
@@ -131578,7 +131578,7 @@
131578
  "special": false
131579
  },
131580
  "66703": {
131581
- "content": "[spkr_youtube_webds_en_teded]",
131582
  "lstrip": false,
131583
  "normalized": true,
131584
  "rstrip": false,
@@ -131586,7 +131586,7 @@
131586
  "special": false
131587
  },
131588
  "66704": {
131589
- "content": "[spkr_youtube_webds_hi_physicswallah]",
131590
  "lstrip": false,
131591
  "normalized": true,
131592
  "rstrip": false,
@@ -131594,7 +131594,7 @@
131594
  "special": false
131595
  },
131596
  "66705": {
131597
- "content": "[spkr_youtube_webds_en_akshat]",
131598
  "lstrip": false,
131599
  "normalized": true,
131600
  "rstrip": false,
@@ -131602,7 +131602,7 @@
131602
  "special": false
131603
  },
131604
  "66706": {
131605
- "content": "[spkr_youtube_webds_hi_dhruvrathee]",
131606
  "lstrip": false,
131607
  "normalized": true,
131608
  "rstrip": false,
@@ -131610,7 +131610,7 @@
131610
  "special": false
131611
  },
131612
  "66707": {
131613
- "content": "[spkr_youtube_webds_hi_neelimaaudiobooks]",
131614
  "lstrip": false,
131615
  "normalized": true,
131616
  "rstrip": false,
@@ -131618,7 +131618,7 @@
131618
  "special": false
131619
  },
131620
  "66708": {
131621
- "content": "[spkr_youtube_webds_hi_ranveerallahbadia]",
131622
  "lstrip": false,
131623
  "normalized": true,
131624
  "rstrip": false,
@@ -131626,7 +131626,7 @@
131626
  "special": false
131627
  },
131628
  "66709": {
131629
- "content": "[spkr_youtube_webds_hi_hindiaudiobooks]",
131630
  "lstrip": false,
131631
  "normalized": true,
131632
  "rstrip": false,
@@ -131634,7 +131634,7 @@
131634
  "special": false
131635
  },
131636
  "66710": {
131637
- "content": "[spkr_youtube_webds_en_historyofindia]",
131638
  "lstrip": false,
131639
  "normalized": true,
131640
  "rstrip": false,
@@ -131642,7 +131642,7 @@
131642
  "special": false
131643
  },
131644
  "66711": {
131645
- "content": "[spkr_youtube_webds_hi_vivekbindra]",
131646
  "lstrip": false,
131647
  "normalized": true,
131648
  "rstrip": false,
@@ -131650,7 +131650,7 @@
131650
  "special": false
131651
  },
131652
  "66712": {
131653
- "content": "[spkr_youtube_webds_hi_sandeepmaheshwari]",
131654
  "lstrip": false,
131655
  "normalized": true,
131656
  "rstrip": false,
@@ -131658,7 +131658,7 @@
131658
  "special": false
131659
  },
131660
  "66713": {
131661
- "content": "[spkr_youtube_webds_hi_pmmodi]",
131662
  "lstrip": false,
131663
  "normalized": true,
131664
  "rstrip": false,
@@ -131666,7 +131666,7 @@
131666
  "special": false
131667
  },
131668
  "66714": {
131669
- "content": "[spkr_youtube_webds_en_mkbhd]",
131670
  "lstrip": false,
131671
  "normalized": true,
131672
  "rstrip": false,
@@ -131674,7 +131674,7 @@
131674
  "special": false
131675
  },
131676
  "66715": {
131677
- "content": "[spkr_youtube_webds_en_secondhandstories]",
131678
  "lstrip": false,
131679
  "normalized": true,
131680
  "rstrip": false,
@@ -131682,7 +131682,7 @@
131682
  "special": false
131683
  },
131684
  "66716": {
131685
- "content": "[spkr_youtube_webds_en_storiesofmahabharatha]",
131686
  "lstrip": false,
131687
  "normalized": true,
131688
  "rstrip": false,
@@ -131690,7 +131690,7 @@
131690
  "special": false
131691
  },
131692
  "66717": {
131693
- "content": "[spkr_youtube_webds_hi_a2motivation]",
131694
  "lstrip": false,
131695
  "normalized": true,
131696
  "rstrip": false,
@@ -131698,7 +131698,7 @@
131698
  "special": false
131699
  },
131700
  "66718": {
131701
- "content": "[spkr_youtube_webds_hi_mrbeast]",
131702
  "lstrip": false,
131703
  "normalized": true,
131704
  "rstrip": false,
@@ -131706,7 +131706,7 @@
131706
  "special": false
131707
  },
131708
  "66719": {
131709
- "content": "[spkr_youtube_webds_hi_akshat]",
131710
  "lstrip": false,
131711
  "normalized": true,
131712
  "rstrip": false,
@@ -131714,7 +131714,7 @@
131714
  "special": false
131715
  },
131716
  "66720": {
131717
- "content": "[spkr_shrutilipi_hi_shrutilipi]",
131718
  "lstrip": false,
131719
  "normalized": true,
131720
  "rstrip": false,
@@ -131722,7 +131722,7 @@
131722
  "special": false
131723
  },
131724
  "66721": {
131725
- "content": "[spkr_youtube_webds_en_derekperkins]",
131726
  "lstrip": false,
131727
  "normalized": true,
131728
  "rstrip": false,
@@ -131730,7 +131730,7 @@
131730
  "special": false
131731
  },
131732
  "66722": {
131733
- "content": "[spkr_youtube_webds_en_mukesh]",
131734
  "lstrip": false,
131735
  "normalized": true,
131736
  "rstrip": false,
@@ -131738,7 +131738,7 @@
131738
  "special": false
131739
  },
131740
  "66723": {
131741
- "content": "[spkr_youtube_webds_en_attenborough]",
131742
  "lstrip": false,
131743
  "normalized": true,
131744
  "rstrip": false,
@@ -131746,7 +131746,7 @@
131746
  "special": false
131747
  },
131748
  "66724": {
131749
- "content": "[spkr_youtube_webds_hi_warikoo]",
131750
  "lstrip": false,
131751
  "normalized": true,
131752
  "rstrip": false,
@@ -131755,7 +131755,7 @@
131755
  }
131756
  },
131757
  "bos_token": "<|endoftext|>",
131758
- "clean_up_tokenization_spaces": true,
131759
  "eos_token": "<|endoftext|>",
131760
  "model_max_length": 1024,
131761
  "tokenizer_class": "GPT2Tokenizer",
 
7
  "normalized": true,
8
  "rstrip": false,
9
  "single_word": false,
10
+ "special": false
11
  },
12
  "50257": {
13
  "content": "[aco_0]",
 
131130
  "special": false
131131
  },
131132
  "66647": {
131133
+ "content": "[spkr_0]",
131134
  "lstrip": false,
131135
  "normalized": true,
131136
  "rstrip": false,
 
131138
  "special": false
131139
  },
131140
  "66648": {
131141
+ "content": "[spkr_1]",
131142
  "lstrip": false,
131143
  "normalized": true,
131144
  "rstrip": false,
 
131146
  "special": false
131147
  },
131148
  "66649": {
131149
+ "content": "[spkr_2]",
131150
  "lstrip": false,
131151
  "normalized": true,
131152
  "rstrip": false,
 
131154
  "special": false
131155
  },
131156
  "66650": {
131157
+ "content": "[spkr_3]",
131158
  "lstrip": false,
131159
  "normalized": true,
131160
  "rstrip": false,
 
131162
  "special": false
131163
  },
131164
  "66651": {
131165
+ "content": "[spkr_4]",
131166
  "lstrip": false,
131167
  "normalized": true,
131168
  "rstrip": false,
 
131170
  "special": false
131171
  },
131172
  "66652": {
131173
+ "content": "[spkr_5]",
131174
  "lstrip": false,
131175
  "normalized": true,
131176
  "rstrip": false,
 
131178
  "special": false
131179
  },
131180
  "66653": {
131181
+ "content": "[spkr_6]",
131182
  "lstrip": false,
131183
  "normalized": true,
131184
  "rstrip": false,
 
131186
  "special": false
131187
  },
131188
  "66654": {
131189
+ "content": "[spkr_7]",
131190
  "lstrip": false,
131191
  "normalized": true,
131192
  "rstrip": false,
 
131194
  "special": false
131195
  },
131196
  "66655": {
131197
+ "content": "[spkr_8]",
131198
  "lstrip": false,
131199
  "normalized": true,
131200
  "rstrip": false,
 
131202
  "special": false
131203
  },
131204
  "66656": {
131205
+ "content": "[spkr_9]",
131206
  "lstrip": false,
131207
  "normalized": true,
131208
  "rstrip": false,
 
131210
  "special": false
131211
  },
131212
  "66657": {
131213
+ "content": "[spkr_10]",
131214
  "lstrip": false,
131215
  "normalized": true,
131216
  "rstrip": false,
 
131218
  "special": false
131219
  },
131220
  "66658": {
131221
+ "content": "[spkr_11]",
131222
  "lstrip": false,
131223
  "normalized": true,
131224
  "rstrip": false,
 
131226
  "special": false
131227
  },
131228
  "66659": {
131229
+ "content": "[spkr_12]",
131230
  "lstrip": false,
131231
  "normalized": true,
131232
  "rstrip": false,
 
131234
  "special": false
131235
  },
131236
  "66660": {
131237
+ "content": "[spkr_13]",
131238
  "lstrip": false,
131239
  "normalized": true,
131240
  "rstrip": false,
 
131242
  "special": false
131243
  },
131244
  "66661": {
131245
+ "content": "[spkr_14]",
131246
  "lstrip": false,
131247
  "normalized": true,
131248
  "rstrip": false,
 
131250
  "special": false
131251
  },
131252
  "66662": {
131253
+ "content": "[spkr_15]",
131254
  "lstrip": false,
131255
  "normalized": true,
131256
  "rstrip": false,
 
131258
  "special": false
131259
  },
131260
  "66663": {
131261
+ "content": "[spkr_16]",
131262
  "lstrip": false,
131263
  "normalized": true,
131264
  "rstrip": false,
 
131266
  "special": false
131267
  },
131268
  "66664": {
131269
+ "content": "[spkr_17]",
131270
  "lstrip": false,
131271
  "normalized": true,
131272
  "rstrip": false,
 
131274
  "special": false
131275
  },
131276
  "66665": {
131277
+ "content": "[spkr_18]",
131278
  "lstrip": false,
131279
  "normalized": true,
131280
  "rstrip": false,
 
131282
  "special": false
131283
  },
131284
  "66666": {
131285
+ "content": "[spkr_19]",
131286
  "lstrip": false,
131287
  "normalized": true,
131288
  "rstrip": false,
 
131290
  "special": false
131291
  },
131292
  "66667": {
131293
+ "content": "[spkr_20]",
131294
  "lstrip": false,
131295
  "normalized": true,
131296
  "rstrip": false,
 
131298
  "special": false
131299
  },
131300
  "66668": {
131301
+ "content": "[spkr_21]",
131302
  "lstrip": false,
131303
  "normalized": true,
131304
  "rstrip": false,
 
131306
  "special": false
131307
  },
131308
  "66669": {
131309
+ "content": "[spkr_22]",
131310
  "lstrip": false,
131311
  "normalized": true,
131312
  "rstrip": false,
 
131314
  "special": false
131315
  },
131316
  "66670": {
131317
+ "content": "[spkr_23]",
131318
  "lstrip": false,
131319
  "normalized": true,
131320
  "rstrip": false,
 
131322
  "special": false
131323
  },
131324
  "66671": {
131325
+ "content": "[spkr_24]",
131326
  "lstrip": false,
131327
  "normalized": true,
131328
  "rstrip": false,
 
131330
  "special": false
131331
  },
131332
  "66672": {
131333
+ "content": "[spkr_25]",
131334
  "lstrip": false,
131335
  "normalized": true,
131336
  "rstrip": false,
 
131338
  "special": false
131339
  },
131340
  "66673": {
131341
+ "content": "[spkr_26]",
131342
  "lstrip": false,
131343
  "normalized": true,
131344
  "rstrip": false,
 
131346
  "special": false
131347
  },
131348
  "66674": {
131349
+ "content": "[spkr_27]",
131350
  "lstrip": false,
131351
  "normalized": true,
131352
  "rstrip": false,
 
131354
  "special": false
131355
  },
131356
  "66675": {
131357
+ "content": "[spkr_28]",
131358
  "lstrip": false,
131359
  "normalized": true,
131360
  "rstrip": false,
 
131362
  "special": false
131363
  },
131364
  "66676": {
131365
+ "content": "[spkr_29]",
131366
  "lstrip": false,
131367
  "normalized": true,
131368
  "rstrip": false,
 
131370
  "special": false
131371
  },
131372
  "66677": {
131373
+ "content": "[spkr_30]",
131374
  "lstrip": false,
131375
  "normalized": true,
131376
  "rstrip": false,
 
131378
  "special": false
131379
  },
131380
  "66678": {
131381
+ "content": "[spkr_31]",
131382
  "lstrip": false,
131383
  "normalized": true,
131384
  "rstrip": false,
 
131386
  "special": false
131387
  },
131388
  "66679": {
131389
+ "content": "[spkr_32]",
131390
  "lstrip": false,
131391
  "normalized": true,
131392
  "rstrip": false,
 
131394
  "special": false
131395
  },
131396
  "66680": {
131397
+ "content": "[spkr_33]",
131398
  "lstrip": false,
131399
  "normalized": true,
131400
  "rstrip": false,
 
131402
  "special": false
131403
  },
131404
  "66681": {
131405
+ "content": "[spkr_34]",
131406
  "lstrip": false,
131407
  "normalized": true,
131408
  "rstrip": false,
 
131410
  "special": false
131411
  },
131412
  "66682": {
131413
+ "content": "[spkr_35]",
131414
  "lstrip": false,
131415
  "normalized": true,
131416
  "rstrip": false,
 
131418
  "special": false
131419
  },
131420
  "66683": {
131421
+ "content": "[spkr_36]",
131422
  "lstrip": false,
131423
  "normalized": true,
131424
  "rstrip": false,
 
131426
  "special": false
131427
  },
131428
  "66684": {
131429
+ "content": "[spkr_37]",
131430
  "lstrip": false,
131431
  "normalized": true,
131432
  "rstrip": false,
 
131434
  "special": false
131435
  },
131436
  "66685": {
131437
+ "content": "[spkr_38]",
131438
  "lstrip": false,
131439
  "normalized": true,
131440
  "rstrip": false,
 
131442
  "special": false
131443
  },
131444
  "66686": {
131445
+ "content": "[spkr_39]",
131446
  "lstrip": false,
131447
  "normalized": true,
131448
  "rstrip": false,
 
131450
  "special": false
131451
  },
131452
  "66687": {
131453
+ "content": "[spkr_40]",
131454
  "lstrip": false,
131455
  "normalized": true,
131456
  "rstrip": false,
 
131458
  "special": false
131459
  },
131460
  "66688": {
131461
+ "content": "[spkr_41]",
131462
  "lstrip": false,
131463
  "normalized": true,
131464
  "rstrip": false,
 
131466
  "special": false
131467
  },
131468
  "66689": {
131469
+ "content": "[spkr_42]",
131470
  "lstrip": false,
131471
  "normalized": true,
131472
  "rstrip": false,
 
131474
  "special": false
131475
  },
131476
  "66690": {
131477
+ "content": "[spkr_43]",
131478
  "lstrip": false,
131479
  "normalized": true,
131480
  "rstrip": false,
 
131482
  "special": false
131483
  },
131484
  "66691": {
131485
+ "content": "[spkr_44]",
131486
  "lstrip": false,
131487
  "normalized": true,
131488
  "rstrip": false,
 
131490
  "special": false
131491
  },
131492
  "66692": {
131493
+ "content": "[spkr_45]",
131494
  "lstrip": false,
131495
  "normalized": true,
131496
  "rstrip": false,
 
131498
  "special": false
131499
  },
131500
  "66693": {
131501
+ "content": "[spkr_46]",
131502
  "lstrip": false,
131503
  "normalized": true,
131504
  "rstrip": false,
 
131506
  "special": false
131507
  },
131508
  "66694": {
131509
+ "content": "[spkr_47]",
131510
  "lstrip": false,
131511
  "normalized": true,
131512
  "rstrip": false,
 
131514
  "special": false
131515
  },
131516
  "66695": {
131517
+ "content": "[spkr_48]",
131518
  "lstrip": false,
131519
  "normalized": true,
131520
  "rstrip": false,
 
131522
  "special": false
131523
  },
131524
  "66696": {
131525
+ "content": "[spkr_49]",
131526
  "lstrip": false,
131527
  "normalized": true,
131528
  "rstrip": false,
 
131530
  "special": false
131531
  },
131532
  "66697": {
131533
+ "content": "[spkr_50]",
131534
  "lstrip": false,
131535
  "normalized": true,
131536
  "rstrip": false,
 
131538
  "special": false
131539
  },
131540
  "66698": {
131541
+ "content": "[spkr_51]",
131542
  "lstrip": false,
131543
  "normalized": true,
131544
  "rstrip": false,
 
131546
  "special": false
131547
  },
131548
  "66699": {
131549
+ "content": "[spkr_52]",
131550
  "lstrip": false,
131551
  "normalized": true,
131552
  "rstrip": false,
 
131554
  "special": false
131555
  },
131556
  "66700": {
131557
+ "content": "[spkr_53]",
131558
  "lstrip": false,
131559
  "normalized": true,
131560
  "rstrip": false,
 
131562
  "special": false
131563
  },
131564
  "66701": {
131565
+ "content": "[spkr_54]",
131566
  "lstrip": false,
131567
  "normalized": true,
131568
  "rstrip": false,
 
131570
  "special": false
131571
  },
131572
  "66702": {
131573
+ "content": "[spkr_55]",
131574
  "lstrip": false,
131575
  "normalized": true,
131576
  "rstrip": false,
 
131578
  "special": false
131579
  },
131580
  "66703": {
131581
+ "content": "[spkr_56]",
131582
  "lstrip": false,
131583
  "normalized": true,
131584
  "rstrip": false,
 
131586
  "special": false
131587
  },
131588
  "66704": {
131589
+ "content": "[spkr_57]",
131590
  "lstrip": false,
131591
  "normalized": true,
131592
  "rstrip": false,
 
131594
  "special": false
131595
  },
131596
  "66705": {
131597
+ "content": "[spkr_58]",
131598
  "lstrip": false,
131599
  "normalized": true,
131600
  "rstrip": false,
 
131602
  "special": false
131603
  },
131604
  "66706": {
131605
+ "content": "[spkr_59]",
131606
  "lstrip": false,
131607
  "normalized": true,
131608
  "rstrip": false,
 
131610
  "special": false
131611
  },
131612
  "66707": {
131613
+ "content": "[spkr_60]",
131614
  "lstrip": false,
131615
  "normalized": true,
131616
  "rstrip": false,
 
131618
  "special": false
131619
  },
131620
  "66708": {
131621
+ "content": "[spkr_61]",
131622
  "lstrip": false,
131623
  "normalized": true,
131624
  "rstrip": false,
 
131626
  "special": false
131627
  },
131628
  "66709": {
131629
+ "content": "[spkr_62]",
131630
  "lstrip": false,
131631
  "normalized": true,
131632
  "rstrip": false,
 
131634
  "special": false
131635
  },
131636
  "66710": {
131637
+ "content": "[spkr_63]",
131638
  "lstrip": false,
131639
  "normalized": true,
131640
  "rstrip": false,
 
131642
  "special": false
131643
  },
131644
  "66711": {
131645
+ "content": "[spkr_64]",
131646
  "lstrip": false,
131647
  "normalized": true,
131648
  "rstrip": false,
 
131650
  "special": false
131651
  },
131652
  "66712": {
131653
+ "content": "[spkr_65]",
131654
  "lstrip": false,
131655
  "normalized": true,
131656
  "rstrip": false,
 
131658
  "special": false
131659
  },
131660
  "66713": {
131661
+ "content": "[spkr_66]",
131662
  "lstrip": false,
131663
  "normalized": true,
131664
  "rstrip": false,
 
131666
  "special": false
131667
  },
131668
  "66714": {
131669
+ "content": "[spkr_67]",
131670
  "lstrip": false,
131671
  "normalized": true,
131672
  "rstrip": false,
 
131674
  "special": false
131675
  },
131676
  "66715": {
131677
+ "content": "[spkr_68]",
131678
  "lstrip": false,
131679
  "normalized": true,
131680
  "rstrip": false,
 
131682
  "special": false
131683
  },
131684
  "66716": {
131685
+ "content": "[spkr_69]",
131686
  "lstrip": false,
131687
  "normalized": true,
131688
  "rstrip": false,
 
131690
  "special": false
131691
  },
131692
  "66717": {
131693
+ "content": "[spkr_70]",
131694
  "lstrip": false,
131695
  "normalized": true,
131696
  "rstrip": false,
 
131698
  "special": false
131699
  },
131700
  "66718": {
131701
+ "content": "[spkr_71]",
131702
  "lstrip": false,
131703
  "normalized": true,
131704
  "rstrip": false,
 
131706
  "special": false
131707
  },
131708
  "66719": {
131709
+ "content": "[spkr_72]",
131710
  "lstrip": false,
131711
  "normalized": true,
131712
  "rstrip": false,
 
131714
  "special": false
131715
  },
131716
  "66720": {
131717
+ "content": "[spkr_73]",
131718
  "lstrip": false,
131719
  "normalized": true,
131720
  "rstrip": false,
 
131722
  "special": false
131723
  },
131724
  "66721": {
131725
+ "content": "[spkr_74]",
131726
  "lstrip": false,
131727
  "normalized": true,
131728
  "rstrip": false,
 
131730
  "special": false
131731
  },
131732
  "66722": {
131733
+ "content": "[spkr_75]",
131734
  "lstrip": false,
131735
  "normalized": true,
131736
  "rstrip": false,
 
131738
  "special": false
131739
  },
131740
  "66723": {
131741
+ "content": "[spkr_76]",
131742
  "lstrip": false,
131743
  "normalized": true,
131744
  "rstrip": false,
 
131746
  "special": false
131747
  },
131748
  "66724": {
131749
+ "content": "[spkr_77]",
131750
  "lstrip": false,
131751
  "normalized": true,
131752
  "rstrip": false,
 
131755
  }
131756
  },
131757
  "bos_token": "<|endoftext|>",
131758
+ "clean_up_tokenization_spaces": false,
131759
  "eos_token": "<|endoftext|>",
131760
  "model_max_length": 1024,
131761
  "tokenizer_class": "GPT2Tokenizer",