Automatic Speech Recognition
ESPnet
Javanese
audio
Siddhant's picture
import from zenodo
3feb9b8
config: conf/train_asr.yaml
print_config: false
log_level: INFO
dry_run: false
iterator_type: sequence
output_dir: exp/asr_train_asr_raw_bpe1000
ngpu: 1
seed: 0
num_workers: 1
num_att_plot: 3
dist_backend: nccl
dist_init_method: env://
dist_world_size: null
dist_rank: null
local_rank: 0
dist_master_addr: null
dist_master_port: null
dist_launcher: null
multiprocessing_distributed: false
cudnn_enabled: true
cudnn_benchmark: false
cudnn_deterministic: true
collect_stats: false
write_collected_feats: false
max_epoch: 200
patience: 20
val_scheduler_criterion:
- valid
- loss
early_stopping_criterion:
- valid
- loss
- min
best_model_criterion:
- - valid
- acc
- max
keep_nbest_models: 10
grad_clip: 5
grad_clip_type: 2.0
grad_noise: false
accum_grad: 2
no_forward_run: false
resume: true
train_dtype: float32
use_amp: false
log_interval: null
unused_parameters: false
use_tensorboard: true
use_wandb: false
wandb_project: null
wandb_id: null
pretrain_path: null
init_param: []
freeze_param: []
num_iters_per_epoch: null
batch_size: 32
valid_batch_size: null
batch_bins: 1000000
valid_batch_bins: null
train_shape_file:
- exp/asr_stats_raw_bpe1000/train/speech_shape
- exp/asr_stats_raw_bpe1000/train/text_shape.bpe
valid_shape_file:
- exp/asr_stats_raw_bpe1000/valid/speech_shape
- exp/asr_stats_raw_bpe1000/valid/text_shape.bpe
batch_type: folded
valid_batch_type: null
fold_length:
- 80000
- 150
sort_in_batch: descending
sort_batch: descending
multiple_iterator: false
chunk_length: 500
chunk_shift_ratio: 0.5
num_cache_chunks: 1024
train_data_path_and_name_and_type:
- - dump/raw/java_train/wav.scp
- speech
- sound
- - dump/raw/java_train/text
- text
- text
valid_data_path_and_name_and_type:
- - dump/raw/java_dev/wav.scp
- speech
- sound
- - dump/raw/java_dev/text
- text
- text
allow_variable_data_keys: false
max_cache_size: 0.0
max_cache_fd: 32
valid_max_cache_size: null
optim: adam
optim_conf:
lr: 10.0
scheduler: noamlr
scheduler_conf:
warmup_steps: 25000
token_list:
- <blank>
- <unk>
- NG
- E
- S
- I
- H
- N
-
- K
- T
- L
- R
- ▁DI
- AN
- M
- É
- ▁A
- ▁ING
- A
- NA
- NE
- TA
- P
- D
- Y
- RA
- LA
- ▁KA
- SI
- ▁KARO
- U
- TI
- ▁LAN
- RI
- KA
- MA
- ▁MA
- ▁DHATENG
- ▁IKU
- ▁LUNGA
- YA
- ▁SA
- SA
- NI
- O
- ▁MENYA
- G
- WA
- ▁DOLAN
- ▁KE
- LI
- ▁SE
- DA
- GA
- ▁IKI
- ▁PA
- ▁SAK
- ▁S
- LE
- B
- JRONING
- ▁BA
- ▁KANG
- DI
- ▁TANSA
- JA
- RE
- BA
- ▁ELING
- PA
- ▁RA
- ▁DIWUJUDK
- ▁IMPI
- TU
- ▁PUNIKA
- ▁SU
- ▁I
-
- RO
- ▁ANA
- ▁ME
- ▁TA
- MI
- F
- TE
- KU
- TO
- 'ON'
- RU
- ▁SING
- ▁PE
- IPUN
- BU
- ▁SI
- ▁LA
- EN
- ▁KERJA
- ▁E
- LO
- GI
- IN
- KONTRAK
- ▁B
- ▁O
- CA
- ▁UGA
- ER
- ▁SAKA
- ▁DADI
- ▁T
- TAN
- È
- C
- ▁YA
- ▁U
- WI
- ▁NA
- ▁C
- ▁KU
- LU
- ▁K
- ▁RE
- ▁JA
- ▁PER
- ▁WA
- ▁MI
- RAN
- MAN
- AL
- US
- EL
- ▁UNIVERSITY
- ▁NANG
- HA
- ▁DIPUN
- ▁LE
- ▁SEKOLAH
- ▁DA
- ▁INGKANG
- ▁SENENG
- ▁KO
- ▁N
- UN
- 'NO'
- ▁MUSIK
- BI
- LAN
- ▁KUW
- ▁DE
- AR
- KI
- HAN
- ▁GA
- ▁TE
- ▁GE
- ▁BU
- ▁CA
- ▁LAGI
- ▁M
- AKÉ
- Z
- KE
- ▁MU
- ▁AS
- PI
- TH
- UR
- ▁IN
- ▁BE
- TER
- ▁TI
- ▁ALUMN
- ▁WONTEN
- DE
- SE
- CE
- DHA
- GU
- ▁AL
- ▁PI
- ▁NGRUNGOKN
- ▁RO
- MU
- ▁ORA
- PU
- ▁MO
- ▁KANGGO
- ES
- ▁NG
- ▁IS
- DO
- DU
- IS
- WE
- ▁LI
- ▁WI
- AKEN
- ▁BI
- ▁JU
- CH
- OR
- WAN
- ▁BISA
- ▁TU
- J
- NGGA
- ▁SO
- KO
- ▁G
- NDA
- ▁PAN
- UNG
- JU
- AT
- ▁MINANGKA
- W
- ▁GU
- BO
- VI
- ▁AN
- SAN
- ÈN
- ▁BO
- JI
- NIPUN
- ▁TAUN
- ▁KANTHI
- ▁TO
- ▁RI
- ▁P
- ▁SAKING
- ▁NGA
- ▁JE
- YU
- CK
- ANG
- ▁DÉNING
- ▁AR
- ▁UNIVERSITAS
- RAH
- ▁NI
- ▁MAR
- YAN
- ▁KUTHA
- ▁BANJUR
- ▁WONG
- ▁PEN
- ME
- UM
- ▁F
- ▁HA
- ST
- EM
- ▁D
- ▁UTAWA
- ▁DU
- DHU
- ▁NALIKA
- ▁THE
- GO
- AK
- UL
- LAS
- KAN
- BE
- ▁KI
- RANG
- ▁WE
- MO
- ING
- ▁PU
- ▁SIJI
- IT
- ▁PULUH
- ▁BASA
- GAN
- CI
- UT
- ▁OF
- ▁WIS
- YO
- TON
- PO
- ▁LU
- ▁NO
- ▁RU
- ▁CO
- LAH
- DHI
- ▁PRA
- ▁JO
- AH
- ▁KAR
- HO
- ÈK
- ▁PO
- ▁HI
- ET
- ▁DEWI
- ▁FA
- ANGAN
- ▁DADOS
- JO
- ▁PRO
- MBANG
- VE
- OK
- TRA
- ▁YU
- ▁MAN
- IL
- ▁PANG
- LAM
- IR
- LIS
- ▁JENENG
- VA
- ▁HO
- DRA
- WU
- TRI
- ▁INGGIH
- ▁SALAH
- ▁CE
- CO
- ▁MEN
- SON
- BAR
- ▁LO
- ▁UGI
- ▁GO
- EK
- ▁JAM
- ASI
- ▁CI
- ▁NGE
- RY
- IA
- ▁AD
- ▁NING
- ▁DHEWEKE
- NTEN
- ▁SAWIJINING
- ARA
- RIS
- TIK
- ▁PARA
- TAR
- ▁NYE
- ▁HE
- ▁V
- X
- EP
- PER
- AKE
- ▁INDONESIA
- MEN
- ▁SAN
- ▁DO
- WAR
- ▁MB
- ▁INDONÉSIA
- KAKÉ
- BER
- ▁KALIYAN
- ▁RONG
- RIA
- AM
- ▁JAWA
- ▁KAP
- ▁KAN
- ▁NU
- ▁NGANTI
- ▁ART
- ▁VI
- KAKE
- ▁FILM
- LANG
- ▁DHA
- ▁SRI
- DHO
- RENG
- ▁KAYA
- THA
- NGING
- ▁AMARG
- TUR
- DHANG
- CU
- UK
- ▁TELU
- RON
- ▁AYU
- ▁ST
- ▁NGANGGO
- ▁LUWIH
- BAT
- RING
- ▁SAMPUN
- ▁WIWIT
- TEN
- ▁GI
- RAT
- ▁KON
- LIN
- ▁AND
- NAN
- ▁NANGING
- ▁DHÈWÈKÉ
- ▁NEW
- ▁GUNUNG
- ▁Z
- SO
- ▁LORO
- ▁W
- ▁AKÈH
- ▁FO
- PAN
- ▁NDUWÈ
- KAR
- ▁HU
- ▁EWU
- ▁ATUS
- ONG
- ▁DIARANI
- ▁BEN
- ▁PALING
- ▁BAN
- IK
- NING
- ▁WERNA
- V
- OS
- GER
- ▁WOLU
- TIN
- ▁MAU
- AS
- ▁SAM
- ▁FI
- ▁KIDUL
- ▁KALI
- ▁PIYAMBAKIPUN
- ÈL
- DY
- OL
- ▁ENEM
-
- FA
- TOR
- ▁FE
- LIA
- ▁SAGED
- RUS
- TAS
- ZA
- FORD
- BAH
- MPI
- ▁ASAL
- ▁TEMBUNG
- LIK
- ▁SAIKI
- ▁PIN
- ▁JI
- ▁SHA
- BUR
- ▁KAS
- ▁SARI
- ▁WAR
- GEN
- ▁AGUS
- WO
- ▁NUR
- ▁LONDON
- ▁URIP
- MAS
- ▁PITU
- UKU
- ÈR
- WON
- DAH
- ANÉ
- ▁ND
- ▁PAM
- CARA
- ▁MARANG
- VER
- ▁HAM
- ▁LAIR
- ▁WU
- ▁ANAK
- ▁ANGG
- ▁SITI
- ▁DWI
- ARD
- DIA
- ▁KANGG
- ▁ARIF
- MER
- ▁ALI
- ▁SABEN
- MAR
- ▁CITA
- ▁BOTEN
- QI
- ▁HER
- ▁CILIK
- AD
- ▁LAJENG
- ▁PRI
- ▁INSTITUTE
- ▁IBU
- ▁LIMA
- ▁HADI
- ▁PAS
- ▁BANYU
- ▁BER
- Q
- ▁KASEBUT
- ▁ABDUL
- ▁BAMBANG
- ▁TELUNG
- WIS
- ▁KALIH
- ▁DUWÉ
- STER
- ▁ZA
- ▁DIGAWÉ
- ▁ARI
- NTUK
- ▁AWAK
- ▁AREP
- ▁NDUWÉ
- ▁NGG
- ▁ABDULLAH
- ▁TER
- ▁WULANDARI
- ▁ISIH
- ▁YO
- ▁NGU
- ▁RIF
- ▁MUNG
- RUL
- ▁PUTRA
- KON
- ▁MANGGUNG
- ▁NUG
- ▁JINIS
- SEN
- ▁AZ
- ▁JAKARTA
- MIN
- NIA
- ▁SOLO
- ▁EKO
- JAH
- TIF
- ▁DAN
- ▁SETU
- ▁BAL
- ▁AKEH
- NDER
- ▁TAU
- ▁PUJI
- ▁YOGYAKARTA
- ▁TIYANG
- ▁SARASVATI
- ▁PUN
- ▁BALI
- LAR
- NINGSIH
- ▁OR
- ENT
- ▁TENGAH
- ▁PAPAN
- ▁KIRA
- ▁JAKA
- ▁PADHA
- ▁OXFORD
- ▁MULA
- ▁EL
- ▁TUM
- ▁NGLA
- ▁SEN
- TUTI
- ROHO
- ▁SOFYAN
- ▁KABUPATÈN
- ▁WAHHAB
- ▁DHUWUR
- ▁ARUPA
- ▁MAIN
- ▁PRE
- ▁WIT
- ▁DONYA
- ▁TIM
- ▁NYA
- ▁KALEBU
- ▁PANGANAN
- ▁HAR
- FF
- ▁PRASETY
- ▁GEDHÉ
- ▁SAWISÉ
- ▁PUTRI
- TARA
- BINTANG
- LY
- ▁TEGES
- ▁BANGET
- ▁PANJENENGANIPUN
- LLY
- ▁WOH
- ▁PATANG
- ▁MISUWUR
- OLOGI
- ▁KATHAH
- DEN
- ▁CARA
- ▁OMAH
- ▁SHE
- OMB
- ▁NJ
- ▁CAMBRIDGE
- ▁BABAGAN
- MON
- ▁PAPAT
- ▁NAGARA
- ▁TEMP
- ▁SAHA
- HAM
- ▁MANGAN
- ▁SANGA
- ▁AMB
- BAN
- AGE
- ▁GODHONG
- DER
- ▁KAPING
- ▁BAKAL
- ▁LIYA
- ▁EDINBURGH
- ▁DHÉWÉ
- ÈNG
- ▁PERANG
- ▁YÈN
- ▁DUMUNUNG
- PORT
- ▁MER
- ▁PASAR
- ▁POP
- ▁PROVINSI
- ▁UMUM
- ▁US
- ▁SANGALAS
- ▁UTAMA
- ▁DIKENAL
- ▁CACAH
- LUK
- ▁WEWENGKON
- ▁GAD
- ▁INDIA
- ▁DAWA
- VO
- ▁YORK
- ▁BAB
- ▁BAHAN
- ▁JENENGÉ
- ▁KEMBANG
- ▁WETON
- ▁MENAW
- ▁MÈ
- ▁PULO
- '?'
- ▁DON
- ▁TANDURAN
- ▁KRAJAN
- ▁PITUNG
- ▁SINETRON
- ▁GRA
- ▁RAJA
- ▁JAMAN
- ▁TEN
- ▁KRA
- ▁BENTUK
- ▁SANGANG
- ▁UTAWI
- ▁WUJUD
- ▁SUKU
- ▁JOHN
- ▁KOMP
- ▁LANGKUNG
- ▁ASRING
- ▁BAPAK
- ▁HARV
- ▁INGGRIS
- ▁SISIH
- ▁DHEWEKÉ
- ▁YEN
- ▁MITURUT
- ▁TANPA
- ▁KRI
- DUR
- ▁LAGU
- ▁PUNGKASAN
- ▁LOR
- ▁ANGGOTA
- ▁PUTIH
- ▁SALIYANÉ
- ▁AZHAR
- ▁DISEBUT
- ▁KUDU
- ▁SETUNGGAL
- ▁AKSARA
- ▁BRAD
- ▁ANTARA
- NWAR
- ▁GAWÉ
- ▁MANUNGSA
- ▁GADHAH
- ▁COLLEGE
- ▁CHRIS
- ▁STAM
- ▁DAGING
- ▁KEREP
- ▁KABÈH
- UPAYA
- ▁BAGÉYAN
- ▁CHUNG
- ▁IWAK
- ▁KADOS
- ▁JEPANG
- ▁KHAS
- ▁APIK
- ▁YOU
- ▁WAYANG
- ▁WEKTU
- ▁BIYASANÉ
- ▁LIYANÉ
- ▁KULIT
- MPUNG
- ▁KULON
- ▁HIJRAH
- ▁DAVID
- ▁WÉTAN
- ▁SEKET
- RISTOL
- ▁DHAÉRAH
- ▁TEKAN
- ▁BANDUNG
- ▁KÉWAN
- ▁MANGSA
- ▁BADH
- ▁AGENG
- ▁PANGGONAN
- ▁SEMARANG
- ▁QU
- ▁ABANG
- ▁BIASANÉ
- ▁WOR
- ▁DÉNÉ
- ▁GAMELAN
- ▁YAIKU
- ▁CHE
- ▁NASIONAL
- KANGKU
- ▁POL
- ▁DÉSA
- ▁TULADHA
- ▁SATUNGGALING
- ▁SHI
- ▁UKURAN
- ▁NGANTOS
- ▁ALBUM
- BANGUN
- ANGGEP
- ▁TLATAH
- ▁SURABAYA
- ▁WADON
- ▁UMUR
- ▁MANÈH
- ▁SATUS
- ▁RÉ
- ▁MUHAMMAD
- CAMPUR
- JENG
- ▁AHMAD
- ▁BOCAH
- ▁BIASA
- ▁NGISOR
- ▁SEDAYA
- ▁MANCHESTER
- ▁JESSI
- ▁MANUK
- ▁SISTEM
- ▁SONGOLAS
- ▁DAMEL
- ▁WAGENINGEN
- ▁PIRANTI
- ▁PIYAMBAK
- ▁AKTING
- DHÉ
- ▁WALANDA
- ▁JERMAN
- ▁KECAMATAN
- ISME
- ▁ANYAR
- ▁AGAMA
- ▁SEPULUH
- ▁PAPUA
- ▁CEDHAK
- ▁CHI
- ▁KAGUNGAN
- ▁BÉDA
- ▁BOGOR
- ▁SAWETARA
- ▁WOLULAS
- ▁NGGADHAH
- ▁PEMAIN
- ▁SANGET
- ▁KALEBET
- ▁SWIDAK
- ▁WILLIAM
- ▁SASTRA
- ▁ACEH
- ▁GARWA
- ▁MALIH
- ▁THAILAND
- ▁MBOTEN
- ▁WANGUN
- ▁OPERA
- ▁PUSAT
- ▁AMERIKA
- ▁FILIPINA
- ▁MIWIT
- ▁LOMBOK
- ▁PADANG
- ▁PENYANYI
- ▁ÉROPAH
- ▁PEMB
- ▁LEMAH
- ▁MANGGON
- ▁END
- ▁TANGGAL
- ▁KLATEN
- ▁MLEBU
- ▁CANDHI
- ▁PEKALONGAN
- ▁BENGKULU
- ▁MAGELANG
- ▁TOKYO
- ▁CIREBON
- ▁PISANAN
- IGHT
- ▁PANJENENGANÉ
- ▁SADURUNGÉ
- ▁TETEP
- ▁NIKAH
- ▁PRANCIS
- ▁TEGAL
- ▁KANCANE
- ▁KITAB
- ▁SAMPE
- ▁KACAMATAN
- ▁SAPUNIKA
- ▁MALUKU
- ▁DURUNG
- ▁PALEMBANG
- ▁KABEH
- ▁SWARA
- ▁MELBOURNE
- ▁SIDOARJO
- ▁DIANGGO
- ▁GEDHE
- ▁AKTOR
- ▁TANGERANG
- ▁SEDULUR
- ▁MEDAN
- ▁CILACAP
- PÉRANGAN
- ▁SEOUL
- ▁SEGARA
- ▁MUMBAI
- ▁DERRY
- ▁SAMARINDA
- ▁SURYA
- ▁KULAWARGA
- ▁MASAKAN
- ▁UZBEKISTAN
- ▁NGANDHUT
- ▁BEKASI
- ▁SINAU
- ▁BALIKPAPAN
- ▁DITEMOKAKÉ
- ▁SLEMAN
- ▁FINLANDIA
- ▁THAT
- ▁AWUJUD
- ▁PONTIANAK
- ▁TAIPEI
- ▁CHARL
- ▁MANADO
- ▁UNTU
- ▁ALJAZAIR
- ▁ZIMBABWE
- ▁ILMU
- ▁LATVIA
- ▁BAGÉAN
- ▁GANGSAL
- ▁AMÉRIKA
- ▁LEIPZIG
- ▁NJLENTREHAK
- ▁BREBES
- ▁TINIMBANG
- ▁SEKAWAN
- ▁TOKOH
- ▁BANGUNAN
- ▁WILL
- ▁KAZAKHSTAN
- ▁PENYAKIT
- ▁BELGOROD
- ▁ELIZABETH
- ▁CAPCAY
- ▁JAZZ
- ▁LANCASTER
- ▁NEWCASTLE
- ▁GRUP
- ▁CARDIFF
- ▁DUNDEE
- ▁MICRO
- ▁ITALIA
- ▁SETENGAH
- ▁WELLS
- ▁PEMALANG
- ▁FUNGSI
- ▁LIKUR
- ANGZHOU
- ▁ROBERT
- ▁RICHARD
- ▁HAKIM
- ▁ABERDEEN
- ▁QUEENSLAND
- ▁SOMETHING
- ▁ICELAND
- ▁AKTRIS
- ▁MAKASAR
- ▁BUMBU
- SOFT
- ▁PULITIK
- ▁WINCHESTE
- ▁GAMPANG
- ▁COKLAT
- ▁DELHI
- ▁BAGHDAD
- ▁BELFAST
- ▁CIKARANG
- ▁NYEBABK
- ▁MASYARAKAT
- ▁DIGUNAKAKÉ
- ▁DANGDUT
- ▁DIENGGO
- ▁RAMBUT
- ▁LUXEMBURG
- ▁DHEWE
- ▁STIRLING
- ▁PERUSAHAAN
- ▁CAMPURSARI
- ▁BOYOLALI
- ▁UPACARA
- ▁WIJAYA
- ▁KAGOLONG
- ▁GAMBAR
- ▁SUMBER
- /
- ''''
- Å
- '5'
- '!'
- '2'
- '8'
- '4'
- '3'
- .
- '1'
- '6'
- '9'
-
- '~'
- '0'
- Â
- '7'
- ¥
-
-
-
- Ê
- Ð
- <sos/eos>
init: chainer
input_size: null
ctc_conf:
dropout_rate: 0.0
ctc_type: builtin
reduce: true
ignore_nan_grad: false
model_conf:
ctc_weight: 0.3
lsm_weight: 0.1
length_normalized_loss: false
use_preprocessor: true
token_type: bpe
bpemodel: data/token_list/bpe_unigram1000/bpe.model
non_linguistic_symbols: null
cleaner: null
g2p: null
speech_volume_normalize: null
rir_scp: null
rir_apply_prob: 1.0
noise_scp: null
noise_apply_prob: 1.0
noise_db_range: '13_15'
frontend: default
frontend_conf:
fs: 16k
specaug: null
specaug_conf: {}
normalize: global_mvn
normalize_conf:
stats_file: exp/asr_stats_raw_bpe1000/train/feats_stats.npz
preencoder: null
preencoder_conf: {}
encoder: transformer
encoder_conf:
input_layer: conv2d
num_blocks: 12
linear_units: 2048
dropout_rate: 0.1
output_size: 256
attention_heads: 4
attention_dropout_rate: 0.0
decoder: transformer
decoder_conf:
input_layer: embed
num_blocks: 6
linear_units: 2048
dropout_rate: 0.1
required:
- output_dir
- token_list
version: 0.9.7
distributed: false