config: conf/train_asr.yaml print_config: false log_level: INFO dry_run: false iterator_type: sequence output_dir: exp/asr_train_asr_raw_bpe1000 ngpu: 1 seed: 0 num_workers: 1 num_att_plot: 3 dist_backend: nccl dist_init_method: env:// dist_world_size: null dist_rank: null local_rank: 0 dist_master_addr: null dist_master_port: null dist_launcher: null multiprocessing_distributed: false cudnn_enabled: true cudnn_benchmark: false cudnn_deterministic: true collect_stats: false write_collected_feats: false max_epoch: 200 patience: 20 val_scheduler_criterion: - valid - loss early_stopping_criterion: - valid - loss - min best_model_criterion: - - valid - acc - max keep_nbest_models: 10 grad_clip: 5 grad_clip_type: 2.0 grad_noise: false accum_grad: 2 no_forward_run: false resume: true train_dtype: float32 use_amp: false log_interval: null unused_parameters: false use_tensorboard: true use_wandb: false wandb_project: null wandb_id: null pretrain_path: null init_param: [] freeze_param: [] num_iters_per_epoch: null batch_size: 32 valid_batch_size: null batch_bins: 1000000 valid_batch_bins: null train_shape_file: - exp/asr_stats_raw_bpe1000/train/speech_shape - exp/asr_stats_raw_bpe1000/train/text_shape.bpe valid_shape_file: - exp/asr_stats_raw_bpe1000/valid/speech_shape - exp/asr_stats_raw_bpe1000/valid/text_shape.bpe batch_type: folded valid_batch_type: null fold_length: - 80000 - 150 sort_in_batch: descending sort_batch: descending multiple_iterator: false chunk_length: 500 chunk_shift_ratio: 0.5 num_cache_chunks: 1024 train_data_path_and_name_and_type: - - dump/raw/java_train/wav.scp - speech - sound - - dump/raw/java_train/text - text - text valid_data_path_and_name_and_type: - - dump/raw/java_dev/wav.scp - speech - sound - - dump/raw/java_dev/text - text - text allow_variable_data_keys: false max_cache_size: 0.0 max_cache_fd: 32 valid_max_cache_size: null optim: adam optim_conf: lr: 10.0 scheduler: noamlr scheduler_conf: warmup_steps: 25000 token_list: - - - NG - E - S - I - H - N - ▁ - K - T - L - R - ▁DI - AN - M - É - ▁A - ▁ING - A - NA - NE - TA - P - D - Y - RA - LA - ▁KA - SI - ▁KARO - U - TI - ▁LAN - RI - KA - MA - ▁MA - ▁DHATENG - ▁IKU - ▁LUNGA - YA - ▁SA - SA - NI - O - ▁MENYA - G - WA - ▁DOLAN - ▁KE - LI - ▁SE - DA - GA - ▁IKI - ▁PA - ▁SAK - ▁S - LE - B - JRONING - ▁BA - ▁KANG - DI - ▁TANSA - JA - RE - BA - ▁ELING - PA - ▁RA - ▁DIWUJUDK - ▁IMPI - TU - ▁PUNIKA - ▁SU - ▁I - NÉ - RO - ▁ANA - ▁ME - ▁TA - MI - F - TE - KU - TO - 'ON' - RU - ▁SING - ▁PE - IPUN - BU - ▁SI - ▁LA - EN - ▁KERJA - ▁E - LO - GI - IN - KONTRAK - ▁B - ▁O - CA - ▁UGA - ER - ▁SAKA - ▁DADI - ▁T - TAN - È - C - ▁YA - ▁U - WI - ▁NA - ▁C - ▁KU - LU - ▁K - ▁RE - ▁JA - ▁PER - ▁WA - ▁MI - RAN - MAN - AL - US - EL - ▁UNIVERSITY - ▁NANG - HA - ▁DIPUN - ▁LE - ▁SEKOLAH - ▁DA - ▁INGKANG - ▁SENENG - ▁KO - ▁N - UN - 'NO' - ▁MUSIK - BI - LAN - ▁KUW - ▁DE - AR - KI - HAN - ▁GA - ▁TE - ▁GE - ▁BU - ▁CA - ▁LAGI - ▁M - AKÉ - Z - KE - ▁MU - ▁AS - PI - TH - UR - ▁IN - ▁BE - TER - ▁TI - ▁ALUMN - ▁WONTEN - DE - SE - CE - DHA - GU - ▁AL - ▁PI - ▁NGRUNGOKN - ▁RO - MU - ▁ORA - PU - ▁MO - ▁KANGGO - ES - ▁NG - ▁IS - DO - DU - IS - WE - ▁LI - ▁WI - AKEN - ▁BI - ▁JU - CH - OR - WAN - ▁BISA - ▁TU - J - NGGA - ▁SO - KO - ▁G - NDA - ▁PAN - UNG - JU - AT - ▁MINANGKA - W - ▁GU - BO - VI - ▁AN - SAN - ÈN - ▁BO - JI - NIPUN - ▁TAUN - ▁KANTHI - ▁TO - ▁RI - ▁P - ▁SAKING - ▁NGA - ▁JE - YU - CK - ANG - ▁DÉNING - ▁AR - ▁UNIVERSITAS - RAH - ▁NI - ▁MAR - YAN - ▁KUTHA - ▁BANJUR - ▁WONG - ▁PEN - ME - UM - ▁F - ▁HA - ST - EM - ▁D - ▁UTAWA - ▁DU - DHU - ▁NALIKA - ▁THE - GO - AK - UL - LAS - KAN - BE - ▁KI - RANG - ▁WE - MO - ING - ▁PU - ▁SIJI - IT - ▁PULUH - ▁BASA - GAN - CI - UT - ▁OF - ▁WIS - YO - TON - PO - ▁LU - ▁NO - ▁RU - ▁CO - LAH - DHI - ▁PRA - ▁JO - AH - ▁KAR - HO - ÈK - ▁PO - ▁HI - ET - ▁DEWI - ▁FA - ANGAN - ▁DADOS - JO - ▁PRO - MBANG - VE - OK - TRA - ▁YU - ▁MAN - IL - ▁PANG - LAM - IR - LIS - ▁JENENG - VA - ▁HO - DRA - WU - TRI - ▁INGGIH - ▁SALAH - ▁CE - CO - ▁MEN - SON - BAR - ▁LO - ▁UGI - ▁GO - EK - ▁JAM - ASI - ▁CI - ▁NGE - RY - IA - ▁AD - ▁NING - ▁DHEWEKE - NTEN - ▁SAWIJINING - ARA - RIS - TIK - ▁PARA - TAR - ▁NYE - ▁HE - ▁V - X - EP - PER - AKE - ▁INDONESIA - MEN - ▁SAN - ▁DO - WAR - ▁MB - ▁INDONÉSIA - KAKÉ - BER - ▁KALIYAN - ▁RONG - RIA - AM - ▁JAWA - ▁KAP - ▁KAN - ▁NU - ▁NGANTI - ▁ART - ▁VI - KAKE - ▁FILM - LANG - ▁DHA - ▁SRI - DHO - RENG - ▁KAYA - THA - NGING - ▁AMARG - TUR - DHANG - CU - UK - ▁TELU - RON - ▁AYU - ▁ST - ▁NGANGGO - ▁LUWIH - BAT - RING - ▁SAMPUN - ▁WIWIT - TEN - ▁GI - RAT - ▁KON - LIN - ▁AND - NAN - ▁NANGING - ▁DHÈWÈKÉ - ▁NEW - ▁GUNUNG - ▁Z - SO - ▁LORO - ▁W - ▁AKÈH - ▁FO - PAN - ▁NDUWÈ - KAR - ▁HU - ▁EWU - ▁ATUS - ONG - ▁DIARANI - ▁BEN - ▁PALING - ▁BAN - IK - NING - ▁WERNA - V - OS - GER - ▁WOLU - TIN - ▁MAU - AS - ▁SAM - ▁FI - ▁KIDUL - ▁KALI - ▁PIYAMBAKIPUN - ÈL - DY - OL - ▁ENEM - WÉ - FA - TOR - ▁FE - LIA - ▁SAGED - RUS - TAS - ZA - FORD - BAH - MPI - ▁ASAL - ▁TEMBUNG - LIK - ▁SAIKI - ▁PIN - ▁JI - ▁SHA - BUR - ▁KAS - ▁SARI - ▁WAR - GEN - ▁AGUS - WO - ▁NUR - ▁LONDON - ▁URIP - MAS - ▁PITU - UKU - ÈR - WON - DAH - ANÉ - ▁ND - ▁PAM - CARA - ▁MARANG - VER - ▁HAM - ▁LAIR - ▁WU - ▁ANAK - ▁ANGG - ▁SITI - ▁DWI - ARD - DIA - ▁KANGG - ▁ARIF - MER - ▁ALI - ▁SABEN - MAR - ▁CITA - ▁BOTEN - QI - ▁HER - ▁CILIK - AD - ▁LAJENG - ▁PRI - ▁INSTITUTE - ▁IBU - ▁LIMA - ▁HADI - ▁PAS - ▁BANYU - ▁BER - Q - ▁KASEBUT - ▁ABDUL - ▁BAMBANG - ▁TELUNG - WIS - ▁KALIH - ▁DUWÉ - STER - ▁ZA - ▁DIGAWÉ - ▁ARI - NTUK - ▁AWAK - ▁AREP - ▁NDUWÉ - ▁NGG - ▁ABDULLAH - ▁TER - ▁WULANDARI - ▁ISIH - ▁YO - ▁NGU - ▁RIF - ▁MUNG - RUL - ▁PUTRA - KON - ▁MANGGUNG - ▁NUG - ▁JINIS - SEN - ▁AZ - ▁JAKARTA - MIN - NIA - ▁SOLO - ▁EKO - JAH - TIF - ▁DAN - ▁SETU - ▁BAL - ▁AKEH - NDER - ▁TAU - ▁PUJI - ▁YOGYAKARTA - ▁TIYANG - ▁SARASVATI - ▁PUN - ▁BALI - LAR - NINGSIH - ▁OR - ENT - ▁TENGAH - ▁PAPAN - ▁KIRA - ▁JAKA - ▁PADHA - ▁OXFORD - ▁MULA - ▁EL - ▁TUM - ▁NGLA - ▁SEN - TUTI - ROHO - ▁SOFYAN - ▁KABUPATÈN - ▁WAHHAB - ▁DHUWUR - ▁ARUPA - ▁MAIN - ▁PRE - ▁WIT - ▁DONYA - ▁TIM - ▁NYA - ▁KALEBU - ▁PANGANAN - ▁HAR - FF - ▁PRASETY - ▁GEDHÉ - ▁SAWISÉ - ▁PUTRI - TARA - BINTANG - LY - ▁TEGES - ▁BANGET - ▁PANJENENGANIPUN - LLY - ▁WOH - ▁PATANG - ▁MISUWUR - OLOGI - ▁KATHAH - DEN - ▁CARA - ▁OMAH - ▁SHE - OMB - ▁NJ - ▁CAMBRIDGE - ▁BABAGAN - MON - ▁PAPAT - ▁NAGARA - ▁TEMP - ▁SAHA - HAM - ▁MANGAN - ▁SANGA - ▁AMB - BAN - AGE - ▁GODHONG - DER - ▁KAPING - ▁BAKAL - ▁LIYA - ▁EDINBURGH - ▁DHÉWÉ - ÈNG - ▁PERANG - ▁YÈN - ▁DUMUNUNG - PORT - ▁MER - ▁PASAR - ▁POP - ▁PROVINSI - ▁UMUM - ▁US - ▁SANGALAS - ▁UTAMA - ▁DIKENAL - ▁CACAH - LUK - ▁WEWENGKON - ▁GAD - ▁INDIA - ▁DAWA - VO - ▁YORK - ▁BAB - ▁BAHAN - ▁JENENGÉ - ▁KEMBANG - ▁WETON - ▁MENAW - ▁MÈ - ▁PULO - '?' - ▁DON - ▁TANDURAN - ▁KRAJAN - ▁PITUNG - ▁SINETRON - ▁GRA - ▁RAJA - ▁JAMAN - ▁TEN - ▁KRA - ▁BENTUK - ▁SANGANG - ▁UTAWI - ▁WUJUD - ▁SUKU - ▁JOHN - ▁KOMP - ▁LANGKUNG - ▁ASRING - ▁BAPAK - ▁HARV - ▁INGGRIS - ▁SISIH - ▁DHEWEKÉ - ▁YEN - ▁MITURUT - ▁TANPA - ▁KRI - DUR - ▁LAGU - ▁PUNGKASAN - ▁LOR - ▁ANGGOTA - ▁PUTIH - ▁SALIYANÉ - ▁AZHAR - ▁DISEBUT - ▁KUDU - ▁SETUNGGAL - ▁AKSARA - ▁BRAD - ▁ANTARA - NWAR - ▁GAWÉ - ▁MANUNGSA - ▁GADHAH - ▁COLLEGE - ▁CHRIS - ▁STAM - ▁DAGING - ▁KEREP - ▁KABÈH - UPAYA - ▁BAGÉYAN - ▁CHUNG - ▁IWAK - ▁KADOS - ▁JEPANG - ▁KHAS - ▁APIK - ▁YOU - ▁WAYANG - ▁WEKTU - ▁BIYASANÉ - ▁LIYANÉ - ▁KULIT - MPUNG - ▁KULON - ▁HIJRAH - ▁DAVID - ▁WÉTAN - ▁SEKET - RISTOL - ▁DHAÉRAH - ▁TEKAN - ▁BANDUNG - ▁KÉWAN - ▁MANGSA - ▁BADH - ▁AGENG - ▁PANGGONAN - ▁SEMARANG - ▁QU - ▁ABANG - ▁BIASANÉ - ▁WOR - ▁DÉNÉ - ▁GAMELAN - ▁YAIKU - ▁CHE - ▁NASIONAL - KANGKU - ▁POL - ▁DÉSA - ▁TULADHA - ▁SATUNGGALING - ▁SHI - ▁UKURAN - ▁NGANTOS - ▁ALBUM - BANGUN - ANGGEP - ▁TLATAH - ▁SURABAYA - ▁WADON - ▁UMUR - ▁MANÈH - ▁SATUS - ▁RÉ - ▁MUHAMMAD - CAMPUR - JENG - ▁AHMAD - ▁BOCAH - ▁BIASA - ▁NGISOR - ▁SEDAYA - ▁MANCHESTER - ▁JESSI - ▁MANUK - ▁SISTEM - ▁SONGOLAS - ▁DAMEL - ▁WAGENINGEN - ▁PIRANTI - ▁PIYAMBAK - ▁AKTING - DHÉ - ▁WALANDA - ▁JERMAN - ▁KECAMATAN - ISME - ▁ANYAR - ▁AGAMA - ▁SEPULUH - ▁PAPUA - ▁CEDHAK - ▁CHI - ▁KAGUNGAN - ▁BÉDA - ▁BOGOR - ▁SAWETARA - ▁WOLULAS - ▁NGGADHAH - ▁PEMAIN - ▁SANGET - ▁KALEBET - ▁SWIDAK - ▁WILLIAM - ▁SASTRA - ▁ACEH - ▁GARWA - ▁MALIH - ▁THAILAND - ▁MBOTEN - ▁WANGUN - ▁OPERA - ▁PUSAT - ▁AMERIKA - ▁FILIPINA - ▁MIWIT - ▁LOMBOK - ▁PADANG - ▁PENYANYI - ▁ÉROPAH - ▁PEMB - ▁LEMAH - ▁MANGGON - ▁END - ▁TANGGAL - ▁KLATEN - ▁MLEBU - ▁CANDHI - ▁PEKALONGAN - ▁BENGKULU - ▁MAGELANG - ▁TOKYO - ▁CIREBON - ▁PISANAN - IGHT - ▁PANJENENGANÉ - ▁SADURUNGÉ - ▁TETEP - ▁NIKAH - ▁PRANCIS - ▁TEGAL - ▁KANCANE - ▁KITAB - ▁SAMPE - ▁KACAMATAN - ▁SAPUNIKA - ▁MALUKU - ▁DURUNG - ▁PALEMBANG - ▁KABEH - ▁SWARA - ▁MELBOURNE - ▁SIDOARJO - ▁DIANGGO - ▁GEDHE - ▁AKTOR - ▁TANGERANG - ▁SEDULUR - ▁MEDAN - ▁CILACAP - PÉRANGAN - ▁SEOUL - ▁SEGARA - ▁MUMBAI - ▁DERRY - ▁SAMARINDA - ▁SURYA - ▁KULAWARGA - ▁MASAKAN - ▁UZBEKISTAN - ▁NGANDHUT - ▁BEKASI - ▁SINAU - ▁BALIKPAPAN - ▁DITEMOKAKÉ - ▁SLEMAN - ▁FINLANDIA - ▁THAT - ▁AWUJUD - ▁PONTIANAK - ▁TAIPEI - ▁CHARL - ▁MANADO - ▁UNTU - ▁ALJAZAIR - ▁ZIMBABWE - ▁ILMU - ▁LATVIA - ▁BAGÉAN - ▁GANGSAL - ▁AMÉRIKA - ▁LEIPZIG - ▁NJLENTREHAK - ▁BREBES - ▁TINIMBANG - ▁SEKAWAN - ▁TOKOH - ▁BANGUNAN - ▁WILL - ▁KAZAKHSTAN - ▁PENYAKIT - ▁BELGOROD - ▁ELIZABETH - ▁CAPCAY - ▁JAZZ - ▁LANCASTER - ▁NEWCASTLE - ▁GRUP - ▁CARDIFF - ▁DUNDEE - ▁MICRO - ▁ITALIA - ▁SETENGAH - ▁WELLS - ▁PEMALANG - ▁FUNGSI - ▁LIKUR - ANGZHOU - ▁ROBERT - ▁RICHARD - ▁HAKIM - ▁ABERDEEN - ▁QUEENSLAND - ▁SOMETHING - ▁ICELAND - ▁AKTRIS - ▁MAKASAR - ▁BUMBU - SOFT - ▁PULITIK - ▁WINCHESTE - ▁GAMPANG - ▁COKLAT - ▁DELHI - ▁BAGHDAD - ▁BELFAST - ▁CIKARANG - ▁NYEBABK - ▁MASYARAKAT - ▁DIGUNAKAKÉ - ▁DANGDUT - ▁DIENGGO - ▁RAMBUT - ▁LUXEMBURG - ▁DHEWE - ▁STIRLING - ▁PERUSAHAAN - ▁CAMPURSARI - ▁BOYOLALI - ▁UPACARA - ▁WIJAYA - ▁KAGOLONG - ▁GAMBAR - ▁SUMBER - / - '''' - Å - '5' - '!' - '2' - '8' - '4' - '3' - . - '1' - '6' - '9' - – - '~' - '0' - Â - '7' - ¥ - — - “ - ” - Ê - Ð - init: chainer input_size: null ctc_conf: dropout_rate: 0.0 ctc_type: builtin reduce: true ignore_nan_grad: false model_conf: ctc_weight: 0.3 lsm_weight: 0.1 length_normalized_loss: false use_preprocessor: true token_type: bpe bpemodel: data/token_list/bpe_unigram1000/bpe.model non_linguistic_symbols: null cleaner: null g2p: null speech_volume_normalize: null rir_scp: null rir_apply_prob: 1.0 noise_scp: null noise_apply_prob: 1.0 noise_db_range: '13_15' frontend: default frontend_conf: fs: 16k specaug: null specaug_conf: {} normalize: global_mvn normalize_conf: stats_file: exp/asr_stats_raw_bpe1000/train/feats_stats.npz preencoder: null preencoder_conf: {} encoder: transformer encoder_conf: input_layer: conv2d num_blocks: 12 linear_units: 2048 dropout_rate: 0.1 output_size: 256 attention_heads: 4 attention_dropout_rate: 0.0 decoder: transformer decoder_conf: input_layer: embed num_blocks: 6 linear_units: 2048 dropout_rate: 0.1 required: - output_dir - token_list version: 0.9.7 distributed: false