mms-tts / README.md
vineelpratap's picture
Update README.md
b55ad7a
|
raw
history blame
10.9 kB
metadata
license: cc-by-nc-4.0
tags:
  - mms
  - vits

Massively Multilingual Speech (MMS) : Text-to-Speech Models

This repository contains a collection of text-to-speech (TTS) models, offering support for over 1000 languages. These models are part of Facebook's Massively Multilingual Speech project, aiming to provide speech technology across a diverse range of languages.

Usage

For detailed instructions on utilizing the models, please refer to the fairseq docs. Additionally, you can explore the models on MMS Space available on HuggingFace.

Supported Languages

This model supports 1107 languages. Unclick the following to toogle all supported languages of this checkpoint in ISO 639-3 code. You can find more details about the languages and their ISO 649-3 codes in the MMS Language Coverage Overview.

Click to toggle
  • abi
  • ace
  • aca
  • acn
  • acr
  • ach
  • acu
  • guq
  • ade
  • adj
  • agd
  • agx
  • agn
  • aha
  • aka
  • knj
  • ake
  • aeu
  • ahk
  • bss
  • alj
  • sqi
  • alt
  • alp
  • alz
  • kab
  • amk
  • mmg
  • amh
  • ami
  • azg
  • agg
  • boj
  • cko
  • any
  • arl
  • ara
  • atq
  • luc
  • hyw
  • apr
  • aia
  • msy
  • cni
  • cjo
  • cpu
  • cpb
  • asm
  • asa
  • teo
  • ati
  • djk
  • ava
  • avn
  • avu
  • awb
  • kwi
  • awa
  • agr
  • agu
  • ayr
  • ayo
  • abp
  • blx
  • sgb
  • azj-script_cyrillic
  • azj-script_latin
  • azb
  • bba
  • bhz
  • bvc
  • bfy
  • bgq
  • bdq
  • bdh
  • bqi
  • bjw
  • blz
  • ban
  • bcc-script_latin
  • bcc-script_arabic
  • bam
  • ptu
  • bcw
  • bqj
  • bno
  • bbb
  • bfa
  • bjz
  • bak
  • eus
  • bsq
  • akb
  • btd
  • btx
  • bts
  • bbc
  • bvz
  • bjv
  • bep
  • bkv
  • bzj
  • bem
  • bng
  • ben
  • bom
  • btt
  • bha
  • bgw
  • bht
  • beh
  • sne
  • ubl
  • bcl
  • bim
  • bkd
  • bjr
  • bfo
  • biv
  • bib
  • bis
  • bzi
  • bqp
  • bpr
  • bps
  • bwq
  • bdv
  • bqc
  • bus
  • bnp
  • bmq
  • bdg
  • boa
  • ksr
  • bor
  • bru
  • box
  • bzh
  • bgt
  • sab
  • bul
  • bwu
  • bmv
  • mya
  • tte
  • cjp
  • cbv
  • kaq
  • cot
  • cbc
  • car
  • cat
  • ceb
  • cme
  • cbi
  • ceg
  • cly
  • cya
  • che
  • hne
  • nya
  • dig
  • dug
  • bgr
  • cek
  • cfm
  • cnh
  • hlt
  • mwq
  • ctd
  • tcz
  • zyp
  • cco
  • cnl
  • cle
  • chz
  • cpa
  • cso
  • cnt
  • cuc
  • hak
  • nan
  • xnj
  • cap
  • cax
  • ctg
  • ctu
  • chf
  • cce
  • crt
  • crq
  • cac-dialect_sansebasti谩ncoat谩n
  • cac-dialect_sanmateoixtat谩n
  • ckt
  • ncu
  • cdj
  • chv
  • caa
  • asg
  • con
  • crn
  • cok
  • crk-script_latin
  • crk-script_syllabics
  • crh
  • cui
  • dsh
  • dbq
  • dga
  • dgi
  • dgk
  • dnj-dialect_gweetaawueast
  • dnj-dialect_blowowest
  • daa
  • dnt
  • dnw
  • dar
  • tcc
  • dwr
  • ded
  • mzw
  • ntr
  • ddn
  • des
  • dso
  • nfa
  • dhi
  • gud
  • did
  • mhu
  • dip
  • dik
  • tbz
  • dts
  • dos
  • dgo
  • mvp
  • nld
  • jen
  • dzo
  • idd
  • eka
  • cto
  • emp
  • eng
  • enx
  • sja
  • myv
  • mcq
  • ese
  • evn
  • eza
  • fal
  • fao
  • far
  • fij
  • fin
  • fon
  • frd
  • fra
  • ful
  • flr
  • gau
  • gbk
  • gag-script_cyrillic
  • gag-script_latin
  • gbi
  • gmv
  • lug
  • pwg
  • gbm
  • cab
  • grt
  • krs
  • gso
  • nlg
  • gej
  • deu
  • gri
  • kik
  • acd
  • glk
  • gof-script_latin
  • gog
  • gkn
  • wsg
  • gjn
  • gqr
  • gor
  • gux
  • gbo
  • ell
  • grc
  • guh
  • gub
  • grn
  • gyr
  • guo
  • gde
  • guj
  • gvl
  • guk
  • rub
  • dah
  • gwr
  • gwi
  • hat
  • hlb
  • amf
  • hag
  • hnn
  • bgc
  • had
  • hau
  • hwc
  • hvn
  • hay
  • xed
  • heb
  • heh
  • hil
  • hin
  • hif
  • hns
  • hoc
  • hoy
  • hus-dialect_westernpotosino
  • hus-dialect_centralveracruz
  • huv
  • hui
  • hun
  • hap
  • iba
  • isl
  • dbj
  • ifa
  • ifb
  • ifu
  • ifk
  • ife
  • ign
  • ikk
  • iqw
  • ilb
  • ilo
  • imo
  • ind
  • inb
  • ipi
  • irk
  • icr
  • itv
  • itl
  • atg
  • ixl-dialect_sanjuancotzal
  • ixl-dialect_sangasparchajul
  • ixl-dialect_santamarianebaj
  • nca
  • izr
  • izz
  • jac
  • jam
  • jav
  • jvn
  • kac
  • dyo
  • csk
  • adh
  • jun
  • jbu
  • dyu
  • bex
  • juy
  • gna
  • urb
  • kbp
  • cwa
  • dtp
  • kbr
  • cgc
  • kki
  • kzf
  • lew
  • cbr
  • kkj
  • keo
  • kqe
  • kak
  • kyb
  • knb
  • kmd
  • kml
  • ify
  • xal
  • kbq
  • kay
  • ktb
  • hig
  • gam
  • cbu
  • xnr
  • kmu
  • kne
  • kan
  • kby
  • pam
  • cak-dialect_santamar铆adejes煤s
  • cak-dialect_southcentral
  • cak-dialect_yepocapa
  • cak-dialect_western
  • cak-dialect_santodomingoxenacoj
  • cak-dialect_central
  • xrb
  • krc
  • kaa
  • krl
  • pww
  • xsm
  • cbs
  • pss
  • kxf
  • kyz
  • kyu
  • txu
  • kaz
  • ndp
  • kbo
  • kyq
  • ken
  • ker
  • xte
  • kyg
  • kjh
  • kca
  • khm
  • kxm
  • kjg
  • nyf
  • kij
  • kia
  • kqr
  • kqp
  • krj
  • zga
  • kin
  • pkb
  • geb
  • gil
  • kje
  • kss
  • thk
  • klu
  • kyo
  • kog
  • kfb
  • kpv
  • bbo
  • xon
  • kma
  • kno
  • kxc
  • ozm
  • kqy
  • kor
  • coe
  • kpq
  • kpy
  • kyf
  • kff-script_telugu
  • kri
  • rop
  • ktj
  • ted
  • krr
  • kdt
  • kez
  • cul
  • kle
  • kdi
  • kue
  • kum
  • kvn
  • cuk
  • kdn
  • xuo
  • key
  • kpz
  • knk
  • kmr-script_latin
  • kmr-script_arabic
  • kmr-script_cyrillic
  • xua
  • kru
  • kus
  • kub
  • kdc
  • kxv
  • blh
  • cwt
  • kwd
  • tnk
  • kwf
  • cwe
  • kyc
  • tye
  • kir
  • quc-dialect_north
  • quc-dialect_east
  • quc-dialect_central
  • lac
  • lsi
  • lbj
  • lhu
  • las
  • lam
  • lns
  • ljp
  • laj
  • lao
  • lat
  • lav
  • law
  • lcp
  • lzz
  • lln
  • lef
  • acf
  • lww
  • mhx
  • eip
  • lia
  • lif
  • onb
  • lis
  • loq
  • lob
  • yaz
  • lok
  • llg
  • ycl
  • lom
  • ngl
  • lon
  • lex
  • lgg
  • ruf
  • dop
  • lnd
  • ndy
  • lwo
  • lee
  • mev
  • mfz
  • jmc
  • myy
  • mbc
  • mda
  • mad
  • mag
  • ayz
  • mai
  • mca
  • mcp
  • mak
  • vmw
  • mgh
  • kde
  • mlg
  • zlm
  • pse
  • mkn
  • xmm
  • mal
  • xdy
  • div
  • mdy
  • mup
  • mam-dialect_central
  • mam-dialect_northern
  • mam-dialect_southern
  • mam-dialect_western
  • mqj
  • mcu
  • mzk
  • maw
  • mjl
  • mnk
  • mge
  • mbh
  • knf
  • mjv
  • mbt
  • obo
  • mbb
  • mzj
  • sjm
  • mrw
  • mar
  • mpg
  • mhr
  • enb
  • mah
  • myx
  • klv
  • mfh
  • met
  • mcb
  • mop
  • yua
  • mfy
  • maz
  • vmy
  • maq
  • mzi
  • maj
  • maa-dialect_sanantonio
  • maa-dialect_sanjer贸nimo
  • mhy
  • mhi
  • zmz
  • myb
  • gai
  • mqb
  • mbu
  • med
  • men
  • mee
  • mwv
  • meq
  • zim
  • mgo
  • mej
  • mpp
  • min
  • gum
  • mpx
  • mco
  • mxq
  • pxm
  • mto
  • mim
  • xta
  • mbz
  • mip
  • mib
  • miy
  • mih
  • miz
  • xtd
  • mxt
  • xtm
  • mxv
  • xtn
  • mie
  • mil
  • mio
  • mdv
  • mza
  • mit
  • mxb
  • mpm
  • soy
  • cmo-script_latin
  • cmo-script_khmer
  • mfq
  • old
  • mfk
  • mif
  • mkl
  • mox
  • myl
  • mqf
  • mnw
  • mon
  • mog
  • mfe
  • mor
  • mqn
  • mgd
  • mtj
  • cmr
  • mtd
  • bmr
  • moz
  • mzm
  • mnb
  • mnf
  • unr
  • fmu
  • mur
  • tih
  • muv
  • muy
  • sur
  • moa
  • wmw
  • tnr
  • miq
  • mos
  • muh
  • nas
  • mbj
  • nfr
  • kfw
  • nst
  • nag
  • nch
  • nhe
  • ngu
  • azz
  • nhx
  • ncl
  • nhy
  • ncj
  • nsu
  • npl
  • nuz
  • nhw
  • nhi
  • nlc
  • nab
  • gld
  • nnb
  • npy
  • pbb
  • ntm
  • nmz
  • naw
  • nxq
  • ndj
  • ndz
  • ndv
  • new
  • nij
  • sba
  • gng
  • nga
  • nnq
  • ngp
  • gym
  • kdj
  • nia
  • nim
  • nin
  • nko
  • nog
  • lem
  • not
  • nhu
  • bud
  • nus
  • yas
  • nnw
  • nwb
  • nyy
  • nyn
  • rim
  • lid
  • nuj
  • nyo
  • nzi
  • ann
  • ory
  • ojb-script_latin
  • ojb-script_syllabics
  • oku
  • bsc
  • bdu
  • orm
  • ury
  • oss
  • ote
  • otq
  • stn
  • sig
  • kfx
  • bfz
  • sey
  • pao
  • pau
  • pce
  • plw
  • pmf
  • pag
  • pap
  • prf
  • pab
  • pbi
  • pbc
  • pad
  • ata
  • pez
  • peg
  • fas
  • pcm
  • pis
  • pny
  • pir
  • pjt
  • poy
  • pol
  • pps
  • pls
  • poi
  • poh-dialect_eastern
  • poh-dialect_western
  • por
  • prt
  • pui
  • pan
  • tsz
  • suv
  • lme
  • quy
  • qvc
  • quz
  • qve
  • qub
  • qvh
  • qwh
  • qvw
  • quf
  • qvm
  • qul
  • qvn
  • qxn
  • qxh
  • qvs
  • quh
  • qxo
  • qxr
  • qvo
  • qvz
  • qxl
  • quw
  • kjb
  • kek
  • rah
  • rjs
  • rai
  • lje
  • rnl
  • rkt
  • rap
  • yea
  • raw
  • rej
  • rel
  • ril
  • iri
  • rgu
  • rhg
  • rmc-script_latin
  • rmc-script_cyrillic
  • rmo
  • rmy-script_latin
  • rmy-script_cyrillic
  • ron
  • rol
  • cla
  • rng
  • rug
  • run
  • rus
  • lsm
  • spy
  • sck
  • saj
  • sch
  • sml
  • xsb
  • sbl
  • saq
  • sbd
  • smo
  • rav
  • sxn
  • sag
  • sbp
  • xsu
  • srm
  • sas
  • apb
  • sgw
  • tvw
  • lip
  • slu
  • snw
  • sea
  • sza
  • seh
  • crs
  • ksb
  • shn
  • sho
  • mcd
  • cbt
  • xsr
  • shk
  • shp
  • sna
  • cjs
  • jiv
  • snp
  • sya
  • sid
  • snn
  • sri
  • srx
  • sil
  • sld
  • akp
  • xog
  • som
  • bmu
  • khq
  • ses
  • mnx
  • spa
  • srn
  • sxb
  • suc
  • tgo
  • suk
  • sun
  • suz
  • sgj
  • sus
  • swh
  • swe
  • syl
  • dyi
  • myk
  • spp
  • tap
  • tby
  • tna
  • shi
  • klw
  • tgl
  • tbk
  • tgj
  • blt
  • tbg
  • omw
  • tgk
  • tdj
  • tbc
  • tlj
  • tly
  • ttq-script_tifinagh
  • taj
  • taq
  • tam
  • tpm
  • tgp
  • tnn
  • tac
  • rif-script_latin
  • rif-script_arabic
  • tat
  • tav
  • twb
  • tbl
  • kps
  • twe
  • ttc
  • tel
  • kdh
  • tes
  • tex
  • tee
  • tpp
  • tpt
  • stp
  • tfr
  • twu
  • ter
  • tew
  • tha
  • nod
  • thl
  • tem
  • adx
  • bod
  • khg
  • tca
  • tir
  • txq
  • tik
  • dgr
  • tob
  • tmf
  • tng
  • tlb
  • ood
  • tpi
  • jic
  • lbw
  • txa
  • tom
  • toh
  • tnt
  • sda
  • tcs
  • toc
  • tos
  • neb
  • trn
  • trs
  • trc
  • tri
  • cof
  • tkr
  • kdl
  • cas
  • tso
  • tuo
  • iou
  • tmc
  • tuf
  • tur
  • tuk-script_latin
  • tuk-script_arabic
  • bov
  • tue
  • kcg
  • tzh-dialect_bachaj贸n
  • tzh-dialect_tenejapa
  • tzo-dialect_chenalh贸
  • tzo-dialect_chamula
  • tzj-dialect_western
  • tzj-dialect_eastern
  • aoz
  • udm
  • udu
  • ukr
  • ppk
  • ubu
  • urk
  • ura
  • urt
  • urd-script_devanagari
  • urd-script_arabic
  • urd-script_latin
  • upv
  • usp
  • uig-script_arabic
  • uig-script_cyrillic
  • uzb-script_cyrillic
  • vag
  • bav
  • vid
  • vie
  • vif
  • vun
  • vut
  • prk
  • wwa
  • rro
  • bao
  • waw
  • lgl
  • wlx
  • cou
  • hub
  • gvc
  • mfi
  • wap
  • wba
  • war
  • way
  • guc
  • cym
  • kvw
  • tnp
  • hto
  • huu
  • wal-script_latin
  • wal-script_ethiopic
  • wlo
  • noa
  • wob
  • kao
  • xer
  • yad
  • yka
  • sah
  • yba
  • yli
  • nlk
  • yal
  • yam
  • yat
  • jmd
  • tao
  • yaa
  • ame
  • guu
  • yao
  • yre
  • yva
  • ybb
  • pib
  • byr
  • pil
  • yor
  • ycn
  • ess
  • yuz
  • atb
  • zne
  • zaq
  • zpo
  • zad
  • zpc
  • zca
  • zpg
  • zai
  • zpl
  • zam
  • zaw
  • zpm
  • zac
  • zao
  • ztq
  • zar
  • zpt
  • zpi
  • zas
  • zaa
  • zpz
  • zab
  • zpu
  • zae
  • zty
  • zav
  • zza
  • zyb
  • ziw
  • zos
  • gnd
  • ewe

Model details

  • Developed by: Vineel Pratap et al.

  • Model type: Text-to-speech model

  • Language(s): 1107 languages, see supported languages

  • License: CC-BY-NC 4.0 license

  • Cite as:

    @article{pratap2023mms,
      title={Scaling Speech Technology to 1,000+ Languages},
      author={Vineel Pratap and Andros Tjandra and Bowen Shi and Paden Tomasello and Arun Babu and Sayani Kundu and Ali Elkahky and Zhaoheng Ni and Apoorv Vyas and Maryam Fazel-Zarandi and Alexei Baevski and Yossi Adi and Xiaohui Zhang and Wei-Ning Hsu and Alexis Conneau and Michael Auli},
    journal={arXiv},
    year={2023}
    }