Language Modelling with Phonemes

https://github.com/codebyzeb/PhonemeTransformers

tweetbyzeb

codebyzeb

Activity Feed Request to join this org

AI & ML interests

Child language acquisition, CHILDES, word segmentation, phonemes, BabyLM

Recent Activity

codebyzeb updated a model about 21 hours ago

phonemetransformers/childes-segmentation-800k-gpt2_lm-model

codebyzeb updated a model about 21 hours ago

phonemetransformers/childes-segmentation-800k-gpt2_lm-model

codebyzeb updated a model about 21 hours ago

phonemetransformers/childes-segmentation-800k-gpt2_lm-model

View all activity

Collections 1

spaces 1

Runtime error

segmentation_scores

🚀

models 104

datasets 2

phonemetransformers/CHILDES

Viewer • Updated 25 days ago • 12.5M • 1.54k • 1

phonemetransformers/BabyLM-phonemized

Viewer • Updated Jan 13 • 12.5M • 117

Language Modelling with Phonemes

AI & ML interests

Recent Activity

Collections 1

phonemetransformers/BabyLM-phonemized

phonemetransformers/BABYLM-TOKENIZER-CHAR-PHON

phonemetransformers/BABYLM-TOKENIZER-BPE-PHON

phonemetransformers/BABYLM-TOKENIZER-CHAR-TXT

spaces 1

segmentation_scores

models 104

phonemetransformers/childes-segmentation-800k-gpt2_lm-model

phonemetransformers/childes-multilingual-5M-gpt2_lm-model

phonemetransformers/CHILDES-phoneme-tokenizer

phonemetransformers/CHILDES-Cantonese-phoneme-tokenizer

phonemetransformers/CHILDES-Mandarin-phoneme-tokenizer

phonemetransformers/debug2-gpt2_lm-model

phonemetransformers/debug-gpt2_lm-model

phonemetransformers/childes-size-english-gpt2_lm-model

phonemetransformers/CHILDES-Polish-phoneme-tokenizer

phonemetransformers/CHILDES-Serbian-phoneme-tokenizer

datasets 2

phonemetransformers/CHILDES

phonemetransformers/BabyLM-phonemized

AI & ML interests

Recent Activity

Team members 1

Collections 1

spaces 1

segmentation_scores

models 104 Sort: Recently updated

datasets 2 Sort: Recently updated

models 104

datasets 2