Pietro Lesci

pietrolesci

AI & ML interests

I like developing and applying causal methods to study the effect of training choices on models’ behaviour, including memorisation, shortcut learning, and tokenisation.

Recent Activity

updated a dataset about 1 month ago

pietrolesci/opus-5langs-1M

updated a dataset about 2 months ago

pietrolesci/opus-raw

updated a dataset about 2 months ago

pietrolesci/opus-raw

View all activity

Organizations

Collections 7

Papers 4

spaces 1

Build error

🤗

Wordify

models 14

datasets 54

pietrolesci/opus-5langs-1M

Viewer • Updated Dec 10, 2024 • 5M • 49

pietrolesci/opus-raw

Viewer • Updated Nov 27, 2024 • 4.06B • 104

pietrolesci/minipile

Viewer • Updated Nov 1, 2024 • 4.04M • 105

pietrolesci/finewebedu-20BT

Updated Oct 14, 2024 • 41

pietrolesci/fineweb-edu-10BT

Updated Oct 10, 2024 • 94

pietrolesci/_minipile

Viewer • Updated Oct 2, 2024 • 2.51M • 41

pietrolesci/pythia-pile-stats

Viewer • Updated Sep 23, 2024 • 113M • 68

pietrolesci/slim-pajama-eval

Viewer • Updated Sep 16, 2024 • 1.84M • 46 • 1

pietrolesci/pile-subset

Updated Sep 13, 2024 • 3

pietrolesci/pile_preshuffled_seeds

Updated Sep 12, 2024 • 13 • 1

Pietro Lesci

AI & ML interests

Recent Activity

Organizations

Collections 7

pietrolesci/opus-raw

pietrolesci/amazoncat-13k

pietrolesci/civilcomments-wilds

pietrolesci/dbpedia_14_indexed

pietrolesci/DBPedia_Classes_indexed

Papers 4

spaces 1

Wordify

models 14

pietrolesci/raw_tokenisers

pietrolesci/tokenisers

pietrolesci/SmolLM-34M-tok32000

pietrolesci/bert-civilcomments-gradtracking

pietrolesci/roberta-base_mnli_b9799b8f9b

pietrolesci/bert-base-uncased_mnli_53fb0761e0

pietrolesci/bert-tiny_mnli_cdc7ea0d50

pietrolesci/pythia-14m_2024-01-17T00-07-52

pietrolesci/gpt2_wikitext-103-raw-v1_L2-H4-E256-C256

pietrolesci/gpt2_wikitext-2-raw-v1_L2-H4-E256-C256

datasets 54

pietrolesci/opus-5langs-1M

pietrolesci/opus-raw

pietrolesci/minipile

pietrolesci/finewebedu-20BT

pietrolesci/fineweb-edu-10BT

pietrolesci/_minipile

pietrolesci/pythia-pile-stats

pietrolesci/slim-pajama-eval

pietrolesci/pile-subset

pietrolesci/pile_preshuffled_seeds

Pietro Lesci

AI & ML interests

Recent Activity

Organizations

Collections 7

Papers 4

spaces 1

Wordify

models 14 Sort: Recently updated

datasets 54 Sort: Recently updated

models 14

datasets 54