Multi-Layer SAEs with Transformers

tim-lawson 's Collections

Multi-Layer SAEs

Multi-Layer SAEs with Tuned Lens

Multi-Layer SAEs with Tuned Lens and Transformers

Single-Layer SAEs

Single-Layer SAEs with Transformers

updated Dec 3, 2024

Single SAEs trained on the residual stream activation vectors from every transformer layer simultaneously, including the transformers.

Upvote

tim-lawson/mlsae-pythia-70m-deduped-x1-k32-tfm

Updated Dec 2, 2024 • 11
tim-lawson/mlsae-pythia-70m-deduped-x2-k32-tfm

Updated Dec 2, 2024 • 7
tim-lawson/mlsae-pythia-70m-deduped-x4-k32-tfm

Updated Dec 2, 2024 • 16
tim-lawson/mlsae-pythia-70m-deduped-x8-k32-tfm

Updated Dec 2, 2024 • 11
tim-lawson/mlsae-pythia-70m-deduped-x16-k32-tfm

Updated Dec 2, 2024 • 14
tim-lawson/mlsae-pythia-70m-deduped-x32-k32-tfm

Updated Dec 2, 2024 • 5
tim-lawson/mlsae-pythia-70m-deduped-x64-k32-tfm

Updated Dec 2, 2024 • 19
tim-lawson/mlsae-pythia-70m-deduped-x128-k32-tfm

Updated Dec 2, 2024 • 6
tim-lawson/mlsae-pythia-70m-deduped-x256-k32-tfm

Updated Dec 2, 2024 • 8
tim-lawson/mlsae-pythia-70m-deduped-x64-k16-tfm

Updated Dec 2, 2024 • 7
tim-lawson/mlsae-pythia-70m-deduped-x64-k64-tfm

Updated Dec 2, 2024 • 12
tim-lawson/mlsae-pythia-70m-deduped-x64-k128-tfm

Updated Dec 2, 2024 • 10
tim-lawson/mlsae-pythia-70m-deduped-x64-k256-tfm

Updated Dec 2, 2024 • 10
tim-lawson/mlsae-pythia-70m-deduped-x64-k512-tfm

Updated Dec 2, 2024 • 6
tim-lawson/mlsae-pythia-160m-deduped-x1-k32-tfm

Updated Dec 2, 2024 • 5
tim-lawson/mlsae-pythia-160m-deduped-x2-k32-tfm

Updated Dec 2, 2024 • 7
tim-lawson/mlsae-pythia-160m-deduped-x4-k32-tfm

Updated Dec 2, 2024 • 6
tim-lawson/mlsae-pythia-160m-deduped-x8-k32-tfm

Updated Dec 2, 2024 • 6
tim-lawson/mlsae-pythia-160m-deduped-x16-k32-tfm

Updated Dec 2, 2024 • 5
tim-lawson/mlsae-pythia-160m-deduped-x32-k32-tfm

Updated Dec 2, 2024 • 5
tim-lawson/mlsae-pythia-160m-deduped-x64-k32-tfm

Updated Dec 2, 2024 • 18
tim-lawson/mlsae-pythia-160m-deduped-x128-k32-tfm

Updated Dec 2, 2024 • 7
tim-lawson/mlsae-pythia-160m-deduped-x256-k32-tfm

Updated Dec 2, 2024 • 7
tim-lawson/mlsae-pythia-160m-deduped-x64-k16-tfm

Updated Dec 2, 2024 • 5
tim-lawson/mlsae-pythia-160m-deduped-x64-k64-tfm

Updated Dec 2, 2024 • 6
tim-lawson/mlsae-pythia-160m-deduped-x64-k128-tfm

Updated Dec 2, 2024 • 9
tim-lawson/mlsae-pythia-160m-deduped-x64-k256-tfm

Updated Dec 2, 2024 • 5
tim-lawson/mlsae-pythia-160m-deduped-x64-k512-tfm

Updated Dec 2, 2024 • 8
tim-lawson/mlsae-pythia-410m-deduped-x64-k32-tfm

Updated Dec 23, 2024 • 20
tim-lawson/mlsae-pythia-1b-deduped-x64-k32-tfm

Updated Dec 2, 2024 • 15
tim-lawson/mlsae-pythia-1.4b-deduped-x64-k32-tfm

Updated Dec 2, 2024 • 26
tim-lawson/mlsae-gpt2-x64-k32-tfm

Updated Dec 2, 2024 • 17
tim-lawson/mlsae-gemma-2-2b-x64-k32-tfm

Updated 21 days ago • 18
tim-lawson/mlsae-Llama-3.2-3B-x64-k32-tfm

Updated 21 days ago • 20

Upvote

Collection guide
Browse collections