Prisma-Multimodal
/

sae-top_k-64-cls_only-layer_9-hook_resid_post

Model card Files Files and versions Community

sae-top_k-64-cls_only-layer_9-hook_resid_post / README.md

soniajoseph's picture

Update README.md

3c9b234 verified about 1 month ago

|

history blame contribute delete

1.28 kB

	# CLIP Sparse Autoencoder Checkpoint

	This model is a sparse autoencoder trained on CLIP's internal representations.

	## Model Details

	### Architecture
	- Layer: 9
	- Layer Type: hook_resid_post
	- Model: open-clip:laion/CLIP-ViT-B-32-DataComp.XL-s13B-b90K
	- Dictionary Size: 49152
	- Input Dimension: 768
	- Expansion Factor: 64
	- CLS Token Only: True

	### Training
	- Training Images: 122875904
	- Learning Rate: 0.0002
	- L1 Coefficient: 0.3000
	- Batch Size: 4096
	- Context Size: 1

	## Performance Metrics

	### Sparsity
	- L0 (Active Features): 64
	- Dead Features: 0
	- Mean Log10 Feature Sparsity: -3.3087
	- Features Below 1e-5: 1
	- Features Below 1e-6: 0
	- Mean Passes Since Fired: 9.4857

	### Reconstruction
	- Explained Variance: 0.8555
	- Explained Variance Std: 0.0391
	- MSE Loss: 0.0011
	- L1 Loss: 0
	- Overall Loss: 0.0011

	## Training Details
	- Training Duration: 17939.6787 seconds
	- Final Learning Rate: 0.0002
	- Warm Up Steps: 200
	- Gradient Clipping: 1

	## Additional Information
	- Weights & Biases Run: https://wandb.ai/perceptual-alignment/clip/runs/vv5nve4a
	- Original Checkpoint Path: /network/scratch/s/sonia.joseph/checkpoints/clip-b
	- Random Seed: 42