models: | |
- model: nbeerbower/Stella-mistral-nemo-12B-v2 | |
- model: nbeerbower/mistral-nemo-gutenberg-12B-v2 | |
merge_method: slerp | |
tokenizer_merge_method: slerp | |
tokenizer_parameters: | |
t: 0.3 # Dà più peso al tokenizer | |
base_model: nbeerbower/mistral-nemo-gutenberg-12B-v2 | |
dtype: bfloat16 | |
parameters: | |
t: [0, 0.2, 0.4, 0.5, 0.4, 0.2, 0] # Curva che favorisce leggermente | |
temp: 1.3 # Temperatura per smoothare il merge | |
density: # Density merging per bilanciare le caratteristiche dei due modelli | |
- threshold: 0.1 | |
t: 0.7 | |
- threshold: 0.5 | |
t: 0.5 | |
- threshold: 0.9 | |
t: 0.3 |