NewEden-Forge
/

DELLA-TEST-MERGE

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DELLA-TEST-MERGE / README.md

Delta-Vector's picture

Upload folder using huggingface_hub

15557df verified 5 days ago

|

history blame contribute delete

1.84 kB

	---
	base_model:
	- NewEden-Forge/madness-erebus
	- nbeerbower/mistral-nemo-bophades-12B
	- TheDrummer/UnslopNemo-12B-v4.1
	- Nitral-AI/Captain_BMO-12B
	- nbeerbower/mistral-nemo-gutenberg-12B-v4
	- NewEden-Forge/TEST-12B
	library_name: transformers
	tags:
	- mergekit
	- merge

	---
	# merge

	This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).

	## Merge Details
	### Merge Method

	This model was merged using the della_linear merge method using [NewEden-Forge/madness-erebus](https://huggingface.co/NewEden-Forge/madness-erebus) as a base.

	### Models Merged

	The following models were included in the merge:
	* [nbeerbower/mistral-nemo-bophades-12B](https://huggingface.co/nbeerbower/mistral-nemo-bophades-12B)
	* [TheDrummer/UnslopNemo-12B-v4.1](https://huggingface.co/TheDrummer/UnslopNemo-12B-v4.1)
	* [Nitral-AI/Captain_BMO-12B](https://huggingface.co/Nitral-AI/Captain_BMO-12B)
	* [nbeerbower/mistral-nemo-gutenberg-12B-v4](https://huggingface.co/nbeerbower/mistral-nemo-gutenberg-12B-v4)
	* [NewEden-Forge/TEST-12B](https://huggingface.co/NewEden-Forge/TEST-12B)

	### Configuration

	The following YAML configuration was used to produce this model:

	```yaml
	models:
	- model: Nitral-AI/Captain_BMO-12B
	parameters:
	weight: 0.1
	density: 0.4
	- model: nbeerbower/mistral-nemo-bophades-12B
	parameters:
	weight: 0.12
	density: 0.5
	- model: nbeerbower/mistral-nemo-gutenberg-12B-v4
	parameters:
	weight: 0.2
	density: 0.6
	- model: TheDrummer/UnslopNemo-12B-v4.1
	parameters:
	weight: 0.25
	density: 0.7
	- model: NewEden-Forge/TEST-12B
	parameters:
	weight: 0.33
	density: 0.8
	merge_method: della_linear
	base_model: NewEden-Forge/madness-erebus
	parameters:
	epsilon: 0.05
	lambda: 1
	dtype: bfloat16
	tokenizer_source: base
	```