Aleteian
/

Legend-of-the-Four-Winds-MN-12B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Legend-of-the-Four-Winds-MN-12B / README.md

Aleteian's picture

Upload folder using huggingface_hub

0bfa9cf verified about 1 month ago

|

history blame contribute delete

1.73 kB

	---
	base_model:
	- nbeerbower/Lyra-Gutenberg-mistral-nemo-12B
	- Aleteian/Saiga-Unleashed
	- LatitudeGames/Wayfarer-12B
	- IlyaGusev/saiga_nemo_12b
	- Aleteian/NeverendingStory
	library_name: transformers
	tags:
	- mergekit
	- merge

	---
	# merge

	This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).

	## Merge Details
	### Merge Method

	This model was merged using the [Model Breadcrumbs with TIES](https://arxiv.org/abs/2312.06795) merge method using [IlyaGusev/saiga_nemo_12b](https://huggingface.co/IlyaGusev/saiga_nemo_12b) as a base.

	### Models Merged

	The following models were included in the merge:
	* [nbeerbower/Lyra-Gutenberg-mistral-nemo-12B](https://huggingface.co/nbeerbower/Lyra-Gutenberg-mistral-nemo-12B)
	* [Aleteian/Saiga-Unleashed](https://huggingface.co/Aleteian/Saiga-Unleashed)
	* [LatitudeGames/Wayfarer-12B](https://huggingface.co/LatitudeGames/Wayfarer-12B)
	* [Aleteian/NeverendingStory](https://huggingface.co/Aleteian/NeverendingStory)

	### Configuration

	The following YAML configuration was used to produce this model:

	```yaml
	models:
	- model: Aleteian/Saiga-Unleashed
	parameters:
	density: 0.95
	weight: 0.4
	gamma: 0.01

	- model: Aleteian/NeverendingStory
	parameters:
	density: 0.95
	weight: 0.4
	gamma: 0.01

	- model: LatitudeGames/Wayfarer-12B
	parameters:
	density: 0.9
	weight: 0.1
	gamma: 0.01

	- model: nbeerbower/Lyra-Gutenberg-mistral-nemo-12B
	parameters:
	density: 0.9
	weight: 0.1
	gamma: 0.01

	merge_method: breadcrumbs_ties
	base_model: IlyaGusev/saiga_nemo_12b
	dtype: bfloat16

	tokenizer_source: "union"
	chat_template: "auto"

	```