Hjgugugjhuhjggg
/

mergekit-ties-qgcitfu

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

mergekit-ties-qgcitfu / README.md

Hjgugugjhuhjggg's picture

Hjgugugjhuhjggg

Upload folder using huggingface_hub

9ff95ff verified about 1 month ago

|

history blame contribute delete

2.31 kB

	---
	base_model:
	- Isotonic/reasoning-llama3.2-3b
	- huihui-ai/Llama-3.2-3B-Instruct-abliterated
	- ValiantLabs/Llama3.2-3B-ShiningValiant2
	- BrainWave-ML/llama3.2-3B-codemath-orpo
	- disi-unibo-nlp/llama3.2-3B-SFT-medqa-triples-cot
	- TroyDoesAI/BlackSheep-Llama3.2-3B-Context_Obedient
	- CK0607/llama3.2-3B-CodeP
	library_name: transformers
	tags:
	- mergekit
	- merge

	---
	# merge

	This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).

	## Merge Details
	### Merge Method

	This model was merged using the [TIES](https://arxiv.org/abs/2306.01708) merge method using [huihui-ai/Llama-3.2-3B-Instruct-abliterated](https://huggingface.co/huihui-ai/Llama-3.2-3B-Instruct-abliterated) as a base.

	### Models Merged

	The following models were included in the merge:
	* [Isotonic/reasoning-llama3.2-3b](https://huggingface.co/Isotonic/reasoning-llama3.2-3b)
	* [ValiantLabs/Llama3.2-3B-ShiningValiant2](https://huggingface.co/ValiantLabs/Llama3.2-3B-ShiningValiant2)
	* [BrainWave-ML/llama3.2-3B-codemath-orpo](https://huggingface.co/BrainWave-ML/llama3.2-3B-codemath-orpo)
	* [disi-unibo-nlp/llama3.2-3B-SFT-medqa-triples-cot](https://huggingface.co/disi-unibo-nlp/llama3.2-3B-SFT-medqa-triples-cot)
	* [TroyDoesAI/BlackSheep-Llama3.2-3B-Context_Obedient](https://huggingface.co/TroyDoesAI/BlackSheep-Llama3.2-3B-Context_Obedient)
	* [CK0607/llama3.2-3B-CodeP](https://huggingface.co/CK0607/llama3.2-3B-CodeP)

	### Configuration

	The following YAML configuration was used to produce this model:

	```yaml
	models:
	- model: ValiantLabs/Llama3.2-3B-ShiningValiant2
	parameters:
	density: 0.5
	weight: 0.5
	- model: TroyDoesAI/BlackSheep-Llama3.2-3B-Context_Obedient
	parameters:
	density: 0.5
	weight: 0.5
	- model: BrainWave-ML/llama3.2-3B-codemath-orpo
	parameters:
	density: 0.5
	weight: 0.5
	- model: CK0607/llama3.2-3B-CodeP
	parameters:
	density: 0.5
	weight: 0.5
	- model: disi-unibo-nlp/llama3.2-3B-SFT-medqa-triples-cot
	parameters:
	density: 0.5
	weight: 0.5
	- model: Isotonic/reasoning-llama3.2-3b
	parameters:
	density: 0.5
	weight: 0.5

	merge_method: ties
	base_model: huihui-ai/Llama-3.2-3B-Instruct-abliterated
	parameters:
	normalize: false
	int8_mask: true
	dtype: float16

	```