seyf1elislam
/

neural-Kunoichi2-7B-slerp-GGUF

Inference Endpoints

Model card Files Files and versions Community

neural-Kunoichi2-7B-slerp

Model creator: seyf1elislam
Original model: neural-Kunoichi2-7B-slerp

Description

This repo contains GGUF format model files for seyf1elislam's neural-Kunoichi2-7B-slerp .

Provided files

Name	Quant method	Bits	Size	Max RAM required	Use case
neural-kunoichi2-7b-slerp.Q4_K_M.gguf	Q4_K_M	4	4.37 GB	6.87 GB	medium, balanced quality - recommended
neural-kunoichi2-7b-slerp.Q5_K_M.gguf	Q5_K_M	5	5.13 GB	7.63 GB	large, very low quality loss - recommended
neural-kunoichi2-7b-slerp.Q6_K.gguf	Q6_K	6	5.94 GB	8.44 GB	very large, extremely low quality loss
neural-kunoichi2-7b-slerp.Q8_0.gguf	Q8_0	8	7.70 GB	10.20 GB	very large, extremely low quality loss - not recommended

Downloads last month: 7

GGUF

Model size

7.24B params

Architecture

llama

4-bit

5-bit

6-bit

8-bit

Inference API

Unable to determine this model's library. Check the docs .

Model tree for seyf1elislam/neural-Kunoichi2-7B-slerp-GGUF

Base model

seyf1elislam/neural-Kunoichi2-7B-slerp

Quantized

(1)

this model

Collections including seyf1elislam/neural-Kunoichi2-7B-slerp-GGUF

⚔ 7b Merges

Some merges aims to boost creativity and Context comprehension • 13 items • Updated May 29 • 4

GGUF Qunat

Quantized model using gguf format • 9 items • Updated May 29 • 2