yayoimizuha
/

Nemotron-4-340B-Instruct-imatrix-GGUF

Text Generation

Inference Endpoints

Model card Files Files and versions Community

Edit model card

nvidia/Nemotron-4-340B-Instruct から変換.

TFMC/imatrix-dataset-for-japanese-llm を使用してimatrixデータを生成。

詳細はここのissueを追ってください。

Downloads last month: 193

GGUF

Model size

341B params

Architecture

nemotron4

2-bit

3-bit

4-bit

8-bit

Inference Examples

Text Generation

Unable to determine this model's library. Check the docs .

Model tree for yayoimizuha/Nemotron-4-340B-Instruct-imatrix-GGUF

Base model

nvidia/Nemotron-4-340B-Instruct

Quantized

(1)

this model

Dataset used to train yayoimizuha/Nemotron-4-340B-Instruct-imatrix-GGUF