OPEA
/

DeepSeek-R1-int4-gptq-sym-inc

4-bit precision

Model card Files Files and versions Community

wenhuach commited on 23 days ago

Commit

36f5657

·

1 Parent(s): 6edef8a

change to gptq format

Signed-off-by: wenhuach <wenhuach87@gmail.com>

Files changed (1) hide show

config.json +2 -3

config.json CHANGED Viewed

@@ -44,7 +44,6 @@
     "batch_size": 4,
     "bits": 4,
     "data_type": "int",
-    "dataset": "NeelNanda/pile-10k",
     "enable_minmax_tuning": true,
     "enable_norm_bias_tuning": false,
     "enable_quanted_input": true,
@@ -55,7 +54,7 @@
     "lr": 0.005,
     "minmax_lr": 0.005,
     "nsamples": 512,
-    "quant_method": "intel/auto-round",
     "scale_dtype": "torch.float16",
     "seqlen": 2048,
     "sym": true,
@@ -83,4 +82,4 @@
   "use_cache": true,
   "v_head_dim": 128,
   "vocab_size": 129280
-}

     "batch_size": 4,
     "bits": 4,
     "data_type": "int",
     "enable_minmax_tuning": true,
     "enable_norm_bias_tuning": false,
     "enable_quanted_input": true,
     "lr": 0.005,
     "minmax_lr": 0.005,
     "nsamples": 512,
+    "quant_method": "gptq",
     "scale_dtype": "torch.float16",
     "seqlen": 2048,
     "sym": true,
   "use_cache": true,
   "v_head_dim": 128,
   "vocab_size": 129280
+}