leafspark
/

DeepSeek-V2-Chat-GGUF

Text Generation

Inference Endpoints

Model card Files Files and versions Community

leafspark commited on May 20

Commit

306744b

•

1 Parent(s): 5e9b0bc

Update README.md

Files changed (1) hide show

README.md +15 -6

README.md CHANGED Viewed

@@ -1,7 +1,16 @@
 ---
-license: unknown
 library_name: transformers
 pipeline_tag: text-generation
 ---
 # Deepseek-V2-Chat-GGUF
@@ -20,13 +29,13 @@ Using llama.cpp fork: [https://github.com/fairydreaming/llama.cpp/tree/deepseek-
 - Merged GGUF should appear
 # Quants:
-- bf16 (finished, uploading) [size: 439gb]
 - q8_0 (after q2_k) [estimated size: 233.27gb]
-- q4_k_m (uploading) [size: 132gb]
-- q2_k (generating) [size: ~65gb]
-- q3_k_s (low priority) [estimated size: 96.05gb]
-Note: the bf16 GGUF does not have some DeepSeek v2 specific parameters, will look into adding them
 Please use commit 039896407afd40e54321d47c5063c46a52da3e01, otherwise use these metadata KV overrides:
 ```

 ---
+license: mit
 library_name: transformers
 pipeline_tag: text-generation
+tags:
+- code
+- deepseek
+- gguf
+- bf16
+- chinese
+- english
+metrics:
+- accuracy
 ---
 # Deepseek-V2-Chat-GGUF
 - Merged GGUF should appear
 # Quants:
+- bf16 [size: 439gb]
 - q8_0 (after q2_k) [estimated size: 233.27gb]
+- q4_k_m [size: 132gb]
+- q2_k (uploading) [size: 80gb]
+- q3_k_s (generating) [estimated size: 96.05gb]
+Note: the model files do not have some DeepSeek v2 specific parameters, will look into adding them
 Please use commit 039896407afd40e54321d47c5063c46a52da3e01, otherwise use these metadata KV overrides:
 ```