pomelk1n
/

RuadaptQwen2.5-32B-instruct-4-bit-AWQ-GGUF

Text Generation

Model card Files Files and versions Community

pomelk1n commited on Nov 20, 2024

Commit

43cb4c4

·

verified ·

1 Parent(s): c6ad971

Update README.md

Files changed (1) hide show

README.md +1 -3

README.md CHANGED Viewed

@@ -13,13 +13,11 @@ tags:
 - GEMM
 ---
 ## Описание
 Эта модель представляет собой квантизированную версию [RuadaptQwen2.5-32B-instruct](https://huggingface.co/msu-rcc-lair/RuadaptQwen2.5-32B-instruct), выполненную с использованием **Activation-aware Weight Quantization (AWQ)** с 6-битной точностью, а затем экспортированную в формат **GGUF**.
-## Что такое GGUF?
-**GGUF (General-purpose GPU-Friendly Format)** — это формат, разработанный для повышения совместимости моделей с различными фреймворками и устройствами. В данном случае используется метод AWQ для вычисления масштабов и последующего применения их к весам без полной квантизации. Это сохраняет преимущества AWQ при повышении совместимости.
 ## Конфигурация квантизации
 ```json

 - GEMM
 ---
+# RuadaptQwen2.5-32B-instruct-4-bit-AWQ-GGUF
 ## Описание
 Эта модель представляет собой квантизированную версию [RuadaptQwen2.5-32B-instruct](https://huggingface.co/msu-rcc-lair/RuadaptQwen2.5-32B-instruct), выполненную с использованием **Activation-aware Weight Quantization (AWQ)** с 6-битной точностью, а затем экспортированную в формат **GGUF**.
 ## Конфигурация квантизации
 ```json