AWQ/GPTQ
#9
by
alegchenko
- opened
Планируется ли добавление Квантизаций на основе более быстрых методов AWQ/GPTQ поддерживаемых VLLM ? GGUF к сожалению формат дает значительно более низкие показатели скорости и так понимаю imatrix не использовались для лучшего сохранения качества ?