AWQ/GPTQ

#9
by alegchenko - opened

Планируется ли добавление Квантизаций на основе более быстрых методов AWQ/GPTQ поддерживаемых VLLM ? GGUF к сожалению формат дает значительно более низкие показатели скорости и так понимаю imatrix не использовались для лучшего сохранения качества ?

Sign up or log in to comment