量化设备

#3
by tiantian7777 - opened

想问一下用几张卡对qwen72B进行量化的,我使用8张A100-40G 爆显存了。。 或者如何使用8张a100-40G运行

Owner

这个是在finetune代码加之前用单张a100量化的,最近修复了个finetune阶段会导致显存占用太多的bug,我重新跑qwen1.5 72b试一下

直接对qwen72B使用quip进行量化 ,需要几张卡。

Owner

我也遇到OOM了,目前代码有些问题,我建了个issue来track这个问题。目前的量化框架流程是从optimum gptq复制来的,这一块对于使用多卡不太友好,用多卡的话会需要一直加载所有权重在显存里,这一块也需要优化下。

Sign up or log in to comment