私有化部署硬件配置

#4
by hongbaoai - opened

请问Qwen/Qwen2-72B-Instruct私有化部署最低需要什么样的硬件配置呀?一个200人的公司,如果选Qwen/Qwen2-72B-Instruct作为它的私有知识库大模型,服务器需要什么样的配置才能满足日常需求?

用 Qwen/Qwen2-72B-Instruct-GPTQ-Int4 需要 40 GB 以上的显存,2 张 4090 刚好,vllm 32 并发下大概 300 tokens/s。
非量化版估计要 160 GB 显存,2 张 80 GB 的 A100/H100,或 4 张 40 GB 的 A100 才能跑起来,价格大概 30 ~ 50 万吧。

Sign up or log in to comment