執行環境的硬體配置

#7
by phidiassj - opened

請問可否提供執行環境的硬體配置規格?
包括建議執行規格及最低要求規格等。
謝謝您們! 辛苦了!

您好

README 中有 H100 GPU Hours和token量,您可以估計出訓練所需的運算資源

TAIDE org

您好
這裡補充一下推論的硬體需求,最主要的硬體需求會是 VRAM 的部份
以半精度的 8B 模型來說,模型參數本身會須要 16GB 的 VRAM,在推論過程中還會產生一些額外開銷,如 KV Cache 等
因此我建議的硬體規格會是有 20GB 以上 VRAM 的 GPU,以市面上的消費級顯示卡來說 90 等級的顯示卡才會有 20GB 以上的 VRAM,如 3090(Ti)/4090 有 24 GB 的 VRAM
而最低規格可能就難以界定了,因為你能使用各種時間換取空間的方式去節省 VRAM 的使用量,甚至不需要 GPU 也能夠運行

了解~ 感謝您的詳細說明!
另外想請問,是否有考慮推出延長 context 的版本? 8K 實在很不好運用
另外也請考慮加入 function calling ( tools ) 的功能
因為我是做 AI 整合應用的,很希望有機會運用國產的模型做發揮
謝謝!

TAIDE org

您可以使用 Dynamic NTK RoPE Scaling 來延展模型的 Context Size,此種方式在不對模型做額外訓練的情況下可以得到不錯的效果

TAIDE org

您好,

會轉達您的需求,謝謝您的建議。

Best regards.

phidiassj changed discussion status to closed

Sign up or log in to comment