使用40G内存,half(), 加载原生Llama-2-7b模型没问题,但是加载Chinese-Llama-2-7b报错,OOM了。
这不应该吧,用的是我们提供的代码吗?我们这边16G、24G、32G都能跑通的
· Sign up or log in to comment