问个初级的问题:为何模型分成两个部分?

#4
by jx222 - opened

大神你好:
抱歉占用您的时间,问个初级的问题:为何模型分成两个部分(0001.bin + 0002.bin)?
这两部分分别有什么用途?

大神你好:
抱歉占用您的时间,问个初级的问题:为何模型分成两个部分(0001.bin + 0002.bin)?
这两部分分别有什么用途?

模型分片的话加载的时候可以更省内存,参考这个
https://huggingface.co/docs/transformers/main/big_models#sharded-checkpoints

非常感谢大神答疑!点赞!

jx222 changed discussion status to closed

Sign up or log in to comment