Edit model card

4.0bpw
6.0bpw
8.0bpw

これは、Sdff-LtbaさんのLightChatAssistant-TypeB-2x7Bモデルをexl2量子化したものです。
Q4 cacheモードによる、32kのContextSize対応、8.0bpw量子化でVRAM16GBでフルロード可能です。

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Examples
Unable to determine this model's library. Check the docs .

Merge of