Sdff-Ltba
/

LightChatAssistant-TypeB-2x7B-GGUF

Text Generation

Mixture of Experts

Not-For-All-Audiences

nsfw

Model card Files Files and versions Community

Sdff-Ltba commited on Apr 20

Commit

4aa91b5

•

1 Parent(s): b5f53cc

Update README.md

Files changed (1) hide show

README.md +5 -2

README.md CHANGED Viewed

@@ -18,13 +18,14 @@ pipeline_tag: text-generation
 [Sdff-Ltba/LightChatAssistant-TypeB-2x7B](https://huggingface.co/Sdff-Ltba/LightChatAssistant-TypeB-2x7B)をGGUF変換したものです。
 ファイル名に`_imatrix`が付いているものはiMatrixを併用して量子化しています。
 ## 量子化手順
 以下の通りに実行しました。(iMatrixを併用してiQ4XSにする場合)
 ```
 python ./llama.cpp/convert.py ./LightChatAssistant-TypeB-2x7B --outtype f16 --outfile ./gguf-model_f16.gguf
-./llama.cpp/imatrix -m ./gguf-model_f16.gguf -f ./wiki.train.raw -o ./gguf-model.imatrix --chunks 32
 ./llama.cpp/quantize --imatrix ./gguf-model.imatrix ./gguf-model_f16.gguf ./LightChatAssistant-TypeB-2x7B_iq4xs.gguf iq4_xs
 ```
@@ -37,7 +38,9 @@ python ./llama.cpp/convert.py ./LightChatAssistant-TypeB-2x7B --outtype f16 --ou
 #### 参考
 - [llama.cpp：複雑化する量子化バリエーションの整理（2024.02現在） - ローカルLLM自由帳](https://sc-bakushu.hatenablog.com/entry/2024/02/26/062547)
-  「追記：KL-divergence による量子化評価」を参考にさせていただきました
 ## 環境

 [Sdff-Ltba/LightChatAssistant-TypeB-2x7B](https://huggingface.co/Sdff-Ltba/LightChatAssistant-TypeB-2x7B)をGGUF変換したものです。
 ファイル名に`_imatrix`が付いているものはiMatrixを併用して量子化しています。
+iMatrix作成用データとして、[TFMC/imatrix-dataset-for-japanese-llm](https://huggingface.co/datasets/TFMC/imatrix-dataset-for-japanese-llm)を使わせていただきました。
 ## 量子化手順
 以下の通りに実行しました。(iMatrixを併用してiQ4XSにする場合)
 ```
 python ./llama.cpp/convert.py ./LightChatAssistant-TypeB-2x7B --outtype f16 --outfile ./gguf-model_f16.gguf
+./llama.cpp/imatrix -m ./gguf-model_f16.gguf -f ./c4_en_ja_imatrix.txt -o ./gguf-model.imatrix --chunks 32
 ./llama.cpp/quantize --imatrix ./gguf-model.imatrix ./gguf-model_f16.gguf ./LightChatAssistant-TypeB-2x7B_iq4xs.gguf iq4_xs
 ```
 #### 参考
 - [llama.cpp：複雑化する量子化バリエーションの整理（2024.02現在） - ローカルLLM自由帳](https://sc-bakushu.hatenablog.com/entry/2024/02/26/062547)
+  「追記：KL-divergence による量子化評価」を参考にさせていただきました。
+- [llama.cpp：iMatrix量子化は日本語性能にどう影響するか？ - ローカルLLM自由帳](https://sc-bakushu.hatenablog.com/entry/2024/04/20/050213)
+  iMatrix作成に用いるデータを検証していらっしゃって、とても参考になります。また公開してくださった日英混合iMatrix用テキストを使用させていただきました。
 ## 環境