llm_rosebleu_lora / README.md
fsw's picture
Create README.md
4b0fc2f verified
|
raw
history blame
No virus
939 Bytes

これはなに?

stabilityai/japanese-stablelm-base-alpha-7brosebleu データセットで学習した Lora

使い方

.\text-generation-webui\loras\Rosebleu となるように配置。
text-generation-webuimodel の LoRAから読み込める。

データセット

https://gitlab.com/open_contents_datasets/Rosebleu
Hシーンも含まれているみたいですが、特に区別せずに突っ込んでいます。

前処理とデータロード

中にあるすべてのtsvを全部繋て、csvにしただけ。 学習プロンプトはこの用にしているので、このフォーマットだと良くなったりすることがあるかもしれないし、ないかもしれない。
コンテキスト長は2048にしているので、1行が2048トークン以上は切り捨てられているはず。

result = f'### name:\n{data_point["name"]}\n\n### text:\n{data_point["text"]}'