Spaces:
Running
on
Zero
Running
on
Zero
File size: 13,186 Bytes
82f2d09 c3199d5 010a086 20e3524 010a086 20e3524 1440e09 f0d1859 a1259a0 20e3524 010a086 20e3524 010a086 20e3524 010a086 20e3524 010a086 20e3524 010a086 20e3524 64ae5f8 010a086 64ae5f8 5c95216 010a086 5c95216 010a086 20e3524 010a086 82f2d09 010a086 82f2d09 010a086 33ce99e 010a086 a1259a0 010a086 880d993 010a086 1440e09 20e3524 010a086 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 |
import os
os.environ['CUDA_VISIBLE_DEVICES'] = ''
import spaces
import sys
import gradio as gr
from llama_cpp import Llama
import configparser
from functools import partial
from utils.dl_utils import dl_guff_model
import io
import tempfile
import csv
# 定数
DEFAULT_INI_FILE = 'settings.ini'
MODEL_FILE_EXTENSION = '.gguf'
# パスの設定
if getattr(sys, 'frozen', False):
BASE_PATH = os.path.dirname(sys.executable)
MODEL_DIR = os.path.join(os.path.dirname(BASE_PATH), "AI-NovelAssistant", "models")
else:
BASE_PATH = os.path.dirname(os.path.abspath(__file__))
MODEL_DIR = os.path.join(os.path.dirname(os.path.abspath(__file__)), "models")
# モデルディレクトリが存在しない場合は作成
if not os.path.exists("models"):
os.makedirs("models")
# 使用するモデルのファイル名を指定
model_filename = "EZO-Common-9B-gemma-2-it.f16.gguf"
model_path = os.path.join("models", model_filename)
# モデルファイルが存在しない場合はダウンロード
if not os.path.exists(model_path):
dl_guff_model("models", f"https://huggingface.co/MCZK/EZO-Common-9B-gemma-2-it-GGUF/resolve/main/{model_filename}")
class ConfigManager:
@staticmethod
def load_settings(filename):
config = configparser.ConfigParser()
config.read(filename, encoding='utf-8')
return config
@staticmethod
def save_settings(config, filename):
with open(filename, 'w', encoding='utf-8') as configfile:
config.write(configfile)
@staticmethod
def update_setting(section, key, value, filename):
config = ConfigManager.load_settings(filename)
config[section][key] = value
ConfigManager.save_settings(config, filename)
return f"設定を更新しました: [{section}] {key} = {value}"
@staticmethod
def create_default_settings(filename):
config = configparser.ConfigParser()
config['Character'] = {
'gen_author_description': 'あなたは新進気鋭の和風伝奇ミステリー小説家で、細やかな筆致と巧みな構成で若い世代にとても人気があります。'
}
config['Models'] = {
'DEFAULT_GEN_MODEL': 'Mistral-Nemo-Instruct-2407-Q8_0.gguf'
}
config['GenerateParameters'] = {
'n_gpu_layers': '0',
'temperature': '0.35',
'top_p': '0.9',
'top_k': '40',
'repetition_penalty': '1.2',
'n_ctx': '10000'
}
ConfigManager.save_settings(config, filename)
print(f"デフォルト設定ファイル {filename} を作成しました。")
class ModelManager:
@staticmethod
def get_model_files():
return [f for f in os.listdir(MODEL_DIR) if f.endswith(MODEL_FILE_EXTENSION)]
class Settings:
@staticmethod
def _parse_config(config):
settings = {}
if 'Character' in config:
settings['gen_author_description'] = config['Character'].get('gen_author_description', '')
if 'Models' in config:
settings['DEFAULT_GEN_MODEL'] = config['Models'].get('DEFAULT_GEN_MODEL', '')
if 'GenerateParameters' in config:
settings['gen_n_gpu_layers'] = int(config['GenerateParameters'].get('n_gpu_layers', '0'))
settings['gen_temperature'] = float(config['GenerateParameters'].get('temperature', '0.35'))
settings['gen_top_p'] = float(config['GenerateParameters'].get('top_p', '0.9'))
settings['gen_top_k'] = int(config['GenerateParameters'].get('top_k', '40'))
settings['gen_rep_pen'] = float(config['GenerateParameters'].get('repetition_penalty', '1.2'))
settings['gen_n_ctx'] = int(config['GenerateParameters'].get('n_ctx', '10000'))
return settings
@staticmethod
def load_from_ini(filename):
config = ConfigManager.load_settings(filename)
return Settings._parse_config(config)
class TextGenerator:
def __init__(self):
self.llm = None
self.settings = None
self.current_model = None
@spaces.GPU(duration=120)
def load_model(self):
if self.llm:
del self.llm
self.llm = None
try:
model_path = os.path.join(MODEL_DIR, self.settings['DEFAULT_GEN_MODEL'])
n_gpu_layers = self.settings['gen_n_gpu_layers']
self.llm = Llama(model_path=model_path, n_ctx=self.settings['gen_n_ctx'], n_gpu_layers=n_gpu_layers)
self.current_model = 'GEN'
print(f"GEN モデル {model_path} のロードが完了しました。(n_gpu_layers: {n_gpu_layers})")
except Exception as e:
print(f"GEN モデルのロード中にエラーが発生しました: {str(e)}")
def generate_text(self, text, gen_characters, gen_token_multiplier, instruction):
if not self.llm:
self.load_model()
if not self.llm:
return "モデルのロードに失敗しました。設定を確認してください。"
author_description = self.settings.get('gen_author_description', '')
max_tokens = int(gen_characters * gen_token_multiplier)
messages = [
{"role": "user", "content": f"{author_description}\n\n以下の指示に従ってテキストを生成してください:"},
{"role": "assistant", "content": "はい、承知しました。指示に従ってテキストを生成いたします。"},
{"role": "user", "content": f"{instruction}\n\n生成するテキスト(目安は{gen_characters}文字):\n\n{text}"}
]
try:
response = self.llm.create_chat_completion(
messages=messages,
max_tokens=max_tokens,
temperature=self.settings['gen_temperature'],
top_p=self.settings['gen_top_p'],
top_k=self.settings['gen_top_k'],
repeat_penalty=self.settings['gen_rep_pen'],
)
generated_text = response["choices"][0]["message"]["content"].strip()
return generated_text
except Exception as e:
print(f"テキスト生成中にエラーが発生しました: {str(e)}")
return "テキスト生成中にエラーが発生しました。設定を確認してください。"
def load_settings(self, filename):
self.settings = Settings.load_from_ini(filename)
# グローバル変数
text_generator = TextGenerator()
model_files = ModelManager.get_model_files()
# Gradioインターフェース
def build_gradio_interface():
with gr.Blocks() as iface:
gr.HTML("""
<style>
#output {
resize: both;
overflow: auto;
min-height: 100px;
max-height: 80vh;
}
</style>
""")
with gr.Tab("文章生成"):
with gr.Row():
with gr.Column(scale=2):
instruction_type = gr.Dropdown(
choices=["自由入力", "推敲", "プロット作成", "あらすじ作成", "地の文追加"],
label="指示タイプ",
value="自由入力"
)
gen_instruction = gr.Textbox(
label="指示",
value="",
lines=3
)
gen_input_text = gr.Textbox(lines=5, label="処理されるテキストを入力してください")
gen_input_char_count = gr.HTML(value="文字数: 0")
with gr.Column(scale=1):
gen_characters = gr.Slider(minimum=10, maximum=10000, value=500, step=10, label="出力文字数", info="出力文字数の目安")
gen_token_multiplier = gr.Slider(minimum=0.5, maximum=3, value=1.75, step=0.01, label="文字/トークン数倍率", info="文字/最大トークン数倍率")
generate_button = gr.Button("文章生成開始")
generated_output = gr.Textbox(label="生成された文章", elem_id="output")
generate_button.click(
text_generator.generate_text,
inputs=[gen_input_text, gen_characters, gen_token_multiplier, gen_instruction],
outputs=[generated_output]
)
def update_instruction(choice):
instructions = {
"自由入力": "",
"推敲": "以下のテキストを推敲してください。原文の文体や特徴的な表現は保持しつつ、必要に応じて微調整を加えてください。文章の流れを自然にし、表現を洗練させることが目標ですが、元の雰囲気や個性を損なわないよう注意してください。",
"プロット作成": "以下のテキストをプロットにしてください。起承転結に分割すること。",
"あらすじ作成": "以下のテキストをあらすじにして、簡潔にまとめて下さい。",
"地の文追加": "以下のテキストに地の文を加え、情景を豊かにしてください。会話文は絶対に追加・改変しないでください。"
}
return instructions.get(choice, "")
instruction_type.change(
update_instruction,
inputs=[instruction_type],
outputs=[gen_instruction]
)
def update_char_count(text):
return f"文字数: {len(text)}"
gen_input_text.change(
update_char_count,
inputs=[gen_input_text],
outputs=[gen_input_char_count]
)
with gr.Tab("設定"):
output = gr.Textbox(label="更新状態")
config = ConfigManager.load_settings(DEFAULT_INI_FILE)
with gr.Column():
gr.Markdown("### モデル設定")
model_dropdown = gr.Dropdown(
label="DEFAULT_GEN_MODEL",
choices=ModelManager.get_model_files(),
value=config['Models'].get('DEFAULT_GEN_MODEL', '')
)
model_dropdown.change(
partial(ConfigManager.update_setting, 'Models', 'DEFAULT_GEN_MODEL'),
inputs=[model_dropdown],
outputs=[output]
)
gr.Markdown("### 文章生成設定")
gen_author_description = gr.TextArea(
label="gen_author_description",
value=config['Character'].get('gen_author_description', ''),
lines=5
)
gen_author_description.change(
partial(ConfigManager.update_setting, 'Character', 'gen_author_description'),
inputs=[gen_author_description],
outputs=[output]
)
gr.Markdown("### 文章生成パラメータ設定")
for key in ['n_gpu_layers', 'temperature', 'top_p', 'top_k', 'repetition_penalty', 'n_ctx']:
value = config['GenerateParameters'].get(key, '0')
if key == 'n_gpu_layers':
input_component = gr.Slider(label=key, value=int(value), minimum=-1, maximum=255, step=1)
elif key in ['temperature', 'top_p', 'repetition_penalty']:
input_component = gr.Slider(label=key, value=float(value), minimum=0.0, maximum=1.0, step=0.05)
elif key == 'top_k':
input_component = gr.Slider(label=key, value=int(value), minimum=1, maximum=200, step=1)
elif key == 'n_ctx':
input_component = gr.Slider(label=key, value=int(value), minimum=10000, maximum=100000, step=1000)
else:
input_component = gr.Textbox(label=key, value=value)
input_component.change(
partial(ConfigManager.update_setting, 'GenerateParameters', key),
inputs=[input_component],
outputs=[output]
)
apply_settings_button = gr.Button("設定を適用")
apply_settings_button.click(
lambda: text_generator.load_settings(DEFAULT_INI_FILE),
outputs=[output]
)
return iface
if __name__ == "__main__":
if not os.path.exists(DEFAULT_INI_FILE):
print(f"{DEFAULT_INI_FILE} が見つかりません。デフォルト設定で作成します。")
ConfigManager.create_default_settings(DEFAULT_INI_FILE)
text_generator.load_settings(DEFAULT_INI_FILE)
demo = build_gradio_interface()
demo.launch(server_name='0.0.0.0', server_port=7860, share=False) |