AINovelChat

Running on Zero

tori29umai commited on Aug 19, 2024

Commit

984d81b

verified ·

1 Parent(s): 4e9e6ca

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -13,6 +13,7 @@ from functools import partial
 import threading
 import asyncio
 import csv
 # 定数
 DEFAULT_INI_FILE = 'settings.ini'
@@ -289,7 +290,13 @@ class LlamaAdapter:
             repeat_penalty=repeat_penalty
         )
 class CharacterMaker:
     def __init__(self):
         self.llama = None
@@ -330,7 +337,7 @@ class CharacterMaker:
             try:
                 # 新しいモデルをロード
-                self.llama = LlamaAdapter(model_path, params, n_gpu_layers)
                 self.current_model = model_type
                 self.model_loaded.set()
                 print(f"{model_type} モデルをロードしました。モデルパス: {model_path}、GPUレイヤー数: {n_gpu_layers}")

 import threading
 import asyncio
 import csv
+from utils.dl_utils import dl_guff_model
 # 定数
 DEFAULT_INI_FILE = 'settings.ini'
             repeat_penalty=repeat_penalty
         )
+@spaces.GPU(duration=120)
+def load_model_gpu(model_type, model_path, n_gpu_layers, params):
+    llama = LlamaAdapter(model_path, params, n_gpu_layers)
+    print(f"{model_type} モデル {model_path} のロードが完了しました。(n_gpu_layers: {n_gpu_layers})")
+    return llama
 class CharacterMaker:
     def __init__(self):
         self.llama = None
             try:
                 # 新しいモデルをロード
+                self.llama = load_model_gpu(model_type, model_path, n_gpu_layers, params)
                 self.current_model = model_type
                 self.model_loaded.set()
                 print(f"{model_type} モデルをロードしました。モデルパス: {model_path}、GPUレイヤー数: {n_gpu_layers}")