llama-python-streamingllm

Runtime error

App Files Files Community

Limour commited on Feb 10

Commit

670a6e9

•

1 Parent(s): 91dc74f

Upload 2 files

Browse files

Files changed (2) hide show

gradio_streamingllm.py +6 -1
llama_cpp_python_streamingllm.py +22 -6

gradio_streamingllm.py CHANGED Viewed

@@ -10,12 +10,15 @@ from mods.btn_rag import init as btn_rag_init
 # ========== 按钮中用到的共同的函数 ==========
 from mods.btn_com import init as btn_com_init
-# ========== 输出一段旁白 ==========
 from mods.btn_submit import init as btn_submit_init
 # ========== 输出一段旁白 ==========
 from mods.btn_vo import init as btn_vo_init
 # ========== 给用户提供默认回复的建议 ==========
 from mods.btn_suggest import init as btn_suggest_init
@@ -117,6 +120,8 @@ with gr.Blocks() as chatting:
     btn_suggest_init(cfg)
     # ========== 用于调试 ==========
     btn_reset_init(cfg)

 # ========== 按钮中用到的共同的函数 ==========
 from mods.btn_com import init as btn_com_init
+# ========== 输出一段回答 ==========
 from mods.btn_submit import init as btn_submit_init
 # ========== 输出一段旁白 ==========
 from mods.btn_vo import init as btn_vo_init
+# ========== 重新输出一段回答 ==========
+from mods.btn_retry import init as btn_retry_init
 # ========== 给用户提供默认回复的建议 ==========
 from mods.btn_suggest import init as btn_suggest_init
     btn_suggest_init(cfg)
+    btn_retry_init(cfg)
     # ========== 用于调试 ==========
     btn_reset_init(cfg)

llama_cpp_python_streamingllm.py CHANGED Viewed

@@ -50,10 +50,10 @@ class StreamingLLM(Llama):
     def venv_disband(self, name_set):
         if len(self.venv) <= 1:
-            return name_set
         name_set = {x for x in name_set if x in self.venv_idx_map}
         if not name_set:
-            return name_set
         while self.venv_idx_map:
             if self.venv_idx_map[0] in name_set:
                 self.venv_idx_map.pop(0)  # 删除
@@ -61,13 +61,29 @@ class StreamingLLM(Llama):
                 self.venv[0] += tmp
             else:
                 break
-        return name_set
     def venv_remove(self, name: str):
         if len(self.venv) <= 1:
-            return name
         if name not in self.venv_idx_map:
-            return name
         venv_idx = self.venv_idx_map.index(name) + 1
         while self.venv_idx_map:
             self.venv_idx_map.pop(venv_idx - 1)  # 删除
@@ -85,7 +101,7 @@ class StreamingLLM(Llama):
                     venv_idx = self.venv_idx_map.index(name, venv_idx - 1) + 1
                 except ValueError:  # 没有了
                     break
-        return name
     def venv_pop_token(self):
         self.n_tokens -= 1

     def venv_disband(self, name_set):
         if len(self.venv) <= 1:
+            return False
         name_set = {x for x in name_set if x in self.venv_idx_map}
         if not name_set:
+            return False
         while self.venv_idx_map:
             if self.venv_idx_map[0] in name_set:
                 self.venv_idx_map.pop(0)  # 删除
                 self.venv[0] += tmp
             else:
                 break
+        return True
+    def venv_revision(self, name: str):
+        if len(self.venv) <= 1:
+            return False
+        if name not in self.venv_idx_map:
+            return False
+        _s = 0
+        while self.venv_idx_map:
+            if self.venv_idx_map[-1] == name:
+                break
+            self.venv_idx_map.pop()  # 删除
+            _s += self.venv.pop()
+        if _s:
+            self.n_tokens -= min(_s, self.n_tokens)
+            self.kv_cache_seq_trim()
+        return True
     def venv_remove(self, name: str):
         if len(self.venv) <= 1:
+            return False
         if name not in self.venv_idx_map:
+            return False
         venv_idx = self.venv_idx_map.index(name) + 1
         while self.venv_idx_map:
             self.venv_idx_map.pop(venv_idx - 1)  # 删除
                     venv_idx = self.venv_idx_map.index(name, venv_idx - 1) + 1
                 except ValueError:  # 没有了
                     break
+        return True
     def venv_pop_token(self):
         self.n_tokens -= 1