Spaces:

llmbb
/

LLMBB-Agent

Running

App Files Files Community

vlff李飞飞 commited on Dec 29, 2023

Commit

af1bfb7

•

1 Parent(s): 56ec8fb

update oai

Browse files

Files changed (2) hide show

qwen_agent/llm/qwen_oai.py +8 -8
run_server.py +1 -0

qwen_agent/llm/qwen_oai.py CHANGED Viewed

@@ -416,24 +416,24 @@ def predict(
 class QwenChatAsOAI(BaseChatModel):
     def __init__(self, model: str, api_key: str, model_server: str):
-        checkpoint_path = model
         super().__init__()
         tokenizer = AutoTokenizer.from_pretrained(
-            checkpoint_path,
             trust_remote_code=True,
             resume_download=True,
         )
         device_map = "cpu"
         # device_map = "auto"
         model = AutoModelForCausalLM.from_pretrained(
-            checkpoint_path,
             device_map=device_map,
             trust_remote_code=True,
             resume_download=True,
         ).eval()
         model.generation_config = GenerationConfig.from_pretrained(
-            checkpoint_path,
             trust_remote_code=True,
             resume_download=True,
         )
@@ -444,7 +444,7 @@ class QwenChatAsOAI(BaseChatModel):
         messages: List[Dict],
         stop: Optional[List[str]] = None,
     ) -> Iterator[str]:
-        _request = ChatCompletionRequest(model=self.model,
                                                 messages=messages,
                                                 stop=stop,
                                                 stream=True)
@@ -459,7 +459,7 @@ class QwenChatAsOAI(BaseChatModel):
         messages: List[Dict],
         stop: Optional[List[str]] = None,
     ) -> str:
-        _request = ChatCompletionRequest(model=self.model,
                                                 messages=messages,
                                                 stop=stop,
                                                 stream=False)
@@ -471,12 +471,12 @@ class QwenChatAsOAI(BaseChatModel):
                             messages: List[Dict],
                             functions: Optional[List[Dict]] = None) -> Dict:
         if functions:
-            _request = ChatCompletionRequest(model=self.model,
                                                     messages=messages,
                                                     functions=functions)
             response = create_chat_completion(_request)
         else:
-            _request = ChatCompletionRequest(model=self.model,
                                              messages=messages)
             response = create_chat_completion(_request)
         # TODO: error handling

 class QwenChatAsOAI(BaseChatModel):
     def __init__(self, model: str, api_key: str, model_server: str):
+        self.checkpoint_path = copy.copy(model)
         super().__init__()
         tokenizer = AutoTokenizer.from_pretrained(
+            self.checkpoint_path,
             trust_remote_code=True,
             resume_download=True,
         )
         device_map = "cpu"
         # device_map = "auto"
         model = AutoModelForCausalLM.from_pretrained(
+            self.checkpoint_path,
             device_map=device_map,
             trust_remote_code=True,
             resume_download=True,
         ).eval()
         model.generation_config = GenerationConfig.from_pretrained(
+            self.checkpoint_path,
             trust_remote_code=True,
             resume_download=True,
         )
         messages: List[Dict],
         stop: Optional[List[str]] = None,
     ) -> Iterator[str]:
+        _request = ChatCompletionRequest(model=self.checkpoint_path,
                                                 messages=messages,
                                                 stop=stop,
                                                 stream=True)
         messages: List[Dict],
         stop: Optional[List[str]] = None,
     ) -> str:
+        _request = ChatCompletionRequest(model=self.checkpoint_path,
                                                 messages=messages,
                                                 stop=stop,
                                                 stream=False)
                             messages: List[Dict],
                             functions: Optional[List[Dict]] = None) -> Dict:
         if functions:
+            _request = ChatCompletionRequest(model=self.checkpoint_path,
                                                     messages=messages,
                                                     functions=functions)
             response = create_chat_completion(_request)
         else:
+            _request = ChatCompletionRequest(model=self.checkpoint_path,
                                              messages=messages)
             response = create_chat_completion(_request)
         # TODO: error handling

run_server.py CHANGED Viewed

@@ -12,6 +12,7 @@ from qwen_agent.utils.utils import get_local_ip
 from qwen_server.schema import GlobalConfig
 os.environ["TRANSFORMERS_CACHE"] = ".cache/huggingface/"
 os.environ["HF_HOME"] = ".cache/huggingface/"
 def parse_args():
     parser = argparse.ArgumentParser()

 from qwen_server.schema import GlobalConfig
 os.environ["TRANSFORMERS_CACHE"] = ".cache/huggingface/"
 os.environ["HF_HOME"] = ".cache/huggingface/"
+os.environ["MPLCONFIGDIR"] = ".cache/matplotlib/"
 def parse_args():
     parser = argparse.ArgumentParser()