Spaces:

gufett0
/

chatbot-llamaindex

Sleeping

gufett0 commited on Sep 13, 2024

Commit

1275101

1 Parent(s): d227e0b

switched to hf_hub_download

Files changed (3) hide show

.gitignore CHANGED Viewed

backend.py CHANGED Viewed

@@ -8,6 +8,27 @@ import gradio as gr
 from llama_index.core import ChatPromptTemplate
 from llama_index.core import Settings, VectorStoreIndex, SimpleDirectoryReader, PromptTemplate, load_index_from_storage
 from llama_index.core.node_parser import SentenceSplitter
 model_id = "google/gemma-2-2b-it"
@@ -19,7 +40,8 @@ model = AutoModelForCausalLM.from_pretrained(
 )
 # what models will be used by LlamaIndex:
 Settings.embed_model = InstructorEmbedding(model_name="hkunlp/instructor-base")
-Settings.llm  = GemmaLLMInterface(model=model, tokenizer=tokenizer)
 ############################---------------------------------

 from llama_index.core import ChatPromptTemplate
 from llama_index.core import Settings, VectorStoreIndex, SimpleDirectoryReader, PromptTemplate, load_index_from_storage
 from llama_index.core.node_parser import SentenceSplitter
+from huggingface_hub import hf_hub_download
+from llama_cpp import Llama
+huggingface_token = os.getenv("HUGGINGFACE_TOKEN")
+hf_hub_download(
+    repo_id="google/gemma-2-2b-it-GGUF",
+    filename="2b_it_v2.gguf",
+    local_dir="./models",
+    token=huggingface_token
+)
+llm = Llama(
+            model_path=f"models/{"2b_it_v2.gguf"}",
+            #flash_attn=True,
+            #_gpu_layers=81,
+            n_batch=1024,
+            n_ctx=8192,
+        )
 model_id = "google/gemma-2-2b-it"
 )
 # what models will be used by LlamaIndex:
 Settings.embed_model = InstructorEmbedding(model_name="hkunlp/instructor-base")
+#Settings.llm  = GemmaLLMInterface(model=model, tokenizer=tokenizer)
+Settings.llm  = llm
 ############################---------------------------------

requirements.txt CHANGED Viewed

@@ -7,4 +7,6 @@ sentence-transformers==2.2.2
 llama-index-readers-web
 llama-index-readers-file
 gradio
-transformers

 llama-index-readers-web
 llama-index-readers-file
 gradio
+transformers
+llama-cpp-agent>=0.2.25
+setuptools