Spaces:

BramLeo
/

Chatbot

Paused

BramLeo commited on Jan 21

Commit

eb468e4

verified ·

1 Parent(s): 06f217b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,6 +10,7 @@ from llama_index.embeddings.huggingface import HuggingFaceEmbedding
 from llama_index.core import Settings
 from llama_cpp import Llama
 from huggingface_hub import hf_hub_download
 # Fungsi untuk memasang ulang llama-cpp-python dengan dukungan CUDA
 def install_llama_with_cuda():
@@ -21,7 +22,7 @@ def install_llama_with_cuda():
         # Install setiap paket dengan CMAKE_ARGS untuk dukungan CUDA
         for package in packages:
             subprocess.run(
-            ["pip", "install", "--force-reinstall", "--no-cache-dir", "llama-cpp-python"],
             env={"CMAKE_ARGS": "-DGGML_CUDA=on"},
         check=True
 )
@@ -49,13 +50,12 @@ def initialize_llama_model():
     return model_path
 # Fungsi untuk mengatur konfigurasi Settings
-def initialize_settings(model_path):  # Terima model_path sebagai parameter
-    Settings.llm = LlamaCPP(
         model_path=model_path,
-        model_kwargs={"n_gpu_layers": 0, # Sesuaikan dengan kebutuhan perangkat Anda
-                      "temperature": 0.7,  # Sesuaikan untuk respons yang lebih cepat
-                      "top_p": 0.9,       # Mengurangi eksplorasi token
-                     }
     )
 # Fungsi untuk Menginisialisasi Index

 from llama_index.core import Settings
 from llama_cpp import Llama
 from huggingface_hub import hf_hub_download
+from llama_cpp import Llama
 # Fungsi untuk memasang ulang llama-cpp-python dengan dukungan CUDA
 def install_llama_with_cuda():
         # Install setiap paket dengan CMAKE_ARGS untuk dukungan CUDA
         for package in packages:
             subprocess.run(
+            ["python", "-m", "pip", "install", "--force-reinstall", "--no-cache-dir", "llama-cpp-python"],
             env={"CMAKE_ARGS": "-DGGML_CUDA=on"},
         check=True
 )
     return model_path
 # Fungsi untuk mengatur konfigurasi Settings
+def initialize_settings(model_path):
+    Settings.llm = Llama(
         model_path=model_path,
+        n_gpu_layers=1,  # Sesuaikan dengan kebutuhan perangkat Anda
+        temperature=0.7,  # Sesuaikan untuk respons yang lebih cepat
+        top_p=0.9       # Mengurangi eksplorasi token
     )
 # Fungsi untuk Menginisialisasi Index