Spaces:

BramLeo
/

adminzy

Paused

File size: 6,481 Bytes

f7ef9f6
a325830
40ca111
 
f7ef9f6
40ca111
 
a325830
40ca111
a325830
40ca111
 
ecb0859
40ca111
 
 
 
 
d60f2e2
 
 
 
 
 
 
 
 
 
 
 
 
 
 
dbf5679
d60f2e2
 
40ca111
d60f2e2
 
 
 
 
 
 
 
 
 
40ca111
d60f2e2
 
40ca111
 
 
 
f7ef9f6
 
40ca111
 
 
f7ef9f6
 
54188da
40ca111
 
 
 
800796c
f7ef9f6
800796c
f7ef9f6
54188da
40ca111
 
 
f7ef9f6
40ca111
 
 
ecb0859
 
 
f7ef9f6
40ca111
a325830
ecb0859
 
40ca111
e433088
a325830
ecb0859
40ca111
a325830
f7ef9f6
a325830
40ca111
 
 
f7ef9f6
643d9db
f7ef9f6
 
643d9db
f7ef9f6
 
 
40ca111
 
 
d9103af
40ca111
98032d3
d9103af
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
f7ef9f6
 
 
d9103af
 
 
 
 
 
f7ef9f6
 
d9103af
 
1ff4c99
d9103af
 
40ca111
a325830
 
40ca111
 
 
a325830
40ca111
f7ef9f6
98032d3
 
40ca111
f7ef9f6
98032d3
 
40ca111
98032d3
 
 
40ca111
98032d3
 
 
 
 
 
a325830
f7ef9f6

# Import Library yang Diperlukan
import gradio as gr
import gspread
from oauth2client.service_account import ServiceAccountCredentials
from llama_cpp import Llama
from llama_index.core import VectorStoreIndex, Settings
from llama_index.core.node_parser import SentenceSplitter
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.llms.llama_cpp import LlamaCPP
from huggingface_hub import hf_hub_download
from llama_index.core.llms import ChatMessage
from llama_index.core.chat_engine.condense_plus_context import CondensePlusContextChatEngine
from llama_index.core.schema import Document

# ===================================
# 1️⃣ Fungsi untuk Membaca Google Spreadsheet
# ===================================
def read_google_sheet():
    try:
        # Tentukan scope akses ke Google Sheets & Drive
        scope = ["https://www.googleapis.com/auth/spreadsheets", "https://www.googleapis.com/auth/drive"]
        
        # Load kredensial dari file credentials.json
        creds = ServiceAccountCredentials.from_json_keyfile_name("credentials.json", scope)
        client = gspread.authorize(creds)
        
        # 📌 Gunakan ID Spreadsheet (lebih aman)
        SPREADSHEET_ID = "1e_cNMhwF-QYpyYUpqQh-XCw-OdhWS6EuYsoBUsVtdNg"  # 🔹 Ganti dengan ID spreadsheet Anda
        SHEET_NAME = "datatarget"  # 🔹 Ganti dengan nama sheet
        
        # Buka spreadsheet dan worksheet
        spreadsheet = client.open_by_key(SPREADSHEET_ID)
        sheet = spreadsheet.worksheet(SHEET_NAME)

        # Ambil semua data dalam bentuk list (baris & kolom)
        data = sheet.get_all_values()

        # Format ulang data menjadi satu teks panjang (dapat disesuaikan)
        formatted_text = "\n".join([" | ".join(row) for row in data])
        
        return formatted_text
    
    except gspread.exceptions.SpreadsheetNotFound:
        return "❌ ERROR: Spreadsheet tidak ditemukan. Pastikan ID/nama benar!"
    
    except gspread.exceptions.WorksheetNotFound:
        return "❌ ERROR: Worksheet tidak ditemukan. Periksa kembali nama sheet!"
    
    except Exception as e:
        return f"❌ ERROR: {str(e)}"

# ===================================
# 2️⃣ Fungsi untuk Mengunduh Model Llama
# ===================================
def initialize_llama_model():
    model_path = hf_hub_download(
        repo_id="TheBLoke/zephyr-7b-beta-GGUF",  # 📌 Repo model HuggingFace
        filename="zephyr-7b-beta.Q4_K_M.gguf",  # 📌 Nama file model
        cache_dir="./models"
    )
    return model_path

# ===================================
# 3️⃣ Inisialisasi Model dan Pengaturan
# ===================================
def initialize_settings(model_path):
    Settings.llm = LlamaCPP(
        model_path=model_path,
        temperature=0.7,
    )

# ===================================
# 4️⃣ Inisialisasi Index dari Data Spreadsheet
# ===================================
def initialize_index():
    # 🔹 Ambil teks dari Google Spreadsheet
    text_data = read_google_sheet()

    # 🔹 Konversi teks ke dalam format dokumen yang benar
    document = Document(text=text_data)  # 🔹 Ubah teks menjadi objek `Document`
    documents = [document]  # 🔹 Masukkan ke dalam list

    # 🔹 Proses data menjadi node untuk vektor embedding
    parser = SentenceSplitter(chunk_size=150, chunk_overlap=10)
    nodes = parser.get_nodes_from_documents(documents)  # ✅ Sekarang `documents` adalah list of `Document`

    # 🔹 Gunakan model embedding
    embedding = HuggingFaceEmbedding("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
    Settings.embed_model = embedding

    # 🔹 Buat index vektor
    index = VectorStoreIndex(nodes)
    return index

# ===================================
# 5️⃣ Inisialisasi Mesin Chatbot
# ===================================
def initialize_chat_engine(index):
    retriever = index.as_retriever(similarity_top_k=3)
    chat_engine = CondensePlusContextChatEngine.from_defaults(
        retriever=retriever,
        verbose=True,
    )
    return chat_engine

# ===================================
# 6️⃣ Fungsi untuk Menghasilkan Respons Chatbot
# ===================================
def generate_response(message, history):
    if history is None:
        history = []
    
    # 🔹 Ambil data terbaru dari Google Spreadsheet setiap kali ada pertanyaan
    text_data = read_google_sheet()
    document = Document(text=text_data)
    documents = [document]

    # 🔹 Perbarui index dengan data terbaru
    parser = SentenceSplitter(chunk_size=150, chunk_overlap=10)
    nodes = parser.get_nodes_from_documents(documents)
    index = VectorStoreIndex(nodes)
    retriever = index.as_retriever(similarity_top_k=3)

    # 🔹 Buat ulang chat engine dengan index yang diperbarui
    chat_engine = CondensePlusContextChatEngine.from_defaults(
        retriever=retriever,
        verbose=True,
    )

    chat_messages = [
        ChatMessage(
            role="system",
            content="Anda adalah chatbot yang cerdas dan sopan. "
            "Jawablah semua pertanyaan dalam bahasa Indonesia dengan jelas dan mudah dipahami. "
            "Gunakan gaya bahasa yang profesional tetapi tetap ramah. "
            "Jika informasi tidak tersedia di dokumen, beritahukan dengan sopan bahwa Anda tidak memiliki informasi tersebut. "
            "Jangan menjawab dalam bahasa lain selain Bahasa Indonesia. "
            "Fokuslah memberikan jawaban yang akurat dan relevan sesuai dengan dokumen yang tersedia."
        ),
    ]

    # 🔹 Gunakan chat engine baru untuk menjawab pertanyaan
    response = chat_engine.stream_chat(message)
    text = "".join(response.response_gen)

    history.append((message, text))
    return history

# ===================================
# 7️⃣ Fungsi Utama untuk Menjalankan Aplikasi
# ===================================
def main():
    # 🔹 Unduh model dan inisialisasi pengaturan
    model_path = initialize_llama_model()
    initialize_settings(model_path)  

    # 🔹 Inisialisasi index dan chat engine
    index = initialize_index()
    chat_engine = initialize_chat_engine(index)  

    # 🔹 Fungsi untuk chat
    def chatbot_response(message, history):
        return generate_response(message, history, chat_engine)  

    # 🔹 Luncurkan Gradio UI
    gr.Interface(
        fn=chatbot_response,
        inputs=["text"],
        outputs=["text"],
    ).launch()

if __name__ == "__main__":
    main()