RAG-test2

Sleeping

File size: 3,938 Bytes

b67a4cc
 
 
e6441b6
 
 
 
b67a4cc
 
bd353c4
4fcb5d4
b67a4cc
 
 
f91846a
e6441b6
f91846a
e6441b6
b67a4cc
 
 
 
98dc21e
e6441b6
 
 
 
98dc21e
b67a4cc
e6441b6
 
 
 
 
b67a4cc
 
 
2cf7795
e6441b6
98dc21e
e6441b6
 
 
 
f23a640
e6441b6
 
b67a4cc
e6441b6
 
 
98dc21e
e6441b6
 
b67a4cc
e6441b6
 
55b1be9
b67a4cc
 
7d16b85
4fcb5d4
 
 
 
 
 
 
 
 
 
 
 
b67a4cc
56a4e1a
b67a4cc
 
 
e6441b6
b67a4cc
e6441b6
 
 
98dc21e
e6441b6
b67a4cc
4fcb5d4
e6441b6
4fcb5d4
 
 
b67a4cc
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
e6441b6

from fastapi import FastAPI, Depends, HTTPException, status
from fastapi.security import APIKeyHeader
from pydantic import BaseModel
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import Chroma
from langchain_google_genai import GoogleGenerativeAIEmbeddings, ChatGoogleGenerativeAI
from langchain.chains import ConversationalRetrievalChain
import pdfplumber
import os
import google.generativeai as genai
from deep_translator import GoogleTranslator

# 初始化 FastAPI 應用
app = FastAPI()

print('程式初始化')

# 設定 Google API 金鑰
api_key = os.getenv("GOOGLE_API_KEY")
if not api_key:
    raise ValueError("GOOGLE_API_KEY is not set")
genai.configure(api_key=api_key)

# 選擇模型
llm_model = 'gemini-1.5-flash'
embeddings_model = "models/embedding-001"
pdf_dir = 'data'

# 讀取 PDF 檔案並初始化資料
print('-' * 21, '讀取資料', '-' * 21)
docs = ""
for filename in os.listdir(pdf_dir):
    if filename.endswith('.pdf'):
        print(filename)
        with pdfplumber.open(os.path.join(pdf_dir, filename)) as pdf:
            for page in pdf.pages:
                docs += page.extract_text()

print('-' * 21, '讀取完成', '-' * 21)

# 分割文本
if docs:
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
    texts = text_splitter.split_text(docs)

    # 建立嵌入模型和檢索器
    embeddings = GoogleGenerativeAIEmbeddings(
        model=embeddings_model, google_api_key=api_key
    )
    retriever = Chroma.from_texts(texts, embeddings).as_retriever(search_kwargs={"k": 1})
    print('分割文本完成')

    # 初始化 Gemini 模型
    llm = ChatGoogleGenerativeAI(
        model=llm_model, temperature=0.1, google_api_key=api_key
    )
    print('模型載入完成')

else:
    raise ValueError("No documents found in the 'data' directory.")


# 定義翻譯函數
def translate_to_english(text):
    return GoogleTranslator(source='auto', target='en').translate(text)

def translate_to_chinese(text):
    return GoogleTranslator(source='auto', target='zh-TW').translate(text)





# 初始化 chat_history 作為全局變數
chat_history = []

# 定義 invoke 函數
def invoke(question: str):
    print('invoke 函數觸發')
    try:
        # 初始化 ConversationalRetrievalChain
        qa_chain = ConversationalRetrievalChain.from_llm(
            llm=llm, retriever=retriever
        )

        # 呼叫 QA chain 並處理回應
        question = translate_to_english(question)
        response = qa_chain.invoke({"question": question, "chat_history": chat_history})
        response = translate_to_chinese(response['answer'])
        # return response['answer']
        return response

    except Exception as e:
        print(f"Error during invoke: {e}")
        return "An error occurred while processing the request."


# 定義請求資料模型
class InvokeRequest(BaseModel):
    question: str

# API 金鑰設定
API_KEY_NAME = "X-API-Key"
API_KEY = os.getenv("API_KEY", "your_secret_api_key")
api_key_header = APIKeyHeader(name=API_KEY_NAME)

# 定義 API 金鑰驗證的依賴函數
def get_api_key(api_key: str = Depends(api_key_header)):
    if api_key != API_KEY:
        raise HTTPException(
            status_code=status.HTTP_403_FORBIDDEN,
            detail="Invalid API Key",
        )
    return api_key

# 根端點，用於檢查服務是否運行正常
@app.get("/")
async def read_root():
    return {"message": "Hello, World!"}

# 定義 POST 端點，讓使用者發送問題並獲得模型回應
@app.post("/invoke")
async def rag_endpoint(request: InvokeRequest, api_key: str = Depends(get_api_key)):
    result = invoke(request.question)
    return {"result": result}

# 啟動應用程式：執行命令 `uvicorn main:app --reload`
if __name__ == "__main__":
    import uvicorn
    uvicorn.run("main:app", host="0.0.0.0", port=8000, reload=True)