# NonToxicGlazeAdvisor_Chat_with_Docs_Groq_Edition_1 - app.py - 04-04-2024
# 03-04-2024
import streamlit as st
tab1, tab2, tab3 = st.tabs(["AI Adviseur voor niet-giftige glazuren", "Uitleg", "Voorbeeld vragen"])
with tab2:
st.image("De fritte oven - een schets van het proces.jpg", width=200)
with tab3:
st.header("Voorbeeld vragen")
st.write("De fritte oven - een schets van het proces:")
st.image("De fritte oven - een schets van het proces.jpg", width=200)
st.header('Hier alvast een klein aantal voorbeeldvragen die je aan deze AI adviseur voor niet-giftige glazuren zou kunnen stellen:', divider='rainbow')
st.write("Hoe kan ik thuis als hobby keramiek maken? Geef het antwoord uitsluitend en alleen in de Nederlands taal ")
st.write("Geef een samenvatting in 10 zinnen. ")
st.write("Geef een samenvatting in 25 bullet points. ")
st.write("Geef een samenvatting in 25 bullet points. Geef het antwoord uitsluitend en alleen in de Nederlandse taal. ")
st.write("Geef een samenvatting in 25 bullet points. Geef het antwoord uitsluitend en alleen in de Duitse taal. ")
st.write("Explain glazing techniques to me as if I am 10 years old. ")
st.write("Geef me uitleg over glazuurtechnieken alsof ik 5 jaar oud ben. Geef het antwoord uitsluitend en alleen in de Nederlandse taal.")
st.write(" ... ")
st.header('Voorbeeldvragen met voorbeeldantwoorden die je aan deze AI adviseur voor niet-giftige glazuren zou kunnen stellen:', divider='rainbow')
st.write("Wie ben ik?")
st.write("assistant avatar:\n
Gezien de tekst is het waarschijnlijk dat u heer Victor Benckhuijsen bent. U bent iemand die ervaring heeft opgedaan met het maken van glazuren voor keramiek, met name alkalische fritten. U heeft deze ervaring opgedaan op verschillende plekken, zoals de kunstacademie, de agrarische hogeschool en de geologie en bodemkunde. U benadrukt de waarden van veiligheid en het belang van het gebruik van non-giftige materialen. U verkoopt geen recepten, maar verstrekt wel veiligheidsattesten op verzoek. U benadrukt ook de voordelen van het gebruik van industriële fritten voor hobbyisten, omdat dit een veilige en eenvoudige manier is om non-giftige keramische glazuren te maken.")
st.write("(wordt vervolgd)")
# ========================================================================
with tab1:
st.header("AI Adviseur voor niet-giftige glazuren")
st.image("De fritte oven - een schets van het proces.jpg", width=200)
from langchain_community.embeddings import FastEmbedEmbeddings
import os
import streamlit as st
from langchain_groq import ChatGroq
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.document_loaders import PyPDFLoader
from langchain_community.embeddings import OllamaEmbeddings
from langchain_community.embeddings import FastEmbedEmbeddings
from langchain_community.document_loaders import PyPDFDirectoryLoader
from langchain_community.document_loaders import DirectoryLoader
from langchain_community.document_loaders import TextLoader
import chardet
from langchain_community.vectorstores import FAISS
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_core.prompts import ChatPromptTemplate
from langchain.chains import create_retrieval_chain
import time
from dotenv import load_dotenv
import glob
load_dotenv() #
groq_api_key = os.environ['GROQ_API_KEY']
# st.write("---------------------------------")
st.title("Adviseur voor niet-giftige glazuren:")
st.subheader("Een gereedschap gebaseerd op Kunstmatige Intelligentie (AI) om advies te krijgen over niet-giftige keramische glazuren voor aardewerk temperatuur bereiken.")
st.subheader("Victor Benckhuijsen : (Glazuur technieken / Keramiek)")
st.subheader("(ALL RIGHTS RESERVED)")
st.image('Victor_Benckhuijsen_2.png', caption='Victor Benckhuijsen', width=100)
st.subheader("Jan Bours : Artificial Intelligence / Data Science / Natural Language Processing")
st.subheader("(ALL RIGHTS RESERVED)")
st.image('Jan_Bours_2.png', caption='Jan Bours', width=100)
st.subheader("Chat with Docs - Using AI: 'mixtral-8x7b-32768' Groq Edition (Very Fast!) - VERSION 2 - April 3, 2024")
pdf_files = glob.glob("*.pdf")
for file in pdf_files:
start1 = time.process_time()
if "vector" not in st.session_state:
st.write("Even geduld a.u.b. ........")
# st.header("Chunking, embedding, storing in FAISS vectorstore (Can take a long time!).")
# st.subheader("Wait till this hase been done before you can enter your query! .......")
# st.session_state.embeddings = OllamaEmbeddings() # ORIGINAL
st.session_state.embeddings = FastEmbedEmbeddings() # JB
with st.status("Laden van de PDF documenten / Splitting de teksten / Genereer de Vector Store ...", expanded=True) as status:
# st.write("Searching for data...")
st.write("Laden van de PDF documenten...")
# JB:
# https://python.langchain.com/docs/modules/data_connection/document_loaders/file_directory
# text_loader_kwargs={'autodetect_encoding': True}
text_loader_kwargs={'autodetect_encoding': False}
path = '../'
# loader = DirectoryLoader(path, glob="**/*.pdf", loader_cls=TextLoader, loader_kwargs=text_loader_kwargs)
# PyPDFDirectoryLoader (TEST):
# loader = PyPDFDirectoryLoader(path, glob="**/*.pdf", loader_cls=TextLoader, loader_kwargs=text_loader_kwargs)
# loader = PyPDFDirectoryLoader(path, glob="**/*.pdf", loader_kwargs=text_loader_kwargs)
loader = PyPDFDirectoryLoader(path, glob="**/*.pdf")
docs = loader.load()
st.session_state.docs = docs
st.write("Splitting / chunking de teksten...")
st.session_state.text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
st.session_state.documents = st.session_state.text_splitter.split_documents(st.session_state.docs)
st.write("Genereer de Vector Store (kan enige minuten duren)...")
st.session_state.vector = FAISS.from_documents(st.session_state.documents, st.session_state.embeddings) # ORIGINAL
elapsed_time = time.process_time() - start1
st.write(f"Response time voor: Laden van de PDF documenten / Splitting de teksten / Genereer de Vector Store: {elapsed_time:.1f} seconds")
llm = ChatGroq(
prompt = ChatPromptTemplate.from_template("""
Answer the following question based only on the provided context.
Think step by step before providing a detailed answer.
I will tip you $200 if the user finds the answer helpful.
Question: {input}""")
document_chain = create_stuff_documents_chain(llm, prompt)
retriever = st.session_state.vector.as_retriever()
retrieval_chain = create_retrieval_chain(retriever, document_chain)
with st.sidebar:
UserEmailAdress = st.text_input("Vul Uw email adres hier in: ", key="UserEmailAdress", type="password")
# "[Zelf keramische glazuren NON TOXIC samenstellen vanuit 1 basisglazuur](http://www.ceramicconcepts.nl/)"
"[Keramische ateliers Victor Benckhuijsen](https://victorglazuren.nl/)"
"[Keramiek Victor Glazuren Victor Benckhuijsen - Instagram](https://www.instagram.com/benckhuijsenvictor/?hl=am-et)"
"[Keramiek Victor Glazuren Victor Benckhuijsen - Facebook](https://www.facebook.com/harryjamaar)"
"[Keramiek Victor Glazuren Victor Benckhuijsen - YouTube](https://www.youtube.com/@kleienhoop/videos)"
st.title("💬 Chatbot")
st.caption("🚀 A streamlit chatbot powered by mixtral-8x7b-32768 Groq LLM (VERY FAST !). temperature=0.2")
if "messages" not in st.session_state:
st.session_state["messages"] = [{"role": "assistant", "content": "Hoe kan ik U helpen?"}]
for msg in st.session_state.messages:
option = st.selectbox(
'In welke taal wilt U Uw vragen stellen en de AI laten antwoorden? Keuzemogelijkheden zijn : Nederlands, Engels, Duits, Frans, Spaans.',
('Nederlands', 'Engels', 'Duits', 'Frans', 'Spaans'))
st.write('You selected:', option)
if prompt := st.chat_input():
original_prompt = prompt
prompt = prompt + language_prompt
# Then pass the prompt to the LLM
start = time.process_time()
response = retrieval_chain.invoke({"input": prompt})
elapsed_time = time.process_time() - start
st.write(f"Response time van de LLM: {elapsed_time:.1f} seconds")
# st.write(response["answer"])
st.session_state.messages.append({"role": "user", "content": prompt})
# st.chat_message("user").write(prompt)
msg = response["answer"]
st.session_state.messages.append({"role": "assistant", "content": msg})
st.chat_message("assistant", avatar="Victor_Benckhuisen_20_percent.jpg").write(msg)
with st.expander("Document Similarity Search"):
# Find the relevant chunks
for i, doc in enumerate(response["context"]):
st.write(f"Source Document # {i+1} : {doc.metadata['source'].split('/')[-1]}")
# Show total messages history of user + AI in this session up till this point
with st.expander("Show total messages history of user + AI in this session up till this point"):
# st.session_state.messages
