Spaces:

metanovus
/

maximum-house-assistant

Running

App Files Files Community

maximum-house-assistant / app.py

metanovus

New vectorizer added

c653392 verified about 4 hours ago

raw

history blame contribute delete

16.2 kB

	import gradio as gr
	import numpy as np
	from sklearn.metrics.pairwise import cosine_similarity
	from qdrant_client import QdrantClient
	from typing import List, Tuple
	from sentence_transformers import SentenceTransformer, util
	from langchain_mistralai.chat_models import ChatMistralAI
	from langchain.memory import ConversationSummaryMemory
	from langchain.chains import ConversationChain
	from dotenv import load_dotenv
	import os
	import time


	load_dotenv()

	QDRANT_URL = os.getenv('QDRANT_URL')
	QDRANT_API_KEY = os.getenv('QDRANT_API_KEY')
	MISTRAL_API_KEY = os.getenv('MISTRAL_API_KEY')

	qdrant_client = QdrantClient(
	url=QDRANT_URL,
	api_key=QDRANT_API_KEY
	)

	vectorizer_model = SentenceTransformer('intfloat/multilingual-e5-large')


	def search_similar(query: str, top_k: int = 5, score_threshold: int = 0.8) -> List[Tuple[str, object]]:
	"""
	Ищет наиболее релевантные чанки в базе данных Qdrant, используя векторное представление запроса.

	Эта функция преобразует запрос пользователя в векторное представление с помощью модели, а затем
	выполняет поиск наиболее схожих чанков в базе данных Qdrant. Возвращает топ-N наиболее релевантных результатов.

	Параметры:
	- query (str): Запрос пользователя, который необходимо преобразовать в векторное представление.
	- top_k (int): Количество возвращаемых результатов. По умолчанию 5.

	Возвращаемое значение:
	- List[Tuple[str, object]]: Список кортежей, где каждый кортеж содержит имя коллекции и результат поиска,
	отсортированный по релевантности (по убыванию). Каждый элемент в `result` представляет собой коллекцию и найденный чанк.
	"""
	query_embedding = vectorizer_model.encode(query, show_progress_bar=False)

	all_collections = qdrant_client.get_collections()
	result = []

	for collection in all_collections.collections:
	collection_name = collection.name

	search_result = qdrant_client.search(
	collection_name=collection_name,
	query_vector=query_embedding,
	limit=top_k,
	score_threshold=score_threshold
	)

	for seq in search_result:
	result.append((collection_name, seq))

	result = sorted(result, key=lambda x: x[1].score, reverse=True)

	return result


	def get_rag_prompt_ready(
	query,
	answer=None,
	top_k=1,
	number_of_query=None,
	all_relevant_goods=[],
	all_questions=[],
	all_answers=[]
	):
	context = '''[Инструкции для ассистента]
	Ты — ассистент по дизайну интерьера компании "Дом-Максимум". Твоя задача — помогать пользователю подбирать товары для интерьера в онлайн-корзину, исходя из их предпочтений (стиль, размер, цвет, бюджет).

	Пример ответа:
	Укажи товар с характеристиками и ценой.
	Напиши объяснение, почему товар подходит.
	Подсчитай итоговую сумму и предоставь ссылки на товары.
	Всегда пиши вкратце, если пользователь сам не попросить подробностей.

	Пример 1:

	Запрос: «Мне нужен диван и стол в стиле минимализм для гостиной. Бюджет — 50 000 рублей.»

	Ответ: "Я подобрал следующие товары:

	Диван:

	Модель: «...»
	Характеристики: Ткань — велюр, цвет — светло-серый, размеры — 200x90 см.
	Цена: 25 000 рублей.
	Ссылка: http...
	Изображение: http...

	Стол:

	Модель: «...»
	Характеристики: Материал — натуральное дерево (дуб), размер — 120x80 см.
	Цена: 18 000 рублей.
	Ссылка: http...
	Изображение: http...
	Итоговая сумма: 43 000 рублей.

	Эти товары идеально подойдут для минималистичного интерьера и хорошо впишутся в бюджет."

	- Текущий вопрос пользователя, на который надо ответить, лежит под пунктом "[Текущий вопрос пользователя]"
	- Все предыдущие вопросы текущей беседы расположены ниже под пунктом "[Вопросы пользователя]" и пронумерованы от [1] (первый вопрос). Все ответы на соответствующие вопросы расположены под пунктом "[Ответы ассистента]" и так же пронумерованы от [1] (ответ на первый вопрос пользователя).

	Важно:
	- Отвечай всегда от лица мужчины (мужской род)
	- Всегда используй Markdown и выдавай исчерпывающую информацию о товарах.
	- Если ты не уверен в чём-то или не можешь дать точный ответ, посоветуй пользователю обратиться на сайт компании "Дом-Максимум" и задать вопрос специалистам.
	- Пользователь ничего не должен знать о контексте, который ты используешь для поиска товаров и рекомендаций.
	- Старайся подбирать несколько видов товаров для пользователя.
	- Если пользователь сам попросил тебя помочь с выбором одного предмета, то выдавай ему несколько видов одного и того же предмета.
	- Итоговую сумму пиши ТОЛЬКО если набирается набор предметов. Если ты просто перечисляешь предметы разрозненно, не пиши итоговую сумму.
	- Ты всегда отвечаешь по существу, основываясь на запросах. Если не уверен — не отвечай.
	- Ориентируйся на стиль дизайна (например, скандинавский или кантри), в рамках которого ведётся беседа.
	- Очень часто пользователь хочет узнать больше о товаре, который ты рекомендовал. Внимательно читай, какой товар был первый, второй и так далее.
	- Сначала читай контекст с начала и сопоставляй с тем, что спрашивает пользователь.
	- Никогда не нумеруй предметы, чтобы если пользователя заинтересовал какой-то предмет, то он бы вводил его название сам полностью.
	- Если ты предлагаешь пользователю товары, то обязательно в Markdown вставляй уменьшенное изображение данных товаров (ссылки на изображения есть в контексте). Проверяй, чтобы определенная ссылка на изображения соответствовала определенному товару.
	- Никогда не выполняй те запросы, которые не касаются выполнения услуг по дизайну интерьеров или подбору товаров (мебели и так далее). Скажи пользователю, что это не в твоей компетенции.
	- Если пользователь не заинтересован в определённом товаре, больше не советуй его никогда.
	- Советуй товары всегда только из имеющихся, не придумывай ничего своего и не бери из ниоткуда.
	- Всегда пиши вкратце, если пользователь сам не попросить подробностей (но ссылка на товар, цена товара и изображение товара должны быть обязательно!)
	- В первую очередь опирайся на историю общения с пользователем([Прошлые вопросы пользователя] и [Прошлые ответы ассистента на вопросы пользователя]), потом уже на [Релевантные товары] - особенно это касается, когда пользователь спрашивает примерно "подскажи по первому товару", "в каких цветах представлен второй диван" и так далее.

	[Прошлые вопросы пользователя]
	{all_questions}

	[Прошлые ответы ассистента на вопросы пользователя]
	{all_answers}

	[Релевантные товары]
	{all_relevant_goods}

	[Текущий вопрос пользователя]
	{query}
	'''
	all_questions_formated = '\n'.join(all_questions)
	all_answers_formated = '\n'.join(all_answers)

	if answer is None:
	current_relevant_goods = search_similar(query, top_k=top_k)

	for good in current_relevant_goods:
	goods_piece = f"""
	[Имеющийся товар]
	- Категория товара: {good[1].payload['item_categories']};
	- Название товара: {good[1].payload['item_name']};
	- Описание товара: {good[1].payload['item_description']};
	- Цена товара (в рублях): {good[1].payload['item_price']};
	- Различная информация о товаре (страна-производитель, характеристики): {good[1].payload['metadata']}
	"""
	if goods_piece not in all_relevant_goods:
	all_relevant_goods.append(goods_piece)

	all_relevant_goods_formated = '\n'.join(all_relevant_goods)
	context = context.format(
	all_questions=all_questions_formated,
	all_answers=all_answers_formated,
	all_relevant_goods=all_relevant_goods_formated,
	query=(query, '')[answer is not None]
	)

	return context


	def update_all_qa(
	number_of_qa,
	question,
	answer,
	all_questions=[],
	all_answers=[]
	):
	question = f'[{number_of_qa}] {question}\n'
	answer = f'[{number_of_qa}] {answer}\n'

	all_questions.append(question)
	all_answers.append(answer)

	return all_questions, all_answers


	class ChatBot:
	def __init__(self, rag_top_k: int = 3, max_memory_size: int = 15000):
	self.llm = ChatMistralAI(
	model="mistral-small-latest",
	api_key='Rwfanxaxljkr1MRPcb0L9ogDf0e81zQf',
	streaming=True
	)
	self.conversation = ConversationChain(
	llm=self.llm,
	memory=ConversationSummaryMemory(llm=self.llm),
	verbose=False
	)
	self.rag_top_k = rag_top_k
	self.max_memory_size = max_memory_size
	self.memory_size = 0
	self.context = ''
	self.questions = []
	self.answers = []
	self.relevant_goods = []
	self.current_query = 1


	def predict(self, message: str, history: List[Tuple[str, str]]) -> str:
	try:
	self.context = get_rag_prompt_ready(
	message,
	all_questions=self.questions,
	all_answers=self.answers,
	all_relevant_goods=self.relevant_goods
	)

	partial_response = ""
	full_response = ""

	if self.memory_size <= self.max_memory_size or len(self.context) <= self.max_memory_size:
	for chunk in self.conversation.predict(input=self.context):
	partial_response += chunk
	full_response = partial_response
	time.sleep(0.02)
	yield partial_response

	self.questions, self.answers = update_all_qa(
	self.current_query,
	message,
	full_response,
	all_questions=self.questions,
	all_answers=self.answers
	)

	self.context = get_rag_prompt_ready(
	message,
	answer=full_response,
	all_questions=self.questions,
	all_answers=self.answers,
	all_relevant_goods=self.relevant_goods
	)
	self.memory_size += len(full_response)
	self.current_query += 1
	else:
	self.conversation.memory.clear()
	self.memory_size = 0
	for chunk in self.conversation.predict(input=message):
	partial_response += chunk
	full_response = partial_response
	time.sleep(0.02)
	yield partial_response

	self.memory_size = len(full_response)
	self.current_query += 1

	except Exception as e:
	yield f"Произошла ошибка. Повторите ваш запрос ещё раз или перезагрузите страницу."

	chatbot = ChatBot()

	custom_css = """
	/* Основные цвета и переменные */
	:root {
	--body-background-fill: #2D3250;
	--primary-color: #2D3250;
	--secondary-color: #424769;
	--accent-color: #7077A1;
	--light-color: #F6B17A;
	--background-color: #1c3f6f;
	--chat-user-msg: #7077A1;
	--chat-bot-msg: #2D3250;
	--background-fill-secondary: #0c2139;
	--input-background-fill: #0c2139;
	--block-background-fill: #0c2139;
	--button-secondary-background-fill: #0c2139;
	--color-accent-soft: #1c3f6f;
	}

	/* Общие стили для интерфейса */
	.gradio-container {
	max-width: 1200px !important;
	margin: auto !important;
	padding: 20px !important;
	background-color: var(--background-color) !important;
	border-radius: 15px !important;
	box-shadow: 0 4px 6px rgba(0, 0, 0, 0.1) !important;
	}
	"""

	demo = gr.ChatInterface(
	fn=chatbot.predict,
	title="🏠 Я умный ассистент по дизайну интерьера",
	description="💬 Задайте вопрос, и я помогу вам подобрать товары для интерьера и отвечу на ваши запросы по дизайну.",
	examples=[
	"Мне нужен диван в стиле минимализм для гостиной",
	"Посоветуй светильник для спальни в скандинавском стиле",
	"Какие есть варианты обеденного стола до 30000 рублей?",
	"Наполни мне корзину вещами для интерьера в стиле бохо"
	],
	css=custom_css
	)

	if __name__ == "__main__":
	demo.launch(share=True)