opex792 commited on
Commit
dae6371
·
verified ·
1 Parent(s): 0472f71

Create app.py

Browse files
Files changed (1) hide show
  1. app.py +69 -0
app.py ADDED
@@ -0,0 +1,69 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import gradio as gr
2
+ from sentence_transformers import SentenceTransformer, util
3
+
4
+ # Загружаем модель
5
+ model = SentenceTransformer("HIT-TMG/KaLM-embedding-multilingual-mini-instruct-v1")
6
+
7
+ # Описания фильмов на русском языке с названиями и увеличенной длиной
8
+ movie_descriptions = {
9
+ "Гарри Поттер и Философский камень": "Юный волшебник Гарри Поттер поступает в школу чародейства и волшебства Хогвартс, где ему предстоит не только обучиться магии, но и сразиться с темным волшебником Волан-де-Мортом, который убил его родителей и оставил шрам на лбу Гарри.",
10
+ "Властелин колец: Братство Кольца": "Могущественное Кольцо Всевластия, созданное темным властелином Сауроном, попадает к хоббиту Фродо Бэггинсу. Чтобы не допустить порабощения Средиземья, Фродо и его друзья отправляются в опасное путешествие к Роковой Горе, чтобы уничтожить Кольцо в её пламени.",
11
+ "Голодные игры": "В постапокалиптическом мире государство Панем ежегодно устраивает жестокие игры на выживание, в которых участвуют по одному юноше и девушке из каждого округа. Китнисс Эвердин добровольно вызывается участвовать вместо своей младшей сестры и борется за выживание в смертельной схватке.",
12
+ "Семь": "Опытный детектив Уильям Сомерсет и его молодой напарник Дэвид Миллз расследуют серию загадочных убийств, совершенных в соответствии с семью смертными грехами. Каждый новый труп — это послание от изощренного убийцы, который возомнил себя орудием Божьего суда.",
13
+ "Каникулы": "Семейство Грисвольдов отправляется в долгожданное путешествие на автомобиле через всю страну, мечтая провести незабываемый отпуск. Однако, с самого начала всё идет не по плану, и их поездка превращается в череду комичных и порой опасных приключений.",
14
+ "Терминатор 2: Судный день": "Из постапокалиптического будущего прибывают два киборга: усовершенствованная модель Т-1000, способная принимать любую форму, и перепрограммированный Т-800. Цель первого — убить Джона Коннора, будущего лидера сопротивления, цель второго — защитить его любой ценой.",
15
+ "Интерстеллар": "Когда засуха и пылевые бури ставят человечество на грань вымирания, группа исследователей отправляется через червоточину в другую галактику, чтобы найти новую планету, пригодную для жизни.",
16
+ "Парк юрского периода": "Группа ученых прибывает на отдаленный остров, где эксцентричный миллиардер Джон Хэммонд создал парк развлечений с живыми динозаврами, клонированными из древней ДНК. Во время экскурсии система безопасности выходит из строя, и динозавры оказываются на свободе.",
17
+ "Одержимость": "Молодой и амбициозный барабанщик Эндрю Ниман мечтает стать великим джазовым музыкантом. Чтобы достичь своей цели, он поступает в престижную консерваторию, где сталкивается с безжалостным дирижером Теренсом Флетчером, который использует жестокие методы обучения.",
18
+ "Титаник": "В 1912 году роскошный лайнер «Титаник» отправляется в свое первое плавание чер��з Атлантический океан. На борту встречаются Джек Доусон, бедный художник, и Роза Дьюитт Бьюкейтер, аристократка, помолвленная с богатым, но жестоким Кэлом Хокли. Между ними вспыхивает страстная любовь, которой предстоит пройти испытание катастрофой."
19
+ }
20
+
21
+ # Кодируем описания фильмов
22
+ movie_embeddings = model.encode(list(movie_descriptions.values()), convert_to_tensor=True)
23
+
24
+ def search_movies(query, top_k=3):
25
+ """
26
+ Ищет наиболее похожие фильмы по запросу.
27
+
28
+ Args:
29
+ query: Текстовый запрос.
30
+ top_k: Количество возвращаемых результатов.
31
+
32
+ Returns:
33
+ Строку с результатами поиска в формате HTML.
34
+ """
35
+ query_embedding = model.encode(query, convert_to_tensor=True)
36
+ cosine_scores = util.cos_sim(query_embedding, movie_embeddings)
37
+
38
+ # Получаем индексы топ-k наиболее похожих фильмов
39
+ top_results = cosine_scores.argsort(descending=True)[0][:top_k]
40
+
41
+ results_html = ""
42
+ for i in top_results:
43
+ title = list(movie_descriptions.keys())[i]
44
+ description = list(movie_descriptions.values())[i]
45
+ score = cosine_scores[0][i].item()
46
+
47
+ results_html += f"<h3><b>{title}</b></h3>"
48
+ results_html += f"<p><b>Описание:</b> {description}</p>"
49
+ results_html += f"<p><b>Сходство:</b> {score:.4f}</p>"
50
+ results_html += "<hr>"
51
+
52
+ return results_html
53
+
54
+ # Создаем интерфейс Gradio
55
+ iface = gr.Interface(
56
+ fn=search_movies,
57
+ inputs=gr.Textbox(label="Введите запрос:"),
58
+ outputs=gr.HTML(label="Результаты поиска:"),
59
+ title="Поиск фильмов по описанию",
60
+ description="Введите запрос, и система найдет наиболее похожие фильмы по их описаниям.",
61
+ examples=[
62
+ ["Фильм про мальчика волшебника и борьбу со злом"],
63
+ ["Хочу посмотреть фильм про путешествие, чтобы уничтожить артефакт"],
64
+ ["Фантастика про поиск новой планеты"],
65
+ ],
66
+ )
67
+
68
+ # Запускаем приложение
69
+ iface.launch()