File size: 3,063 Bytes
1935fa5
 
bf78f70
 
7b8d2fd
1935fa5
 
a3a6f78
1935fa5
 
7ff405d
bf78f70
 
7ff405d
 
bf78f70
 
 
 
 
430c241
 
7ff405d
430c241
 
 
 
 
 
 
 
bf78f70
7ff405d
430c241
bf78f70
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
---
title: Landmark Recognition
emoji: 🗺️
colorFrom: purple
colorTo: green
sdk: streamlit
sdk_version: 1.29.0
app_file: src/main.py
pinned: false
---

# Распознавание достопримечательностей

## Веб-приложение
Данный веб-приложение на `Streamlit` предназначено для распознавания и вывода информации о достопримечательностях для улучшения опыта путешествий пользователей. По загруженным фотографиям приложение с помощью API `Википедии` определит названия достопримечательностей, выведет короткие описания и отобразит их на карте с помощью `Mapbox`.

![Alt text](images/demonstration.gif)

[Попробовать на HuggingFace](https://huggingface.co/spaces/molokhovdmitry/landmark_recognition)

*Функция суммаризации работает очень медленно из-за недостаточных ресурсов, предоставляемых `HuggingFace` при использовании бесплатного тарифа.*

## Модель распознавания
Для распознавания фотографий была дообучена модель `GoogLeNet`, натренированная на **IMAGENET1K_V1**.
Данная модель обучена на шести достопримечательностях:
- Мемориальная квартира Пушкина на Арбате
- Новый Арбат
- Памятник Александру Пушкину и Наталье Гончаровой
- Памятники Булату Окуджаве в Москве
- Художественный кинотеатр в Москве
- Центральный Дом актёра имени А. А. Яблочкиной

## Парсер фото
Для получения тестового набора данных, на котором проводилось обучение модели распознавания был разработан скрипт, создающий датасет из фотографий достопримечательностей в поисковике Bing с помощью `crawler`.

## Установка и запуск

```
git clone https://github.com/svlipatov/proj
cd proj
pip install -r requirements.txt
streamlit run main.py
```

## Команда

**Молохов Д.А.** - ML-инженер по суммаризации текста.

**Таратута Е.Е.** - ML-инженер по подготовке и обработке датасета.

**Липатов С.В.** - ML-инженер по обучению модели распознавания изображений.

**Мальцев А.Ю.** - API-разработчик.

**Надеждин М.А.** - Разработчик интерфейса.