File size: 3,063 Bytes
1935fa5 bf78f70 7b8d2fd 1935fa5 a3a6f78 1935fa5 7ff405d bf78f70 7ff405d bf78f70 430c241 7ff405d 430c241 bf78f70 7ff405d 430c241 bf78f70 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 |
---
title: Landmark Recognition
emoji: 🗺️
colorFrom: purple
colorTo: green
sdk: streamlit
sdk_version: 1.29.0
app_file: src/main.py
pinned: false
---
# Распознавание достопримечательностей
## Веб-приложение
Данный веб-приложение на `Streamlit` предназначено для распознавания и вывода информации о достопримечательностях для улучшения опыта путешествий пользователей. По загруженным фотографиям приложение с помощью API `Википедии` определит названия достопримечательностей, выведет короткие описания и отобразит их на карте с помощью `Mapbox`.
![Alt text](images/demonstration.gif)
[Попробовать на HuggingFace](https://huggingface.co/spaces/molokhovdmitry/landmark_recognition)
*Функция суммаризации работает очень медленно из-за недостаточных ресурсов, предоставляемых `HuggingFace` при использовании бесплатного тарифа.*
## Модель распознавания
Для распознавания фотографий была дообучена модель `GoogLeNet`, натренированная на **IMAGENET1K_V1**.
Данная модель обучена на шести достопримечательностях:
- Мемориальная квартира Пушкина на Арбате
- Новый Арбат
- Памятник Александру Пушкину и Наталье Гончаровой
- Памятники Булату Окуджаве в Москве
- Художественный кинотеатр в Москве
- Центральный Дом актёра имени А. А. Яблочкиной
## Парсер фото
Для получения тестового набора данных, на котором проводилось обучение модели распознавания был разработан скрипт, создающий датасет из фотографий достопримечательностей в поисковике Bing с помощью `crawler`.
## Установка и запуск
```
git clone https://github.com/svlipatov/proj
cd proj
pip install -r requirements.txt
streamlit run main.py
```
## Команда
**Молохов Д.А.** - ML-инженер по суммаризации текста.
**Таратута Е.Е.** - ML-инженер по подготовке и обработке датасета.
**Липатов С.В.** - ML-инженер по обучению модели распознавания изображений.
**Мальцев А.Ю.** - API-разработчик.
**Надеждин М.А.** - Разработчик интерфейса.
|